O poder de um: Principais razões para escolher o HP BladeSystem
Google tem trabalhado como poupar até 20 por cento da sua factura de electricidade de centro de dados, atingindo profundamente nas entranhas de sua infra-estrutura e brincando com os cérebros de silício febris de seus chips.
Em um artigo a ser apresentado na próxima semana no ISCA 2014 conferência arquitetura de computador intitulado "Para Energia da proporcionalidade em grande escala cargas de trabalho Latência-críticos", os pesquisadores do Google e da Universidade de Stanford discutir um sistema experimental chamado "PEGASUS" que podem salvar vastas somas Google de dinheiro, ajudando a reduzir o seu consumo de energia elétrica.
PEGASUS aborda um dos segredos mais mal guardados sobre computação em nuvem, o que é que os chips de computador nos centros de Google, Amazon e Microsoft de dados gigantescas estão de pé inativo por uma quantidade significativa de tempo.
Apesar de todas estas empresas desenvolveram tecnologias sofisticadas para tentar aumentar o uso de seus chips, todos eles ficam aquém de uma forma ou de outra.
Isto significa que uma quantidade substancial de eletricidade entrar em seus centros de dados é desperdiçado, uma vez que os poderes calcular chips que são ou inativo ou em estado de muito baixa utilização. Da perspectiva de um operador, é uma arca chupar ferida no orçamento, e da perspectiva de um ambientalista é uma farsa.
Agora Google e Stanford pesquisadores criaram um sistema que aumenta a eficiência do consumo de energia dos centros de dados, sem comprometer o desempenho.
PEGASUS ajusta o consumo de energia dos chips para caber a tarefa
PEGASUS faz isso através da marcação de cima e para baixo o consumo de energia dos processadores dentro de servidores do Google de acordo com os requisitos do pedido latência desejados - apelidado de iso-latência - de qualquer carga de trabalho. (Para silício-cabeças entre os nossos leitores, a tecnologia de gerenciamento de energia PEGASUS usa está funcionando Limite de potência média, ou RAPL, que permite ajustar o consumo de energia da CPU em incrementos de 0.125W. O sistema "varre o limite de potência RAPL em uma determinada carga de encontrar o ponto de potência mínima de cluster que satisfaz a meta [de nível de serviço objetivo]. ").
Dito de outra forma, a Pegasus garante que um processador está funcionando muito duro o suficiente para atender as demandas da aplicação em execução, mas não mais. "A linha de base pode ser comparado a dirigir um carro com paradas bruscas e arrancadas. Iso-latência seria, então, dirigir o carro em uma velocidade mais lenta para evitar acelerar duro e frenagem difícil", escrevem os pesquisadores. "A segunda maneira de operar um carro é muito mais eficiente do que o primeiro, que se assemelha aos resultados que observamos."
Existentes técnicas de gerenciamento de energia para grandes centros de dados defendem desligando servidores individuais ou mesmo núcleos individuais, mas os pesquisadores disseram que este era ineficiente. "Mesmo que o armazenamento da memória de reposição está disponível, dezenas de gigabytes de estado entrando e saindo de servidores é caro e demorado, o que torna difícil para reagir a mudanças rápidas ou pequenas em carga", explicam.
O que salvar grandes quantidades de dinheiro parece
Desligando núcleos de computadores individuais, entretanto, não funciona devido às necessidades específicas de pesquisa de tecnologia da Google. "A única consulta usuário para o front-end irá conduzir a transmissão da consulta a todos os nós folha. Como resultado, mesmo uma taxa de solicitação pequena pode criar uma quantidade não-trivial de trabalho em cada servidor. Por exemplo, considere um cluster dimensionados para lidar com uma carga de pico de 10.000 consultas por segundo (QPS) usando 1000 servidores ", explicam. "Mesmo com a carga de 10 por cento, cada um de nós mil estão vendo, em média, uma consulta por milissegundo. Simplesmente não há ociosidade suficiente para invocar alguns dos modos mais eficazes de baixa potência."
Então, Pegasus, que significa Energia Ganhos salvos automaticamente de Sistemas subutilizado, foi criado. O tech "é um controlador baseado em realimentação dinâmica que reforça a política de iso-latência." Ele belisca a energia para o chip de acordo com a tarefa a sua execução, certificando-se de não violar os acordos de nível de serviço em latência.
Durante os testes de produção do Google cargas de trabalho, os pesquisadores descobriram que PEGASUS salvos tanto quanto 30 por cento de energia em comparação com um sistema não-PEGASUS durante os períodos de baixa demanda, e 11 por cento de economia total de energia ao longo de um período de 24 horas. A equipe também avaliou-o em uma "escala total, o cluster de produção de pesquisa no Google", aka, a carga de trabalho de jóia da coroa da empresa. Aqui, PEGASUS fez um pouco menos bem, salvando entre 10 por cento e 20 por cento durante os períodos de baixa utilização. Isto é devido à forma como a política aplicada através dos milhares de servidores, sem levar em conta as variações entre os chips.
Uma possível solução para isto é a distribuir o controlador PEGASUS modo que vive em cada nó e aplica a política de latência a partir daí.
"A solução para o problema da folha quente é bastante simples: implementar um controlador distribuído em cada servidor que mantém a latência folha de um determinado objetivo latência", escrevem os pesquisadores.
No mundo real, como qualquer veterano grisalho de sistemas distribuídos posso te dizer, a implementação de qualquer tipo de esquema de controle distribuído é convidar um mundo de confusão e dor em seu centro de dados - mas o Google não é o mundo real, é um banhado a ouro organização que possa financiar os engenheiros necessários para manter um esquema assim distribuídos trabalho.
Se PEGASUS estavam a ser implementado de forma distribuída, os pesquisadores calculam que poderia poupar até 35 por cento do poder sobre a linha de base - uma enorme economia para o Google.
Como é típico com o Google, o jornal não dá detalhes sobre se PEGASUS foi implantado em toda a infra-estrutura do Google na produção, mas tendo em conta essa economia de energia e da quantidade substancial de trabalho Google tem investido no sistema, nós consideramos que é provável. Google não respondeu a perguntas.
"No geral, iso-latência fornece um passo significativo em direção ao objetivo da proporcionalidade energia para uma das classes desafiantes de grande escala, as cargas de trabalho de baixa latência", escrevem os pesquisadores.
A implantação de sistemas complexos como PEGASUS ao lado de outras tecnologias avançadas do Google, como OMEGA (gerenciamento de cluster), chave inglesa (DBMS distribuído), ou cPi2 (monitoramento de desempenho de nível de linha) permite que o Google para fazer seus centros de dados dramaticamente mais eficiente do que aqueles operados por menor , empresas menos sofisticadas. Estas tecnologias irão, com o tempo, ajudar o Google a competir na nuvem pública com rivais como a Amazon ea Microsoft, enquanto servia mais anúncios a um custo menor do que antes.
Rolê, PEGASUS, cavalgar. ®
Nenhum comentário:
Postar um comentário