Aumento da demanda desencadeia uma revolução no poder da computação; o resfriamento líquido impulsionará fortemente o crescimento da indústria!
Aug 24, 2024
Deixe um recado
Desde 2023, o modelo de chatbot de IA da OpenAI, ChatGPT, recebeu ampla aclamação. Ele usa grandes quantidades de dados de treinamento para simular o comportamento da linguagem humana, gerando texto por meio de análise semântica, permitindo que ele interaja com os usuários de forma natural e realista, muitas vezes indistinguível da interação humana.
Em muitas áreas, como criação de poesia e roteiro, ela até supera as capacidades humanas. No entanto, o desenvolvimento da inteligência artificial requer poder de computação extremamente poderoso, levando ao aumento do consumo de energia do servidor, maior densidade de energia por unidade em data centers e aumento do consumo de energia. A tecnologia tradicional de resfriamento a ar não pode mais atender às necessidades de resfriamento, tornando o resfriamento líquido uma necessidade que, sem dúvida, impulsionará o crescimento da indústria!

▲ Modelo de chatbot de IA da OpenAI, ChatGPT
Ⅰ O sucesso explosivo do ChatGPT: que tipo de poder de computação ele requer?
Dados, algoritmos e poder de computação são os três elementos principais da inteligência artificial, com o poder de computação sendo chamado de "motor" ou "motor" da IA. Tanto os dados quanto os algoritmos dependem do poder de computação. De acordo com estimativas da OpenAI, desde 2012, o poder de computação necessário para treinar os principais modelos de IA do mundo dobrou aproximadamente a cada 3-4 meses, com um aumento anual no poder de computação necessário para os principais modelos de treinamento chegando a dez vezes. Durante a fase de treinamento, o ChatGPT consumiu um total de cerca de 3640 PF-dias (o que significa rodar com eficiência de 1 PetaFLOP/s por 3640 dias). Isso destaca que um forte poder de computação é a chave para dar suporte à aplicação e popularização do conteúdo gerado por IA (AIGC) no futuro.
Tome o ChatGPT como exemplo: ele é suportado pelo modelo GPT-3.5, que passou por três iterações (GPT-1, GPT-2, GPT-3), com o número de parâmetros aumentando de 117 milhões para 175 bilhões, e a quantidade de dados de pré-treinamento aumentando de 5 GB para 45 TB (equivalente a 160 vezes a versão inteira em inglês da Wikipedia). Essa quantidade enorme de dados e computação requer maior poder de computação para dar suporte à sua operação. De acordo com dados da Similarweb, em janeiro de 2023, o ChatGPT tinha cerca de 13 milhões de usuários ativos diários, cada um fazendo perguntas com média de 1.000 palavras.
Isso gerou um total de aproximadamente 13 bilhões de palavras (17,33 bilhões de tokens). Supondo que as tarefas sejam distribuídas uniformemente ao longo de 24 horas, o número de GPUs A100 necessárias seria 17,33 bilhões * 2 * 300 bilhões / (20% * 24 horas * 3600 segundos)=601.75 PetaFLOP/S. Dado que existem picos de tráfego, supondo que o tráfego de pico seja cinco vezes a média diária, um total de 602 servidores DGX A100 seriam necessários para atender à demanda de tráfego atual, tornando os requisitos de poder de computação extremamente rigorosos.
Isso ilustra que para treinar modelos de IA ainda melhores e realmente aplicar modelos de IA em vários setores, é necessário poder de computação mais eficiente e recursos de computação mais abundantes. O poder de computação se tornou um fator crítico que limita a industrialização da IA, e está fadado a desencadear uma nova revolução de poder de computação! Com o rápido aumento na demanda de poder de computação de IA, o poder de CPUs/GPUs relacionadas está acelerando, necessitando de soluções de resfriamento mais fortes e eficazes para manter o equipamento funcionando sem problemas.
Ⅱ Aplicações extensivas de poder de computação
Na era da economia digital, o poder de computação não é apenas um fator-chave de produtividade, mas também está definido para se tornar um fator universalmente aplicado. À medida que a construção da infraestrutura de poder de computação avança, novos modelos e formas de negócios de aplicações de poder de computação estão surgindo rapidamente, integrando profundamente o poder de computação em mais indústrias, como manufatura, transporte, educação, aeroespacial, finanças e mídia. Ao mesmo tempo, o agendamento, gerenciamento e negociação de poder de computação estão se tornando pontos focais de exploração da indústria. O poder de computação está evoluindo de um "recurso" para um "fator", tornando-se uma parte essencial da produção e da vida das pessoas.
O desenvolvimento de várias indústrias desencadeou uma explosão na demanda por poder de computação. Para maximizar o desempenho do processador, é necessária uma maior eficiência de resfriamento, e a tecnologia tradicional de resfriamento a ar não consegue mais atender às crescentes demandas por poder de computação. Os servidores de resfriamento líquido, com suas vantagens, estão prontos para ganhar uma fatia significativa do mercado e impulsionar fortemente o desenvolvimento da indústria!
Ⅲ Aumento significativo na demanda por resfriamento líquido
Em 2022, os processadores de servidor de quarta geração da Intel viram o consumo de energia de uma única CPU ultrapassar 350 watts, e o consumo de energia de um único chip de GPU da NVIDIA ultrapassou 700 watts. A densidade de energia de computação dos clusters de IA geralmente atingiu 50 kW por gabinete, e a tecnologia tradicional de resfriamento a ar não consegue mais lidar! Maior eficiência de resfriamento é necessária para maximizar o desempenho do processador.
Enquanto isso, de uma perspectiva política, o início do projeto "Eastern Data, Western Computing" da China e as metas de carbono duplo fizeram com que a indústria prestasse mais atenção à conservação de energia, redução de emissões e desenvolvimento de alta qualidade. Requisitos técnicos mais rigorosos foram definidos para a Eficácia do Uso de Energia (PUE) de data centers, com a PUE média de data centers grandes e supergrandes recém-construídos em todo o país a ser reduzida para menos de 1,3, e ainda mais reduzida para menos de 1,25 em nós de hub nacionais.
O resfriamento líquido atende às necessidades de custo-efetividade do mercado e orientação política em muitos aspectos, incluindo eficiência econômica e desempenho de resfriamento, tornando-o altamente valioso e economicamente benéfico. De acordo com a CCID Consulting, o mercado de IDC resfriado a líquido da China deve exceder 120 bilhões de yuans até 2025, com uma taxa de crescimento de mais de 30% e uma taxa de penetração atualmente em torno de 20%. A demanda por resfriamento líquido está aumentando significativamente, e as perspectivas de mercado são promissoras.
Ⅳ A cadeia da indústria de servidores de refrigeração líquida
1. O Panorama da Indústria de Refrigeração Líquida
O setor de servidores de resfriamento líquido abrange muito mais do que apenas servidores de resfriamento líquido; toda a cadeia do setor é longa, com amplos subcampos e muitos participantes, o que o torna um setor de capital intensivo.A tecnologia de resfriamento líquido está atualmente em um estágio de rápido desenvolvimento e, se os participantes relevantes tiverem vantagens em financiamento ou aquisição de clientes, eles podem criar certas barreiras de entrada.
Empresas em vários subcampos estão gradualmente se infiltrando em campos relacionados com base em suas principais vantagens, construindo seus próprios ecossistemas. De acordo com a divisão de infraestrutura para aplicações, a indústria de data center resfriado a líquido pode ser dividida em três subcampos principais: infraestrutura de resfriamento líquido, indústria intermediária e aplicações industriais.
O Setor de Infraestrutura de Resfriamento Líquido fornece os equipamentos e instalações essenciais para a construção de data centers resfriados a líquido. Ele é dividido em subcampos como gabinetes de resfriamento líquido, refrigerante, sistemas de resfriamento, sistemas de energia, sistemas de rede e sistemas de gerenciamento de infraestrutura de data center. Esses subcampos fornecem principalmente equipamentos, sistemas de software e refrigerantes para operação de servidores. Além disso, o setor de infraestrutura inclui empreiteiros de construção, operadores de rede e fornecedores de energia. Os empreiteiros de construção são responsáveis pela construção e instalação dos equipamentos e instalações acima mencionados, os operadores de rede fornecem acesso básico à rede e os fornecedores de energia fornecem a eletricidade necessária para a operação do equipamento. Essas áreas fornecem um ambiente periférico relativamente básico para data centers.
A indústria midstream inclui fabricantes de servidores, provedores de hospedagem de data center e alguns novos participantes. Os fabricantes de servidores pesquisam, projetam e produzem servidores adequados para ambientes de resfriamento líquido ou produzem diretamente servidores resfriados a líquido de placa fria. Os provedores de hospedagem de data center constroem e operam data centers, alavancando suas próprias vantagens para integrar recursos do setor de infraestrutura e oferecer serviços de hospedagem de servidores para usuários de aplicativos. À medida que os data centers se desenvolvem rapidamente, novas empresas estão entrando no campo de data center resfriado a líquido.
Os usuários de aplicativos de data center são divididos principalmente em três subcampos: computação em nuvem e poder de computação em nuvem, internet e blockchain e outros usuários. Eles são os principais usuários de data centers. Os provedores de computação em nuvem e poder de computação em nuvem geram receita oferecendo aos clientes alocação e agendamento de poder de computação flexíveis por meio da virtualização. Algumas das principais empresas de internet e blockchain geralmente constroem data centers diretamente em colaboração com operadores de data center, enquanto outros usuários geralmente hospedam ou alugam diretamente recursos de servidor ou poder de computação de operadores de data center.
2. Visão geral da indústria de resfriamento líquido
Comparado ao resfriamento a ar, a tecnologia de resfriamento líquido oferece vantagens de alta estabilidade e alta eficiência de resfriamento. De uma perspectiva de aplicação abrangente, o resfriamento líquido gradualmente revela suas vantagens econômicas quando as densidades de potência excedem 15kW por gabinete. De acordo com oAplicação UPSjornal, a temperatura do núcleo da CPU de servidores refrigerados a líquido pode ser 20-30 grau menor que a temperatura máxima em sistemas refrigerados a ar, melhorando significativamente a confiabilidade.
White paper da Intel,Práticas de inovação em data centers verdes - Referência de projeto de sistema de resfriamento líquido de placa fria, indica que data centers resfriados a ar podem tipicamente gerenciar o resfriamento para gabinetes com níveis de potência de até 12kW. Para gabinetes que excedem 15kW, os data centers resfriados a ar existentes atingiram o teto de suas capacidades de resfriamento por convecção de ar. A tecnologia de resfriamento líquido, que fornece capacidades de resfriamento mais fortes, pode suportar densidades de potência mais altas.
Em comparação com soluções de resfriamento a ar, a tendência para resfriamento líquido impulsionada pela AIGC e as iniciativas "Eastern Data, Western Computing" levará inevitavelmente a um aumento tanto no volume quanto no preço do mercado de controle de temperatura do data center. A indústria de servidores resfriados a líquido segue três rotas tecnológicas: placa fria, imersão e resfriamento por spray.O resfriamento líquido por placa fria envolve um método de resfriamento em que o líquido de arrefecimento não entra em contato direto com os componentes geradores de calor do servidor.

▲ Resfriamento de placa fria

▲ Sistema de resfriamento de líquido por spray

▲ Resfriamento por imersão em líquido monofásico

▲ Resfriamento bifásico
Em vez disso, os principais componentes geradores de calor são fixados a uma placa fria, com o refrigerante circulando dentro do sistema de resfriamento líquido interno da placa fria para remover o calor. Para melhorar as capacidades de troca de calor, a área de troca de calor deve ser maximizada, exigindo que a placa fria seja fixada o mais próximo possível da superfície dos componentes geradores de calor do servidor. Componentes geradores de calor de formato irregular são difíceis de resfriar usando este método. Apenas chips de formato relativamente regular são adequados para resfriamento de placa fria.
Isso apresenta um problema significativo para soluções de resfriamento líquido de placa fria: aproximadamente 30% do calor do servidor, gerado por outros componentes como armazenamento, memória e fontes de alimentação, ainda requer resfriamento a ar tradicional. Isso resulta na necessidade de dois sistemas de resfriamento serem usados simultaneamente em soluções de resfriamento líquido de placa fria, aumentando os custos e o PUE real do sistema. A solução de placa fria atual é relativamente madura, com uma base comercial sólida, e já viu inúmeras aplicações comerciais.

▲ Soluções de resfriamento líquido de placa fria
O Immersion Liquid Cooling se refere à imersão completa do equipamento do servidor em refrigerante, onde o resfriamento é obtido por meio do contato direto entre o refrigerante e os componentes geradores de calor. Neste método, os componentes geradores de calor do servidor são totalmente submersos no refrigerante, permitindo contato suficiente com o refrigerante, que carrega continuamente o calor gerado, resfriando assim o servidor. O resfriamento por imersão oferece maior eficiência de resfriamento, com o potencial de aumentar a densidade de potência por gabinete em mais de três vezes. Espera-se que ele seja responsável por mais de 40% do mercado até 2025, com servidores resfriados a líquido de imersão total provavelmente se tornando uma tendência tecnológica futura.

▲ Resfriamento líquido por imersão
Spray Cooling Liquid Cooling System é uma tecnologia de resfriamento líquido de contato direto projetada para pulverizar precisamente o líquido de arrefecimento nos componentes geradores de calor dos servidores. O líquido de arrefecimento é aplicado diretamente aos dispositivos geradores de calor ou materiais condutores térmicos sólidos conectados a eles, seja por gravidade ou pressão do sistema. Este processo permite a troca de calor para resfriar o servidor. Durante a troca de calor, o nível do líquido de arrefecimento dentro do servidor é mantido abaixo dos componentes geradores de calor ou dos materiais condutores térmicos sólidos conectados a eles. O sistema usa unidades externas de troca de calor para resfriar e reciclar o líquido de arrefecimento.
3. Cenário do mercado de refrigeração líquida
Como uma tecnologia avançada, o resfriamento líquido abrange diversas disciplinas e campos, com altas barreiras técnicas.
Atualmente, a adoção da tecnologia de resfriamento líquido entre fabricantes nacionais e internacionais de infraestrutura de data center continua relativamente baixa, com poucas empresas dominando essa tecnologia.
No entanto, várias empresas, tanto nacionais quanto internacionais, começaram a oferecer soluções personalizadas de resfriamento líquido para seus clientes, e algumas empresas de tecnologia estão gradualmente construindo e implantando seus próprios data centers resfriados a líquido. Apesar disso, a taxa de adoção da tecnologia de resfriamento líquido entre os fabricantes de infraestrutura de data center continua baixa, e o mercado ainda não viu o surgimento de líderes dominantes, deixando o cenário competitivo ainda incerto.
No mercado chinês, algumas empresas, por meio de anos de acumulação tecnológica e experiência, demonstraram vantagens técnicas e de mercado significativas, e espera-se que, no futuro, empresas líderes dominem o mercado, formando um cenário competitivo em que os principais participantes detenham uma participação de mercado significativa.
4. Resfriamento líquido em nível de chip
Reduzir a distância entre o equipamento de resfriamento líquido e as principais fontes de calor, como chips, é uma tendência importante. No futuro, espera-se que o resfriamento evolua do nível da sala, do nível do gabinete e do nível do servidor para o nível do chip, alcançando melhor resfriamento do chip por meio do contato direto entre os componentes de resfriamento e a superfície do chip. Os resfriadores líquidos dissipam o calor movendo grandes quantidades de calor para longe por meio do atrito entre o fluxo de líquido e a superfície interna do radiador. Comparado aos sistemas convencionais de resfriamento a ar, o resfriamento líquido pode melhorar significativamente a eficiência do resfriamento. Atualmente, a tecnologia de resfriamento líquido é dividida principalmente em tipos indiretos e diretos.
De acordo com as últimasRastreamento do mercado semestral de servidores de resfriamento líquido da China (segundo semestre de 2022)relatório publicado pela International Data Corporation (IDC), o mercado chinês de servidores de resfriamento líquido atingiu US$ 1,01 bilhão em 2022, representando um crescimento anual de 189,9%. A IDC prevê que de 2022 a 2027, a taxa de crescimento anual composta do mercado de servidores de resfriamento líquido da China atingirá 56,6%, com o tamanho do mercado esperado para atingir US$ 9,5 bilhões até 2027, indicando um futuro brilhante para a indústria de resfriamento líquido!

▲ Previsão para o mercado de servidores refrigerados a líquido na China de 2023 a 2027
