O resfriamento líquido é a solução de resfriamento definitiva para servidores de IA?

Aug 20, 2024

Deixe um recado

 

I O resfriamento a ar tradicional está sobrecarregado; surge a tecnologia de resfriamento a líquido

 

Os três pilares da IA ​​são chips, poder de computação e algoritmos. Chips e poder de computação são os drivers de produtividade e, para atingir poder de computação extraordinário, as pessoas buscam continuamente processadores mais rápidos e hardware mais eficiente. À medida que o poder de computação da IA ​​aumenta e o desempenho de CPUs e GPUs melhora, o consumo de energia do chip e a geração de calor aumentam de acordo. Por exemplo, os chips GPU da série H200 da NVIDIA têm um TDP (Thermal Design Power) de até 700 W.

 

O resfriamento a ar tradicional tem seus limites. O princípio do resfriamento a ar é deixar o ar fluir sobre a superfície dos dissipadores de calor para dissipar o calor. Atualmente, os melhores resfriadores de ar do mercado podem suportar até 275 W de potência. O resfriamento a ar tradicional não pode mais atender aos requisitos de resfriamento dos servidores de IA convencionais.

 

A tecnologia de resfriamento líquido surgiu. O princípio do resfriamento líquido é circular um líquido refrigerante dentro do servidor, absorvendo calor dos componentes geradores de calor por meio de troca térmica. O resfriamento líquido oferece maior eficiência de resfriamento e permite controle preciso do líquido refrigerante para se adaptar a diferentes ambientes de trabalho, embora venha com custos mais altos.

 

O resfriamento líquido ganhou reconhecimento oficial. Em junho de 2023, as três principais operadoras de telecomunicações da China lançaram em conjunto o "White Paper on Liquid Cooling Technology for Telecom Operators (2023)", promovendo claramente duas rotas técnicas: resfriamento líquido de placa fria e resfriamento líquido de imersão monofásico. Eles também delinearam um plano de promoção para 2023-2025:

 

 A promotion plan for 2023-2025

▲ Um plano de promoção para 2023-2025

 

 

II O que é resfriamento líquido?

 

O resfriamento líquido é um método de resfriamento que usa líquido como refrigerante para transferir o calor gerado pelos componentes internos do equipamento de TI em data centers para o exterior, garantindo que as partes geradoras de calor do equipamento de TI operem dentro de uma faixa de temperatura segura. As principais soluções de resfriamento líquido são divididas principalmente em tipos de placa fria e imersão. O resfriamento líquido por imersão pode ser dividido em resfriamento por imersão com mudança de fase e sem mudança de fase, dependendo se o refrigerante passa por uma mudança de fase.

 

Liquid cooling technology

▲ Tecnologia de resfriamento líquido

 

O resfriamento líquido de placa fria funciona usando um dissipador de calor feito de metais como cobre ou alumínio, que têm boa condutividade térmica. O calor gerado pelos componentes é transferido para o líquido de arrefecimento dentro do dissipador de calor, que então leva o calor embora.

 

O resfriamento por imersão líquida é um método de resfriamento por contato direto onde o equipamento de TI, como servidores (incluindo CPUs, memória, E/S, etc.), é totalmente submerso no líquido de resfriamento. O resfriamento ocorre através da circulação do líquido. A tecnologia de resfriamento por imersão de mudança de fase, que está se desenvolvendo rapidamente, funciona resfriando os componentes geradores de calor, fazendo com que o refrigerante vaporize e, em seguida, condensando o vapor de volta à forma líquida para reutilização. Este método oferece maior eficiência de resfriamento e menor ruído.

 

 

III Todas as soluções de resfriamento de servidores devem ser substituídas por resfriamento líquido?

 

Obviamente não. Os métodos de resfriamento de data center incluem resfriamento forçado a ar e resfriamento líquido. Embora a tecnologia de resfriamento a ar seja relativamente madura, o resfriamento líquido é um requisito mais novo, impulsionado pelas crescentes necessidades de resfriamento dos data centers nos últimos anos.

 

Atualmente, os data centers têm principalmente três soluções de resfriamento:

1. Projetar novos data centers que dependem exclusivamente de resfriamento líquido, criando data centers menores e mais eficientes, com enorme poder de computação.

2. Projetar data centers que usem principalmente resfriamento a ar, mas incluam opções de resfriamento líquido para simplificar transições futuras.

3. Operadores de data center integrando resfriamento líquido em instalações existentes de resfriamento a ar, muitas vezes convertendo parcialmente sistemas de resfriamento a ar para resfriamento líquido.

 

Recommended Cooling Methods for Different Types of Data Centers

▲ Métodos de resfriamento recomendados para diferentes tipos de data centers

 

 

 

IV Quais são os desafios que o resfriamento líquido enfrenta?

 

1. Questões de custo

O custo dos sistemas de resfriamento líquido inclui altos custos de material (refrigerante, dissipadores de calor, tubulação, etc.), bem como a complexidade de projeto e fabricação, altos custos de instalação e manutenção e a necessidade de maiores investimentos para atingir alta confiabilidade.

 

2. Problemas de confiabilidade

 

Estabilidade:A estabilidade química do líquido de arrefecimento pode ser insuficiente, levando à degradação, oxidação ou produção de substâncias nocivas durante o uso, afetando o efeito de resfriamento e a estabilidade do sistema.

 

Vazamento:Em caso de vazamentos de líquidos, bloqueios de tubulações ou outros incidentes, os sistemas de resfriamento indireto de líquidos existentes podem não detectar falhas a tempo, comprometendo a segurança do servidor.

 

Compatibilidade:Alguns equipamentos de data center podem não ser adequados para sistemas de resfriamento líquido, exigindo adaptação e modificação adicionais.

 

 

V Quais são as indústrias upstream e downstream em resfriamento líquido?

 

O ecossistema da indústria de resfriamento líquido inclui fornecedores de componentes upstream, provedores de servidores resfriados a líquido midstream e usuários avançados de computação downstream, com foco em sistemas de resfriamento líquido por imersão e placa fria.

 

Cold Plate Liquid Cooling System Principle

▲ Princípio do sistema de resfriamento líquido de placa fria

 

 Immersion Liquid Cooling System Principle

▲ Princípio do sistema de resfriamento por imersão em líquido

 

 

1. A montante

 

Upstream of  Cold Plate Liquid Cooling System

▲ A montante do sistema de resfriamento líquido de placa fria
 

O Sistema de Resfriamento Líquido de Placa Fria é composto principalmente de CDU, fonte fria, refrigerante, tubulações de resfriamento líquido e gabinete de resfriamento líquido. O sistema de resfriamento líquido de imersão consiste principalmente de CDU, fonte fria, tubulações de resfriamento líquido, câmara de imersão, equipamento de TI e refrigerante.

 

Unidade de Distribuição de Refrigeração (CDU)

A CDU é usada para troca de calor entre o refrigerante de alta temperatura no lado secundário e a fonte fria no lado primário, fornecendo distribuição de resfriamento para equipamentos de TI resfriados a líquido e gerenciando monitoramento de temperatura, pressão e fluxo. Ela tem funções como troca de calor, condução de circulação, purificação de refrigerante e armazenamento de líquido. A CDU consiste principalmente de um trocador de calor/condensador, bomba de circulação, filtro, tanque de armazenamento de líquido e acessórios (válvulas, tubulações, conectores, sensores, etc.).

 

Fonte fria

A fonte externa de frio do sistema de resfriamento líquido pode ser selecionada com base nas condições de resfriadores secos, torres de resfriamento fechadas ou chillers.

 

Tubulações de resfriamento líquido

Pipelines são componentes necessários que conectam a placa fria de troca de calor, unidade de distribuição de resfriamento, unidade de troca de calor e fonte fria externa. Geralmente, os pipelines de circulação podem ser divididos em tipos de conexão direta (assíncrona) e conexão de loop (síncrona) com base em seus diferentes métodos de conexão.

 

Líquido de arrefecimento

Os refrigerantes comuns para sistemas de placas frias incluem água, etilenoglicol, propilenoglicol, etc. Esses refrigerantes têm alta capacidade térmica específica e baixa viscosidade, o que lhes permite absorver rapidamente o calor gerado pelo equipamento e transferi-lo ao trocador de calor para dissipação.

 

Os refrigerantes de imersão comuns (isolantes) incluem óleo mineral, compostos de fluorocarbono, etc. Entre eles, o resfriamento de mudança de fase pode usar apenas compostos de fluorocarbono não inflamáveis. A compatibilidade entre o meio refrigerante e os materiais de vários componentes é um dos principais fatores que afetam o desempenho do sistema de resfriamento líquido de mudança de fase por imersão.

 

Atualmente, há poucos tipos de líquidos fluorados disponíveis para resfriamento de mudança de fase por imersão, sendo o principal fornecedor a 3M. O resfriamento líquido por imersão da China ainda está em sua infância.

 

Câmara selada

A câmara é usada para conter o refrigerante de mudança de fase. A câmara deve ser selada na placa fria, tubulações, conectores e outras partes para garantir a segurança sem vazamentos, garantindo assim a integridade da transmissão de energia e sinal e a segurança do data center. Portanto, componentes de vedação personalizados são necessários, como juntas de borracha, conectores de saída de líquido, conectores de energia, conectores de sinal, etc.

 

Gabinete de resfriamento líquido

O gabinete de resfriamento líquido consiste principalmente de uma placa de resfriamento líquido, coletor, tubulações, conectores, conectores rápidos, distribuidor de líquido e compressor opcional.

 

A placa de resfriamento líquido atua como uma unidade de transferência de calor, equivalente ao evaporador em um sistema de refrigeração, e é uma tecnologia-chave projetada para o sistema de refrigeração. Geralmente consiste em uma placa de cobertura, aletas, placa de base e vedação.

O manifold é um dispositivo que conecta a unidade de distribuição de resfriamento à placa fria do servidor de resfriamento líquido. Normalmente embutido no gabinete, ele distribui uniformemente o fluxo de refrigerante para cada camada da placa fria e coleta o refrigerante após absorver calor, enviando-o por meio de tubos de conexão para a unidade de distribuição de resfriamento.

 

O conector rápido compreende um corpo principal e um terminal final. O corpo principal é a unidade primária para atingir as funções de conexão e vedação do conector rápido de líquido, enquanto o terminal final serve como porta de instalação para montar e fixar o conector rápido de líquido.

 

Sistema de controle

O sistema de controle monitora e regula a operação do sistema de resfriamento, incluindo sensores de temperatura e pressão, que medem a dissipação de calor e ajustam a velocidade da bomba ou a taxa de fluxo do líquido de arrefecimento.

 

Dispositivos de filtragem e purificação

Filtros são usados ​​para remover detritos e partículas do líquido de arrefecimento, garantindo o desempenho e a longevidade do sistema. Métodos como esterilização UV ou tratamento químico podem purificar o líquido de arrefecimento.

 

2. Meio do caminho

O midstream consiste principalmente em sistemas de resfriamento líquido, onde componentes-chave como radiadores, bombas, tubos e refrigerantes são integrados em um único sistema. Essas empresas exigem um certo nível de conhecimento técnico e capacidade de produção para garantir a qualidade e o desempenho do produto.

 

3. A jusante

Usuários downstream de poder de computação incluem data centers, supercomputadores, servidores de IA, dispositivos eletrônicos, veículos de nova energia, lasers, inversores e outros equipamentos industriais. A tecnologia de resfriamento líquido é usada até mesmo no campo aeroespacial. Devido às suas características de resfriamento de alta eficiência, data centers resfriados a líquido e sua infraestrutura são aplicados principalmente em campos de computação de alto desempenho. Atualmente, as indústrias que utilizam tecnologia de resfriamento líquido incluem internet, finanças, telecomunicações, energia, biologia e assistência médica.

 

Entre eles, a internet é o principal cliente de data centers resfriados a líquido, com demanda de dados significativa, uma ampla base de usuários e grandes volumes de negócios. Os requisitos de potência de computação para data centers são altos, com densidades de potência de gabinete único excedendo 10kW.

 

 

VI Em que estágio está a industrialização do resfriamento líquido?

 

Atualmente, várias validações de data centers resfriados a líquido foram concluídas em sua maioria, e os próximos três anos verão a expansão da tecnologia de resfriamento líquido em larga escala. Na frente técnica, o resfriamento de placa fria continua sendo a principal solução de resfriamento líquido no mercado; na frente do desenvolvimento industrial, o modelo de entrega full-stack, de infraestrutura a equipamentos de IA, tornou-se um consenso na indústria; na frente do cliente, os setores de internet e telecomunicações, os dois maiores clientes de aplicativos da indústria de data center, mostraram reconhecimento positivo da tecnologia de resfriamento líquido.

 

De acordo com o relatório semestral de 2023 divulgado por empresas relevantes do setor, seus data centers refrigerados a líquido acumularam mais de 260 MW de capacidade, envolvendo diversos setores, como tecnologia, energia, governo, finanças e internet.

 

 

VII Qual é o tamanho do mercado de resfriamento líquido de IA?

 

De acordo com dados da Caitong Securities, o tamanho do mercado de data centers resfriados a líquido da China crescerá de 6,999 bilhões de yuans em 2022 para mais de 35,877 bilhões de yuans em 2025, com o tamanho do mercado de resfriamento líquido de data center de IA aumentando de 5,552 bilhões de yuans em 2022 para 27,964 bilhões de yuans em 2025, representando uma taxa de crescimento anual composta de 76,2%. Com base na classificação do produto, os produtos de resfriamento líquido por imersão, com sua maior eficiência de resfriamento e a capacidade de reduzir efetivamente o PUE (Power Usage Effectiveness) dos data centers, devem capturar uma fatia maior do mercado, crescendo de 18% em 2019 (com produtos de resfriamento líquido de placa fria respondendo por 82%) para 41% em 2025.

 

À medida que o mercado demanda maior resfriamento e eficiência energética para infraestrutura de data center, a indústria prevê que a taxa de penetração de produtos de resfriamento líquido atingirá 20% até 2025, com a participação de mercado se expandindo continuamente. A primavera de aplicações em larga escala para servidores de IA resfriados a líquido está se aproximando silenciosamente!

 

 

VIII Quais são as empresas de refrigeração líquida mais conhecidas?

 

Os principais participantes do mercado internacional de resfriamento líquido por placa fria incluem IBM, CoolIT Systems, Asetek e Motivair, enquanto os principais participantes do mercado de resfriamento líquido por imersão são GRC, LiquidStack e Midas.

 

 

Enviar inquérito