Resfriamento líquido: o próximo módulo óptico na era da IA

Oct 04, 2024

Deixe um recado

I. O resfriamento líquido mudou de “opcional” para “essencial”

 

1. O aumento na demanda por potência de computação e módulos ópticos

No cenário em rápida evolução da inteligência artificial (IA), a procura por poder computacional atingiu níveis sem precedentes. O surgimento de grandes modelos, como os usados ​​no ChatGPT da OpenAI, criou uma lacuna significativa no poder computacional necessário. A OpenAI relata que a taxa de crescimento do poder de computação do modelo supera os avanços no hardware de IA em dez vezes. À medida que os grandes modelos se expandem para triliões de parâmetros, a necessidade de melhorar o desempenho dos chips de treino de IA tornou-se crítica, aumentando as expectativas para uma transmissão de dados mais rápida.

 

Este crescimento exponencial na escala computacional tornou a interconectividade dentro dos data centers uma questão central. À medida que o treinamento em IA avança, as limitações da computação de cartão/servidor único tornam-se evidentes. A interconectividade chip a chip surgiu como uma prioridade, necessitando de módulos ópticos eficientes e de alta velocidade para facilitar a rápida troca de dados. Consequentemente, a implantação de módulos ópticos de alta velocidade é essencial para aumentar a eficiência da interconectividade, especialmente à medida que os centros de dados actualizam as suas arquitecturas de poder computacional.

 

Optical modules facilitating high-speed data transmission in data centers

▲ Módulos ópticos que facilitam a transmissão de dados em alta velocidade em data centers

2. O ponto de viragem para o resfriamento líquido

O resfriamento líquido está prestes a se tornar o próximo elemento crítico na infraestrutura de IA, paralelamente à evolução dos módulos ópticos. À medida que os produtos eletrónicos continuam a avançar, a necessidade de sistemas de refrigeração eficientes torna-se inegável. Assim como a trajetória dos módulos ópticos passou de luxo para necessidade, a tecnologia de refrigeração líquida está seguindo o exemplo.

 

Historicamente, as soluções de refrigeração evoluíram de métodos passivos, como refrigeração por ar natural e dissipadores de calor, para tecnologias mais avançadas, incluindo ar condicionado e, finalmente, refrigeração líquida. Esta transição reflete uma tendência mais ampla no setor eletrónico, onde a gestão térmica é fundamental para garantir o desempenho ideal e a longevidade dos componentes.

 

3. Por que o resfriamento líquido agora é essencial

Batatas fritas

O impacto da temperatura ambiente nos chips semicondutores é crítico. As temperaturas elevadas podem degradar significativamente o desempenho e a vida útil dos componentes eletrônicos. Ambientes térmicos elevados levam à expansão térmica em materiais como capacitores e resistores, o que pode causar falhas mecânicas e dificultar a operação normal. De acordo com relatórios da ANJIE, o resfriamento a ar tradicional só consegue gerenciar a dissipação de calor de até 800W, limite que está sendo ultrapassado por vários produtos NVIDIA.

 

Centros de dados

Os data centers refrigerados a ar normalmente suportam uma densidade de 8-10 kW por gabinete. No entanto, como se prevê que a capacidade de computação em cluster de IA atinja 20-50 kW por gabinete até 2025, as limitações do resfriamento do ar tornam-se claramente evidentes. A crescente densidade de potência exige métodos de resfriamento mais eficientes, posicionando o resfriamento líquido como uma alternativa superior.

 

An AI data center designed for high-density computing, utilizing advanced liquid cooling systems

▲ Data center de IA de alta densidade que emprega tecnologias de refrigeração líquida

 

 

II. Políticas de refrigeração líquida injetam um “estimulante” no mercado

 

PUE (Power Usage Effectiveness) serve como uma métrica chave para avaliar a eficiência energética dos data centers. Um PUE mais baixo indica um data center mais ecológico e eficiente, pois reflete a proporção entre a energia total consumida por uma instalação e a consumida exclusivamente pelas cargas de TI. Em data centers típicos, os equipamentos de TI são responsáveis ​​por aproximadamente 50% do consumo de energia, enquanto os sistemas de refrigeração contribuem com cerca de 35%.

 

As tecnologias de refrigeração líquida tendem a apresentar valores de PUE significativamente mais baixos em comparação com a refrigeração a ar tradicional. Por exemplo, enquanto o arrefecimento a ar tradicional mantém um PUE de cerca de 1,3, os métodos de arrefecimento a líquido podem reduzi-lo para entre 1,05 e 1,2, dependendo da tecnologia específica utilizada.

 

Graph comparing PUE values of air cooling and various liquid cooling technologies in data centers

▲ Comparação PUE entre tecnologias de refrigeração a ar e refrigeração líquida

 

 

III. Crescimento estratégico da Vertiv por meio da refrigeração líquida

 

A Vertiv fez avanços significativos no aprimoramento de suas capacidades de refrigeração líquida com a aquisição da CoolTera. Esta empresa sediada no Reino Unido é especializada em infraestrutura de refrigeração líquida e colabora com a Vertiv há vários anos em vários projetos de data centers e supercomputação. Espera-se que esta aquisição reforce a posição da Vertiv no mercado de gestão térmica, permitindo-lhe oferecer soluções mais robustas, adaptadas às crescentes necessidades dos data centers.

 

 

4. A cadeia de valor central da refrigeração líquida

1. Compreendendo o resfriamento líquido

O resfriamento líquido refere-se a métodos usados ​​para manter temperaturas operacionais ideais para sistemas de computador. Ao aproveitar a elevada capacidade de calor específico dos líquidos, esta tecnologia transfere eficazmente o calor gerado pelos componentes internos para o ambiente externo. Os sistemas de refrigeração líquida podem ser categorizados em técnicas de refrigeração direta e indireta. O resfriamento indireto, como sistemas de placas frias, garante que o líquido de resfriamento não entre em contato direto com os componentes aquecidos, enquanto os métodos de resfriamento direto incluem o resfriamento por imersão, onde o meio de resfriamento interage diretamente com os componentes aquecidos.

 

2. Ecossistema da indústria de refrigeração líquida: sistemas de placas frias

A indústria de refrigeração líquida compreende vários componentes e sistemas, incluindo:

  • Unidades RCM (Fornecimento e Retorno de Refrigerante):Estas unidades gerenciam a distribuição e coleta de refrigerante dentro de gabinetes de refrigeração líquida.
  • Unidades de distribuição de resfriamento (CDUs):As CDUs facilitam a separação dos refrigerantes que entram nos componentes da placa fria da água de resfriamento no lado da fonte fria.
  • LCMs (Módulos de Circulação Líquida):Esses módulos gerenciam o transporte e o retorno de refrigerantes em todo o sistema de refrigeração.

 

Os refrigerantes utilizados podem variar, com opções que incluem água deionizada e soluções à base de glicol, que contribuem para uma transferência de calor eficaz.

 

 Diagram depicting the various components of a liquid cooling ecosystem in data centers

▲ Visão geral do ecossistema de refrigeração líquida em data centers

 

 

V. Identificação de empresas beneficiárias na cadeia de fornecimento de refrigeração líquida

1. Empresas Beneficiárias: Componentes Internos do Servidor

A cadeia de fornecimento de refrigeração líquida pode ser dividida em três categorias principais: componentes internos do servidor, construção de refrigeração líquida e fornecedores de infraestrutura de refrigeração líquida. Os componentes internos incluem sistemas de placa fria e desconexões rápidas, que são vitais para melhorar o desempenho de chips de IA de alta potência. Empresas como Huawei e NVIDIA são atores-chave neste setor.

 

2. Construção de resfriamento líquido

A construção de refrigeração líquida abrange fornecedores de soluções de cadeia completa e fabricantes de servidores. Fornecedores de cadeia completa, como a Vertiv, oferecem soluções abrangentes, mas podem não fornecer servidores diretamente, necessitando da colaboração com fabricantes de chips.

 

3. Construção IDC

Os fabricantes de IDC são responsáveis ​​pela construção de data centers e pelo desenvolvimento de soluções de refrigeração líquida adaptadas às necessidades do cliente. Esses fabricantes integrarão cada vez mais tecnologias de refrigeração líquida em seus projetos para otimizar o desempenho.

 

4. Provedores de infraestrutura

Os provedores de infraestrutura oferecem componentes específicos de refrigeração líquida, como CDUs e LCMs. À medida que a procura por estas tecnologias aumenta, prevê-se que tanto o volume como os preços destes produtos aumentem, reflectindo a importância crescente da refrigeração líquida na concepção de centros de dados.

 

 

Conclusão

 

A mudança do arrefecimento a ar para o arrefecimento a líquido nas infraestruturas de IA não é apenas uma tendência, mas uma evolução essencial impulsionada pelas crescentes exigências informáticas. Com a proliferação de modelos grandes e a necessidade de uma gestão térmica eficiente, as tecnologias de refrigeração líquida deverão desempenhar um papel fundamental no futuro dos data centers. À medida que empresas como a Vertiv melhoram as suas capacidades através de aquisições e parcerias estratégicas, o mercado de refrigeração líquida está preparado para um crescimento significativo. Esta transição contribuirá, em última análise, para ambientes de computação mais eficientes, sustentáveis ​​e de alto desempenho.

 

 

 

 

Enviar inquérito