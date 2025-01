Embora o sucesso do DeepSeek pareça ter acontecido quase da noite para o dia, o High-Flyer mostra como essa ascensão meteórica levou mais de uma década para acontecer.

Sob a liderança de Liang, o fundo passou anos estudando e experimentando modelos de IA no exterior, aplicando essa tecnologia aos seus negócios e investindo dezenas de milhões de dólares em chips Nvidia de ponta, para fornecer o poder de computação necessário para dar suporte a essa estratégia centrada em IA, de acordo com uma análise da Reuters dos sites da High-Flyer e das contas oficiais do WeChat.

CLUSTERS DE SUPERCOMPUTAÇÃO

A estratégia inclui a construção de dois clusters de supercomputação de IA, compostos inteiramente pelos poderosos chips A100 da Nvidia, cuja exportação para a China foi proibida por Washington em setembro de 2022.

Os clusters A100 da High-Flyer foram construídos e colocados em operação muito antes dos controles de exportação serem anunciados. O primeiro cluster, composto por 1.100 chips A100, custou 200 milhões de yuans e foi colocado em operação em 2020, enquanto o segundo, composto por cerca de 10.000 chips A100, foi concluído um ano depois com um custo de 1 bilhão de yuans, de acordo com o site da empresa e várias postagens no WeChat.

Em 2022, pesquisadores da High-Flyer AI apresentaram uma estratégia em uma conferência da Nvidia que a empresa desenvolveu para maximizar a eficiência do segundo cluster ao treinar modelos de IA.