Tecnologia

NVIDIA altera design e reduz memória do Rubin Ultra para solucionar problemas de produção

10 de Maio de 2026 às 21:10

A NVIDIA alterou o design das plataformas Rubin e Rubin Ultra para corrigir falhas de rendimento, dissipação térmica e memória HBM4. O modelo Rubin Ultra teve a capacidade de memória reduzida para 768 GB e a estrutura de quatro dies substituída por dois. A produção em massa deve iniciar em setembro, com lançamento previsto entre 2027 e 2028

NVIDIA altera design e reduz memória do Rubin Ultra para solucionar problemas de produção
wccftech.com

A NVIDIA enfrenta ajustes críticos de design e especificações nas futuras plataformas Rubin e Rubin Ultra, mudanças que podem abrir espaço para a concorrência, especialmente a AMD MI500, na disputa pela liderança em IA em 2027. A nova geração, que promete saltos de eficiência e desempenho superiores à arquitetura Blackwell, lida agora com cinco gargalos principais: limitações de velocidade e capacidade da memória HBM4, problemas de rendimento e distorção, resistência em designs de múltiplos níveis de energia e a necessidade de redesenhar o sistema de dissipação de calor.

No modelo Rubin, a memória HBM4 de 288 GB, com largura de banda de até 22 TB/s, depende de stacks de 12 Hi da Micron. Contudo, a qualidade inferior da base die de fornecedores como Micron e SK Hynix dificulta a obtenção de memórias de alta velocidade, o que pode forçar alterações no projeto ou adiar o ciclo produtivo.

O impacto é ainda mais visível no Rubin Ultra. O plano original de utilizar 1 TB de memória HBM4E com stacks de 16 Hi foi reduzido para 12 Hi devido a problemas de rendimento na produção em volume. Com 16 sites de HBM4E (8 por chiplet de GPU), a capacidade final cairá para 768 GB — uma redução de 25% em relação ao projeto inicial, embora ainda represente um aumento de 2,66 vezes sobre a versão Rubin padrão.

Paralelamente, a NVIDIA alterou a estrutura física do Rubin Ultra, substituindo a solução de quatro dies por GPU por uma de apenas dois. Essa decisão visa mitigar problemas graves de distorção e rendimento comuns em pacotes multi-chip (MCP) de alta densidade, utilizando a tecnologia de embalagem CoWoS-L da TSMC. Para compensar a perda de capacidade computacional individual e manter o desempenho anunciado, a empresa adotou uma montagem em nível de placa na configuração 2+2, integrando quatro GPUs Rubin Ultra em cada servidor Kyber.

A infraestrutura térmica também sofreu modificações. O sistema de dissipador de calor duplo foi descartado por não atender aos requisitos de distorção na fase de produção em massa, sendo substituído por uma configuração de dissipador único. Além disso, as GPUs Rubin migrarão do material de interface térmica (TIM) de índio-grafite para o grafite tradicional, visando estabilizar as plataformas de 1800 W e 2300 W.

O cronograma atual prevê amostras de qualificação do Rubin Ultra em julho, amostras de produção em agosto e início da fabricação em massa em setembro, com racks disponíveis em outubro.

Essa reestruturação ocorre enquanto a AMD prepara o lançamento do MI500 para o segundo semestre de 2027. O chip da concorrente deve apresentar um layout de quatro dies com pacotes de memória HBM4E de 12 Hi, contrastando com a redução para dois dies do Rubin Ultra, cujo lançamento é esperado entre 2027 e 2028. Ambas as empresas apostam fortemente em fotônica de silício (óptica co-package) para impulsionar a próxima era da computação.

Notícias Relacionadas