NVIDIA inicia produção total da plataforma Vera Rubin para fábricas de inteligência artificial global

Redação Correio Diário 01 de Junho de 2026 às 06:29

A NVIDIA iniciou a produção total da plataforma Vera Rubin NVL72, composta por processadores Vera e GPUs Rubin. O sistema oferece avanços em desempenho de inferência, treinamento e largura de banda de memória em relação à arquitetura Blackwell. As primeiras unidades serão entregues aos clientes no final deste ano

NVIDIA inicia produção total da plataforma Vera Rubin para fábricas de inteligência artificial global — wccftech.com

A NVIDIA entrou em fase de produção total da plataforma Vera Rubin NVL72, sistema projetado para equipar fábricas de inteligência artificial de escala global. O lançamento ocorre após o início da fabricação em larga escala dos processadores Vera, movimento que a empresa estima abrir um mercado de US 200 bilhões e consolidar sua posição como a maior fornecedora de processadores do ano.

A arquitetura Rubin é composta por seis chips que já passaram pela etapa de fabricação e encontram-se em fase de testes laboratoriais. O núcleo da operação nos centros de dados é o Superchip NVIDIA Vera Rubin, que integra dois GPUs Rubin, um CPU Vera e memória de alta capacidade nas configurações HBM4 e LPDDR5x, sendo implementado nos sistemas DGX, HGX e MGX.

O GPU Rubin, focado em cargas de trabalho intensivas de IA, utiliza dois dies de retículo com núcleos de computação e tensor. Em termos de desempenho, o componente entrega 50 FLOPs de inferência NVFP4 e 35 PFLOPs de treinamento NVFP4, superando a arquitetura Blackwell em 5 vezes e 3,5 vezes, respectivamente. A largura de banda de memória HBM4 chega a 22 TB/s por chip (2,8x superior ao Blackwell), enquanto a largura de banda do NVLink atinge 3,6 TB/s por CPU, dobrando a capacidade da geração anterior.

Complementando o sistema, o CPU Vera utiliza a arquitetura personalizada Olympus, equipando 88 núcleos e 176 threads via NVIDIA Spatial Multi-Threading. O processador conta com interconexão de memória coerente NVLink-C2C de 1,8 TB/s, 1,5 TB de memória de sistema — três vezes a capacidade do Grace — e largura de banda de 1,2 TB/s com SOCAMM LPDDR5X. O resultado é um ganho de 2x em desempenho de compressão, processamento de dados e CI/CD em relação ao modelo Grace.

A infraestrutura de rede é sustentada pelos switches NVLink 6, com SerDes de 400G, largura de banda total de 28,8 TB/s e computação FP8 de 14,4 TFLOPS na rede, operando com resfriamento líquido. A conectividade é reforçada pelo SuperNIC ConnectX-9, com largura de banda de 1,6 TB/s e SerDes PAM4 de 200G, e pelo BlueField-4, um DPU de 800G que integra um CPU Grace de 64 núcleos, expandindo a computação em 6 vezes e a memória em 3 vezes comparado ao BlueField-3.

Para a escala de rede, a NVIDIA introduziu a solução de óptica Ethernet Spectrum-X Co-Packaged, com switch de 102,4 Tb/s e fotônica de silício de 200G, elevando em 5 vezes a eficiência e o tempo de execução de aplicativos, além de ser 10 vezes mais confiável. No SuperPOD Rubin, a empresa integrou uma plataforma de armazenamento de contexto de inferência para operações de escala gigascale, compatível com os softwares Dynamo, NIXL e DOCA.

A implementação física ocorrerá através do rack NVIDIA Vera Rubin NVL72, que compõe o SuperPOD DGX de ponta em configurações de 8 racks, além da versão NVIDIA DGX Rubin NVL8 para centros de dados de nível médio.

Na prática, a transição para o ecossistema Rubin reduz em 10 vezes o custo de tokens de inferência e diminui em 4 vezes a quantidade de GPUs necessárias para o treinamento de modelos MoE quando comparada ao Blackwell GB200. Os primeiros chips serão entregues aos clientes ainda no final deste ano.

NVIDIA inicia produção total da plataforma Vera Rubin para fábricas de inteligência artificial global

Notícias Relacionadas

Dell lança novo laptop XPS 13 com foco em estudantes e usuários casuais

ASRock lança placa-mãe com processador Intel integrado e resfriamento passivo para ambientes de escritório

NVIDIA lança chipset RTX Spark para rodar jogos AAA em notebooks com Windows on ARM

MSI lança mini PC e laptop equipados com o novo chip NVIDIA RTX Spark

Apple intensifica testes de primeiro smartphone dobrável com previsão de lançamento para setembro de 2026