NVIDIA inicia produção total da plataforma Vera Rubin para fábricas de inteligência artificial global
A NVIDIA iniciou a produção total da plataforma Vera Rubin NVL72, composta por processadores Vera e GPUs Rubin. O sistema oferece avanços em desempenho de inferência, treinamento e largura de banda de memória em relação à arquitetura Blackwell. As primeiras unidades serão entregues aos clientes no final deste ano

A NVIDIA entrou em fase de produção total da plataforma Vera Rubin NVL72, sistema projetado para equipar fábricas de inteligência artificial de escala global. O lançamento ocorre após o início da fabricação em larga escala dos processadores Vera, movimento que a empresa estima abrir um mercado de US 200 bilhões e consolidar sua posição como a maior fornecedora de processadores do ano.
A arquitetura Rubin é composta por seis chips que já passaram pela etapa de fabricação e encontram-se em fase de testes laboratoriais. O núcleo da operação nos centros de dados é o Superchip NVIDIA Vera Rubin, que integra dois GPUs Rubin, um CPU Vera e memória de alta capacidade nas configurações HBM4 e LPDDR5x, sendo implementado nos sistemas DGX, HGX e MGX.
O GPU Rubin, focado em cargas de trabalho intensivas de IA, utiliza dois dies de retículo com núcleos de computação e tensor. Em termos de desempenho, o componente entrega 50 FLOPs de inferência NVFP4 e 35 PFLOPs de treinamento NVFP4, superando a arquitetura Blackwell em 5 vezes e 3,5 vezes, respectivamente. A largura de banda de memória HBM4 chega a 22 TB/s por chip (2,8x superior ao Blackwell), enquanto a largura de banda do NVLink atinge 3,6 TB/s por CPU, dobrando a capacidade da geração anterior.
Complementando o sistema, o CPU Vera utiliza a arquitetura personalizada Olympus, equipando 88 núcleos e 176 threads via NVIDIA Spatial Multi-Threading. O processador conta com interconexão de memória coerente NVLink-C2C de 1,8 TB/s, 1,5 TB de memória de sistema — três vezes a capacidade do Grace — e largura de banda de 1,2 TB/s com SOCAMM LPDDR5X. O resultado é um ganho de 2x em desempenho de compressão, processamento de dados e CI/CD em relação ao modelo Grace.
A infraestrutura de rede é sustentada pelos switches NVLink 6, com SerDes de 400G, largura de banda total de 28,8 TB/s e computação FP8 de 14,4 TFLOPS na rede, operando com resfriamento líquido. A conectividade é reforçada pelo SuperNIC ConnectX-9, com largura de banda de 1,6 TB/s e SerDes PAM4 de 200G, e pelo BlueField-4, um DPU de 800G que integra um CPU Grace de 64 núcleos, expandindo a computação em 6 vezes e a memória em 3 vezes comparado ao BlueField-3.
Para a escala de rede, a NVIDIA introduziu a solução de óptica Ethernet Spectrum-X Co-Packaged, com switch de 102,4 Tb/s e fotônica de silício de 200G, elevando em 5 vezes a eficiência e o tempo de execução de aplicativos, além de ser 10 vezes mais confiável. No SuperPOD Rubin, a empresa integrou uma plataforma de armazenamento de contexto de inferência para operações de escala gigascale, compatível com os softwares Dynamo, NIXL e DOCA.
A implementação física ocorrerá através do rack NVIDIA Vera Rubin NVL72, que compõe o SuperPOD DGX de ponta em configurações de 8 racks, além da versão NVIDIA DGX Rubin NVL8 para centros de dados de nível médio.
Na prática, a transição para o ecossistema Rubin reduz em 10 vezes o custo de tokens de inferência e diminui em 4 vezes a quantidade de GPUs necessárias para o treinamento de modelos MoE quando comparada ao Blackwell GB200. Os primeiros chips serão entregues aos clientes ainda no final deste ano.