NVIDIA anuncia compatibilidade total de seu hardware com o modelo DiffusionGemma da Google DeepMind
A NVIDIA anunciou a compatibilidade de seu hardware com o modelo DiffusionGemma, da Google DeepMind. O suporte abrange GPUs GeForce RTX, RTX PRO e sistemas DGX, utilizando a arquitetura tensor core e o software CUDA. O desempenho atinge 1.000 tokens por segundo em GPUs H100 e 150 tokens por segundo em sistemas DGX Spark

A NVIDIA anunciou a compatibilidade total de seu ecossistema de hardware com o DiffusionGemma, modelo de código aberto da Google DeepMind focado na geração rápida de texto. O suporte abrange desde a linha de GPUs GeForce RTX e plataformas RTX PRO até os sistemas DGX, incluindo mini PCs Spark e estações de trabalho de nível de datacenter.
A implementação utiliza a arquitetura de tensor core e o stack de software CUDA, o que dispensa configurações adicionais para o funcionamento do modelo. As otimizações de hardware da NVIDIA elevam a velocidade de processamento do DiffusionGemma, superando a performance nativa da ferramenta.
Em termos de desempenho, a empresa registrou que as GPUs Tensor Core H100 em sistemas DGX Station atingem 1.000 tokens por segundo em uma única unidade, enquanto os sistemas DGX Spark alcançam 150 tokens por segundo. Essa infraestrutura de inferência local entrega um desempenho aproximadamente quatro vezes superior ao de modelos autorregressivos equivalentes.
O framework completo para a execução do modelo já está disponível, permitindo o uso imediato em sistemas DGX Spark ou na RTX 5090.