Economia

Engenheiros de IA priorizam custos e eficiência de energia em vez de desempenho máximo de chips

20 de Maio de 2026 às 15:30

A transição do mercado de IA para modelos de inferência prioriza métricas de custo e eficiência energética, elevando a busca por ASICs e aceleradores alternativos. Engenheiros de IA consideram as margens da NVIDIA excessivas e avaliam opções com menor custo de implementação. Dados do Morgan Stanley indicam que centros de dados com chips personalizados custam metade de projetos com GPUs Blackwell

Engenheiros de IA priorizam custos e eficiência de energia em vez de desempenho máximo de chips
wccftech.com

A transição do mercado de inteligência artificial de um regime focado em treinamento para um modelo orientado pela inferência está elevando a importância de métricas como o custo por token, o retorno sobre o investimento (ROI) e o custo total de propriedade (TCO). Esse cenário impulsiona o interesse de hiperescaladores por ASICs e aceleradores alternativos, já que a demanda por inferência representa até 95% das cargas de trabalho empresariais.

Nesse contexto, engenheiros de IA têm priorizado critérios como energia, resfriamento, utilização e custo por token em detrimento do throughput máximo ou da largura de banda. A preferência por soluções como as GPUs da Groq ocorre, inclusive, devido ao maior throughput oferecido.

Embora a NVIDIA defenda a eficiência de desempenho de seus chips para justificar os preços, a Evercore ISI indica que as alegações de ganhos de 35 vezes não convencem a maioria dos engenheiros, que consideram as margens brutas de 70% da companhia excessivas. Para melhorar a economia operacional, esses profissionais demonstram disposição em adotar ASICs ou alternativas tecnicamente suficientes.

A disparidade de custos é evidenciada por dados da Morgan Stanley, que apontam que a construção de um centro de dados com GPUs Blackwell da NVIDIA custa o dobro de um projeto baseado em chips de IA personalizados. Em contrapartida, a eficiência de desempenho das GPUs Blackwell chega a ser oito vezes superior. No entanto, a escolha do hardware final por parte dos engenheiros de IA não se limita à performance, integrando fatores como o custo de resfriamento dos componentes.

Notícias Relacionadas