Qualcomm e AWS firmam parceria para desenvolver processadores de inteligência artificial com foco em inferência
Qualcomm e Amazon Web Services desenvolvem os processadores AI200 para inferência de inteligência artificial, com lançamento previsto para 2026. O hardware suporta até 768 GB de memória por unidade e visa reduzir custos operacionais da nuvem

A Qualcomm e a Amazon Web Services (AWS) estreitam a cooperação no desenvolvimento de processadores de inteligência artificial, com foco na redução de custos de inferência e na ampliação das margens de lucro da operação de nuvem. A estratégia da AWS visa a utilização de silício interno para otimizar a margem operacional e diminuir a necessidade de capital, combatendo os altos custos de aceleradores de IA que limitam o acesso de diversas classes de clientes à receita de inferência.
O centro dessa parceria envolve os processadores AI200, projetados para aplicações de inferência e com lançamento previsto para 2026. O hardware se diferencia pela capacidade de suportar modelos de linguagem extensos, permitindo até 768 GB de memória por unidade. De acordo com projeções do Wells Fargo, a implementação desses processadores pode ter um custo de US$ 3,5 bilhões por gigawatt, o que teria o potencial de elevar o lucro por ação da companhia em US$ 2,50, condicionada à capacidade da Qualcomm de ampliar a quantidade de aceleradores por rack.
A AWS já opera com os processadores AI100 Ultra, que apresentam um desempenho competitivo de custo por hora por FLOPS em relação aos concorrentes. Essa base consolida a Amazon como um potencial parceiro de ASIC de larga escala, movimento corroborado por declarações do CEO da Qualcomm, Cristiano Amon, sobre a atuação com grandes empresas de nuvem.
A movimentação ocorre em um cenário onde a indústria de IA migra para a inferência e a precificação baseada em tokens torna-se central, com empresas de infraestrutura, como a Nebius, cobrando clientes por milhões de tokens. Esse contexto impulsionou a popularidade de alternativas como os processadores da Groq, apoiados pela NVIDIA, e motiva a Qualcomm a posicionar seus chips para atender à demanda crescente por computação de agentes na infraestrutura de IA.