Alibaba lança chip Zhenwu M890 e modelo Qwen3.7-Max para processamento de agentes de inteligência artificial
A Alibaba lançou o chip Zhenwu M890 e o modelo de linguagem Qwen3.7-Max para cargas de trabalho de IA do tipo agente. O processador oferece 0,6 PFLOPs de computação FP16 e 144 GB de memória HBM3, integrando-se ao servidor Supernode Alibaba Cloud Panjiu AL128. A T-Head entregou 560 mil unidades do chip para mais de 400 clientes em 20 setores industriais

A Alibaba expandiu sua infraestrutura de inteligência artificial com o lançamento do chip Zhenwu M890 e do modelo de linguagem Qwen3.7-Max, ambos voltados para a execução de cargas de trabalho de IA do tipo "agente". O novo processador utiliza a arquitetura de Unidade de Processamento Paralelo (PPU) da companhia e integra um motor de núcleo Transformer, focando especialmente em processos de inferência.
Em termos de desempenho, o Zhenwu M890 entrega 0,6 PFLOPs de computação FP16, marca equivalente ao A100 da NVIDIA e três vezes superior à solução Hopper H20. O componente representa um salto de três vezes na capacidade de computação quando comparado à geração anterior. A memória HBM3 foi elevada para 144 GB, superando os 96 GB do modelo 810E, enquanto a largura de banda de interconexão subiu para 800 GB/s, um acréscimo de 100 GB/s em relação ao antecessor. O chip é compatível com os formatos FP32, FP16, FP8 e FP4, equiparando-se tecnicamente às séries Rubin da NVIDIA e Ascent 950 da Huawei.
Para viabilizar a operação de múltiplos agentes simultâneos, a empresa introduziu o chip de interconexão ICN Switch 1.0, que atinge velocidades de 25,6 Tb/s com latência P2P inferior a 150 ns. Esse ecossistema é complementado pelo processador de host Yitian, baseado em Arm, e pelas placas de rede da série Panmai. Todos esses componentes são integrados no servidor Supernode Alibaba Cloud Panjiu AL128, que reúne 128 aceleradores de IA em uma única estrutura para proporcionar largura de banda em escala de PB/s.
A T-Head informou que já realizou a entrega de cerca de 560 mil chips Zhenwu para mais de 400 clientes distribuídos em 20 setores industriais. O cronograma de atualizações da Alibaba Cloud prevê a chegada do chip V900 no terceiro trimestre de 2024, com arquitetura renovada, 216 GB de memória, largura de banda de 1200 GB/s e desempenho três vezes maior. Posteriormente, no terceiro trimestre de 2028, está previsto o lançamento do Zhenwu J900, com novas melhorias arquitetônicas.
Paralelamente ao hardware, o modelo Qwen3.7-Max foi apresentado com foco em raciocínio complexo, codificação avançada e a execução de tarefas de longa duração, com disponibilidade programada para empresas e desenvolvedores.