Apple substitui o motor CoreML pelo novo framework CoreAI para otimizar a inteligência artificial
A Apple substituiu o CoreML pelo framework CoreAI para otimizar a inteligência artificial em dispositivos. Testes com o modelo Qwen3 no Mac M4 e iPhone 17 Pro mostraram superioridade do novo motor sobre o MLX, com eficácia variável conforme a escala do modelo. O LiteRT-LM, do Google, registrou a maior velocidade e menor consumo de RAM no iPhone 17 Pro

A Apple substituiu o CoreML, motor utilizado desde 2017 para tarefas estáticas e classificações de imagens, pelo novo framework CoreAI. Desenvolvido para otimizar a inferência em dispositivos e a inteligência artificial na borda, o sistema agora oferece suporte a grandes modelos e independe de formatos específicos.
Testes de desempenho realizados em hardware recente revelam que a eficácia do CoreAI varia conforme a escala do modelo utilizado. No Mac M4, o novo motor superou o MLX — ferramenta voltada para pesquisa e treinamento vinculada à GPU Metal — em 2,47 vezes na decodificação do modelo Qwen3 de 0,6 bilhão de parâmetros. No iPhone 17 Pro, a vantagem do CoreAI para o mesmo modelo foi de 1,6 vezes. Contudo, essa diferença diminui em modelos de maior porte; no Mac M4 Max, utilizando o Qwen3 de 8 bilhões de parâmetros, o CoreAI foi apenas 1,05 vezes mais rápido que o MLX, resultando em um desempenho praticamente equivalente.
A análise de hardware no iPhone 17 Pro mostrou que a GPU sofre reduções rápidas de desempenho em cargas de trabalho contínuas. Nesse cenário, a integração entre CoreML e Neural Engine torna-se a opção com menor consumo de memória, embora apresente a menor velocidade de decodificação.
A comparação com soluções de terceiros indica que motores específicos superam frameworks genéricos. O LiteRT-LM, do Google, operando com o modelo Gemma, registrou a maior velocidade no iPhone 17 Pro, atingindo 55,4 tokens por segundo. Além disso, a solução do Google consumiu 641 MB de RAM, volume 4,5 vezes inferior aos 2.900 MB exigidos pelo MLX da Apple.
Em termos de sustentabilidade energética, os modelos de base da Apple demonstraram maior eficiência por token, superando em duas vezes as execuções via GPU e em quatro vezes a combinação CoreML/ANE.