ShengShu Technology desenvolve modelo de inteligência artificial que unifica a percepção e a ação de robôs
A ShengShu Technology desenvolveu o Motubrain, um modelo de IA que integra percepção, raciocínio e ação para robôs. A tecnologia, financiada por US$ 293 milhões, permite a execução de sequências de até 10 ações e a correção autônoma de erros
A ShengShu Technology desenvolveu o Motubrain, um modelo de inteligência artificial projetado para atuar como um cérebro unificado para robôs. Diferente dos sistemas convencionais, que operam com módulos separados para visão, planejamento e movimento, a nova arquitetura integra percepção, raciocínio, previsão, geração e ação em uma estrutura única. Essa abordagem permite que a máquina observe o ambiente, compreenda instruções e execute ações sem a necessidade de alternar entre programas em cada etapa do processo.
O sistema aprende por meio de três fluxos de informação: vídeos, linguagem e ação. Enquanto os vídeos permitem a identificação de padrões e a linguagem possibilita a compreensão de comandos, os dados de ação orientam a movimentação física. Para otimizar esse aprendizado, o Motubrain utiliza gravações de diversas máquinas, dados de simulação e vídeos não rotulados, o que reduz a dependência de marcações manuais humanas e facilita o reconhecimento autônomo de comportamentos.
A base tecnológica do projeto aproveita a experiência da ShengShu Technology em vídeo generativo, via plataforma Vidu, auxiliando o robô a prever como objetos e espaços evoluem com o tempo. Na prática, isso se traduz em maior flexibilidade e capacidade de adaptação a cenários imprevisíveis, superando a limitação de robôs que funcionam apenas em tarefas repetitivas.
Em termos de desempenho, o modelo registrou 63,77 no WorldArena e média de 96,0 em 50 tarefas no RoboTwin 2.0, sendo o único a ultrapassar a marca de 95,0 em ambientes aleatórios. Um avanço significativo é a capacidade de executar sequências de até 10 ações atômicas — etapas simples como mover ou soltar um objeto —, enquanto a maioria dos sistemas atuais limita-se a duas ou três ações consecutivas. Além disso, o Motubrain demonstrou resiliência em testes práticos: ao falhar em uma tentativa de pegar um objeto, o sistema consegue reconhecer o erro e ajustar o movimento autonomamente, sem treinamento específico para aquela falha.
O desenvolvimento foi impulsionado por um aporte financeiro de US$ 293 milhões em uma rodada Série B liderada pela Alibaba Cloud, focando na expansão da IA incorporada em máquinas físicas. Atualmente, a tecnologia já é utilizada em programas de treinamento ativo por empresas de robótica como Anyverse Dynamics, SimpleAI e Astribot.
Segundo Jun Zhu, fundador da ShengShu Technology, o objetivo é que o modelo construa uma representação unificada do mundo real e preveja sua evolução. A aplicação prática dessa tecnologia visa tornar robôs mais úteis e menos dependentes de comandos rígidos em setores como a indústria, o comércio e ambientes domésticos, embora a adoção em larga escala ainda dependa de análises de custo, segurança e integração com maquinários existentes.