Tecnologia

Google lança Gemini Omni para criar vídeos a partir de textos, imagens e áudios

20 de Maio de 2026 às 09:17

O Google lançou o Gemini Omni, modelo de IA que cria vídeos curtos e realistas a partir de textos, imagens e áudios. A ferramenta, disponível para assinantes pagos, produz clipes de até 10 segundos e permite edições multimodais. A versão inicial, Gemini Omni Flash, foca em resultados rápidos e otimização de testes

Google lança Gemini Omni para criar vídeos a partir de textos, imagens e áudios
Google

O Google lançou o Gemini Omni, um novo modelo de inteligência artificial voltado para a criação de vídeos a partir de múltiplos tipos de entrada, como textos, imagens, áudios ou clipes já existentes. A ferramenta substitui o Veo e integra-se ao Gemini e ao Flow, com o objetivo de converter instruções multimodais em sequências curtas, realistas e passíveis de edição.

O sistema se diferencia de outras tecnologias de vídeo por IA pela versatilidade na interpretação de dados. É possível combinar prompts de texto com imagens, adicionar trilhas sonoras ou enviar vídeos para solicitar alterações pontuais em cenas. Para garantir a coerência visual, a continuidade de personagens e a aplicação de físicas realistas, o modelo utiliza conhecimentos do mundo real, o que permite ajustar a estética, o ambiente, o ângulo da câmera ou as ações sem a necessidade de reiniciar a produção.

A primeira versão disponível é o Gemini Omni Flash, variante desenvolvida para entregar resultados rápidos e otimizar testes criativos. Entre as capacidades técnicas, a ferramenta produz clipes de até 10 segundos, gera áudio nativamente e converte fotografias em vídeos de no máximo 5 segundos, permitindo o encadeamento de interações para o refinamento do material.

O acesso ocorre por meio do menu de escrita do Gemini, onde a opção de criar vídeo abre uma interface com estilos, ideias predefinidas e campo para instruções personalizadas. Nesse espaço, o usuário pode incorporar arquivos de mídia para realizar transformações complexas, como substituir pessoas por criaturas, converter cenas em animações ou dar movimento a fotografias.

Atualmente, o Gemini Omni é exclusivo para assinantes pagos do Gemini. No entanto, a empresa estuda a disponibilização de uma versão gratuita via YouTube Create App e YouTube Shorts. Após o processamento, o conteúdo final pode ser visualizado, editado, compartilhado ou baixado.

Notícias Relacionadas