Google lança Gemini Omni para criar vídeos a partir de textos, imagens e áudios
O Google lançou o Gemini Omni, modelo de IA que cria vídeos curtos e realistas a partir de textos, imagens e áudios. A ferramenta, disponível para assinantes pagos, produz clipes de até 10 segundos e permite edições multimodais. A versão inicial, Gemini Omni Flash, foca em resultados rápidos e otimização de testes
:format(jpg)/f.elconfidencial.com%2Foriginal%2Fba2%2Fcb9%2F636%2Fba2cb96361c8967e2193e3ff9d835b30.jpg)
O Google lançou o Gemini Omni, um novo modelo de inteligência artificial voltado para a criação de vídeos a partir de múltiplos tipos de entrada, como textos, imagens, áudios ou clipes já existentes. A ferramenta substitui o Veo e integra-se ao Gemini e ao Flow, com o objetivo de converter instruções multimodais em sequências curtas, realistas e passíveis de edição.
O sistema se diferencia de outras tecnologias de vídeo por IA pela versatilidade na interpretação de dados. É possível combinar prompts de texto com imagens, adicionar trilhas sonoras ou enviar vídeos para solicitar alterações pontuais em cenas. Para garantir a coerência visual, a continuidade de personagens e a aplicação de físicas realistas, o modelo utiliza conhecimentos do mundo real, o que permite ajustar a estética, o ambiente, o ângulo da câmera ou as ações sem a necessidade de reiniciar a produção.
A primeira versão disponível é o Gemini Omni Flash, variante desenvolvida para entregar resultados rápidos e otimizar testes criativos. Entre as capacidades técnicas, a ferramenta produz clipes de até 10 segundos, gera áudio nativamente e converte fotografias em vídeos de no máximo 5 segundos, permitindo o encadeamento de interações para o refinamento do material.
O acesso ocorre por meio do menu de escrita do Gemini, onde a opção de criar vídeo abre uma interface com estilos, ideias predefinidas e campo para instruções personalizadas. Nesse espaço, o usuário pode incorporar arquivos de mídia para realizar transformações complexas, como substituir pessoas por criaturas, converter cenas em animações ou dar movimento a fotografias.
Atualmente, o Gemini Omni é exclusivo para assinantes pagos do Gemini. No entanto, a empresa estuda a disponibilização de uma versão gratuita via YouTube Create App e YouTube Shorts. Após o processamento, o conteúdo final pode ser visualizado, editado, compartilhado ou baixado.