Google lança Gemini Omni para criar vídeos a partir de textos, imagens e áudios

Redação Correio Diário 20 de Maio de 2026 às 09:17

O Google lançou o Gemini Omni, modelo de IA que cria vídeos curtos e realistas a partir de textos, imagens e áudios. A ferramenta, disponível para assinantes pagos, produz clipes de até 10 segundos e permite edições multimodais. A versão inicial, Gemini Omni Flash, foca em resultados rápidos e otimização de testes

Google lança Gemini Omni para criar vídeos a partir de textos, imagens e áudios — Google

O Google lançou o Gemini Omni, um novo modelo de inteligência artificial voltado para a criação de vídeos a partir de múltiplos tipos de entrada, como textos, imagens, áudios ou clipes já existentes. A ferramenta substitui o Veo e integra-se ao Gemini e ao Flow, com o objetivo de converter instruções multimodais em sequências curtas, realistas e passíveis de edição.

O sistema se diferencia de outras tecnologias de vídeo por IA pela versatilidade na interpretação de dados. É possível combinar prompts de texto com imagens, adicionar trilhas sonoras ou enviar vídeos para solicitar alterações pontuais em cenas. Para garantir a coerência visual, a continuidade de personagens e a aplicação de físicas realistas, o modelo utiliza conhecimentos do mundo real, o que permite ajustar a estética, o ambiente, o ângulo da câmera ou as ações sem a necessidade de reiniciar a produção.

A primeira versão disponível é o Gemini Omni Flash, variante desenvolvida para entregar resultados rápidos e otimizar testes criativos. Entre as capacidades técnicas, a ferramenta produz clipes de até 10 segundos, gera áudio nativamente e converte fotografias em vídeos de no máximo 5 segundos, permitindo o encadeamento de interações para o refinamento do material.

O acesso ocorre por meio do menu de escrita do Gemini, onde a opção de criar vídeo abre uma interface com estilos, ideias predefinidas e campo para instruções personalizadas. Nesse espaço, o usuário pode incorporar arquivos de mídia para realizar transformações complexas, como substituir pessoas por criaturas, converter cenas em animações ou dar movimento a fotografias.

Atualmente, o Gemini Omni é exclusivo para assinantes pagos do Gemini. No entanto, a empresa estuda a disponibilização de uma versão gratuita via YouTube Create App e YouTube Shorts. Após o processamento, o conteúdo final pode ser visualizado, editado, compartilhado ou baixado.

Google lança Gemini Omni para criar vídeos a partir de textos, imagens e áudios

Notícias Relacionadas

Samsung lança primeiro monitor de jogos com resolução 6K do mundo na linha Odyssey G8

AMD lança processadores EPYC 8005 com núcleos Zen 5 para data centers e borda

Trump Mobile inicia entrega de smartphone que apresenta falhas graves de segurança de dados

Protótipos de substratos de núcleo de vidro com óptica integrada são apresentados na OFC 2026

Samsung planeja lançar o Galaxy S27 Pro com especificações do modelo Ultra em formato compacto