O Gemini Omni é um modelo de geração de vídeo do Google que vazou e foi descoberto na interface do Gemini antes do Google I/O 2026 (19 e 20 de maio). Há indícios de que ele poderá ser o primeiro modelo omni de ponta com saída de vídeo nativa, potencialmente substituindo o Veo 3.1 e unificando a geração de imagens, vídeos e texto em um único sistema Gemini.
Qual é o modelo de vídeo Gemini Omni que vazou antes do Google I/O 2026?
Em 2 de maio de 2026, um usuário do X chamado @Thomas16937378 Descobri uma string de interface do usuário na aba de geração de vídeos do Gemini, do Google, que dizia: Comece com uma ideia ou experimente um modelo. Desenvolvido por Omni. O TestingCatalog, um rastreador confiável de vazamentos de IA do Google, rapidamente detectou a descoberta e publicou um relatório que se espalhou pela comunidade de IA em poucas horas.
O Modelo de vídeo Gemini Omni A referência apareceu bem ao lado de 'Toucan' — o codinome interno para o atual processo de geração de vídeo do Google, baseado no Veo-3.1, dentro do Gemini. Duas semanas antes Google I/O 2026 Com estreia marcada para 19 e 20 de maio, essa data não pode ser considerada mera especulação.
Venho acompanhando a estratégia de vídeo generativo do Google desde o lançamento original do Veo, e esta é a primeira vez que um nome de produto totalmente novo e público surge na aba de vídeos. As atualizações anteriores — Veo 2, Veo 3, Veo 3.1 — mantiveram a marca Veo. 'Omni' sinaliza algo estruturalmente diferente.
'Se o Google planeja lançar o Gemini Omni para geração de vídeo, é provável que ele tenha um desempenho superior ao Veo 3.1.' — Catálogo de Testes
O que foi de fato detectado na interface do usuário do Gemini?
Toda a evidência consiste em uma única captura de tela — mas os detalhes importam. Dois fatores elevam isso a um patamar superior ao de uma mera referência aleatória a um código:
- A string é visível para os usuários.Não está enterrado no código-fonte nem escondido atrás de flags de recursos. O texto da interface do usuário que inclui o nome da marca geralmente só chega a esse estado quando a equipe está se preparando para um lançamento público.
- O local fica ao lado de 'Toucan'., codinome interno conhecido do Google para a atual ferramenta de geração de vídeo com suporte da Veo. O novo código, armazenado ao lado de um caminho de produção existente, é o padrão de preparação padrão antes de uma substituição.
Um perfil recém-criado na aba de vídeos do Gemini exibiu a linha "Powered by Omni", sugerindo que o recurso está em fase final de testes. Não se trata de uma versão para desenvolvedores nem de uma análise do APK — a mensagem apareceu na interface ao vivo.
Três possíveis interpretações: O que 'Omni' realmente poderia ser
Não temos detalhes da arquitetura, números de referência ou uma declaração oficial. Mas o vazamento permite três interpretações, cada uma progressivamente mais transformadora.
1. Um novo wrapper Veo
A explicação menos disruptiva: Omni é simplesmente o novo nome do produto para o tablet de vídeo da Gemini, com Veo 3.x ou Veo 4 Ainda está realizando o trabalho de geração propriamente dito nos bastidores. A consolidação da marca sob um único nome nativo do Gemini — semelhante à forma como a Nano Banana utiliza o Gemini 3/3.1 Flash Image para imagens estáticas — explicaria o aparecimento de uma string pública.
2. Um novo modelo de vídeo treinado pela Gemini
O Google pode ter desenvolvido um modelo de vídeo interno completamente novo sob a égide do Gemini para funcionar em conjunto com o Veo ou substituí-lo. A divisão atual — Veo para vídeo, Nano Banana/Gemini para imagens — é arquiteturalmente inadequada. O Omni pode ser o resultado da unificação desses fluxos de trabalho, com sua própria arquitetura e perfil de desempenho distintos do Veo 3.1.
3. Um verdadeiro modelo omnidirecional: um único sistema para imagem, vídeo e muito mais.
A leitura mais ambiciosa, e aquela que nome Isso praticamente exige: um único modelo omnidirecional Gemini que lide com a geração de imagens, geração de vídeo e possivelmente áudio no mesmo sistema — da mesma forma que o GPT-4o está posicionado para texto-imagem-áudio, mas com saída de vídeo nativa.
Se a opção 3 estiver correta, o Gemini Omni seria o primeiro modelo omnidirecional de ponta com saída de vídeo de um grande fornecedor de IA. Essa é uma estreia significativa. Os modelos de vídeo mais modernos atualmente — Veo 3.1, Seedance 2.0, Kling 3.0 — são todos geradores de vídeo especializados. Eles não lidam nativamente com a criação de imagens ou o raciocínio textual.
A string vazada não permite distinguir entre essas três possibilidades. Mas apenas a opção 3 justifica um nome público totalmente novo como 'Omni', em vez de simplesmente aumentar o número da versão do Veo.
O Google Gemini irá gerar vídeos nativamente?
Sim — a Gemini já gera vídeos por meio de sua integração com o Veo 3.1. A questão levantada pela Omni é se o Google está migrando de uma plataforma para outra. estratégia de modelo dividido (Veo para vídeo, modelos Nano Banana para imagens, Gemini para texto) para um modelo unificado que abrange todas as modalidades em um único sistema.
Atualmente, o fluxo de geração de vídeo do Gemini é rotulado como "Powered by Veo 3.1", enquanto a geração de imagens está vinculada ao Nano Banana 2 e ao Nano Banana Pro. O Google descreve o Nano Banana Pro como baseado no Gemini 3 e o Nano Banana 2 como Gemini 3.1 Flash Image. Só essa nomenclatura já demonstra o quão fragmentada é a abordagem atual.
Um modelo Omni unificado poderia oferecer vantagens concretas:
- Qualidade consistente em todas as modalidades — um único modelo treinado com texto, imagens e vídeo manteria a consistência estilística ao gerar uma imagem de storyboard e, em seguida, animá-la em vídeo.
- Fluxos de trabalho criativos mais simples — sem alternância entre modelos de imagem e vídeo. Um único comando poderia gerar uma sequência coesa de imagem e vídeo.
- Melhor compreensão imediata — um modelo que compreenda conceitos visuais e temporais poderia produzir vídeos mais precisos a partir de descrições textuais complexas.
- Potenciais eficiências de custos — Manter um único modelo grande em vez de vários modelos especializados poderia reduzir os custos de infraestrutura na escala do Google.
Gemini Omni versus o cenário da geração de vídeo com IA em 2026
A geração de vídeo é a categoria mais competitiva em IA generativa atualmente. Se a Omni for lançada no Google I/O 2026, entrará em um mercado concorrido e em rápida evolução. Veja como os principais players se posicionam em maio de 2026:
| Modelo | Empresa | Principais pontos fortes | Situação (maio de 2026) |
|---|---|---|---|
| Veo 3.1 | Trabalho de câmera cinematográfico, sincronização audiovisual | Ao vivo em Gêmeos, com disponibilidade limitada por região. | |
| Seedance 2.0 | ByteDance | Topo dos benchmarks públicos, variantes Fast/Turbo, usabilidade comercial 90%+ | Disponível ao público |
| HappyHorse-1.0 | Alibaba | Obteve o #1 no Artificial Analysis Video Arena (ELO 1411) | Disponível ao público |
| Wan 2.7 | Alibaba | Texto/imagem/vídeo/edição + movimento sincronizado com áudio em 1080p | Disponível ao público |
| Kling V3.0 | Kuaishou | Variantes Std/Pro/O3, receita mensal de $20M+ | Disponível ao público |
| Sora 2 | OpenAI | Variante Pro para resolução mais alta | Somente API (aplicativo para o consumidor será desativado em 29 de abril de 2026) |
| Vídeo Grok | xAI | Integração estreita entre X e Twitter, distribuição com foco em redes sociais. | Capacidades em expansão |
| Hailuo | MiniMax | Forte consistência de caráter, movimento suave | Competindo no mercado chinês |
Seedance 2.0 da ByteDance Atualmente, ocupa o topo da maioria dos benchmarks públicos, com as variantes Fast e Turbo tornando a produção de vídeos com IA para cinema viável financeiramente para grandes volumes de produção. O HappyHorse-1.0 da Alibaba ultrapassou brevemente o Seedance no ranking do Artificial Analysis Video Arena, com uma pontuação ELO de 1411.
O que diferenciaria a Omni de todas as outras é a parte "omni". Cada modelo listado acima é um gerador de vídeo especializado. Nenhuma delas também lida com criação de imagens ou raciocínio textual. Se o Gemini Omni realmente unificar essas capacidades, ele ocupará uma categoria própria.
Onde será realizado o Google I/O 2026 e quando acontecerá?
O Google I/O 2026 acontece nos dias 19 e 20 de maio de 2026. O evento é a conferência anual de desenvolvedores do Google, tradicionalmente realizada no Shoreline Amphitheatre em Mountain View, Califórnia. Novidades sobre o Gemini e outras atualizações de IA estão confirmadas na programação da palestra principal.
O momento do vazamento do Omni — surgindo exatamente duas semanas antes do evento — segue um padrão bem estabelecido. O ciclo de vazamentos pré-Google I/O normalmente envolve strings da interface do usuário e análises de APKs aparecendo de 2 a 4 semanas antes da apresentação principal, dando à comunidade tempo para especular antes da revelação oficial.
Dito isso, strings da interface do usuário já foram divulgadas sem o lançamento de produtos anteriormente. A interpretação mais plausível desse vazamento é: O Google tem um produto de vídeo chamado Omni em fase final de testes na plataforma Gemini, e a janela mais provável para o lançamento é entre 19 e 20 de maio.
O Google vai lançar um novo modelo de IA Gemini 3?
Vazamentos adicionais relatados por Pankaj Kumar sugerem que o Google está testando novas versões do Gemini — especificamente Gêmeos 3.2 e Gêmeos 3.5 — focados em desempenho mais rápido. Estes são distintos do vazamento do Omni, mas fazem parte da mesma onda de testes pré-E/S.
Outras funcionalidades identificadas durante os testes incluem:
- Recurso de memória 'Teamfood' — Contexto de bate-papo de longo prazo que persiste entre as sessões
- 'Spark Robin' — um codinome de modelo visual que apareceu junto com Omni em referências de teste
- Gemini 3.1 Flash-Lite — já lançado e disponível ao público em geral desde 8 de maio de 2026
A estratégia do Google para 2026 parece ser uma abordagem de duas vertentes: atualizações incrementais da versão Gemini (3.1 → 3.2 → 3.5) para o modelo de linguagem principal e um possível salto arquitetônico com o Omni para geração multimodal.
O Google Veo 3 é gratuito?
O Veo 3.1 — a versão atual — está disponível através da Gemini, mas foi restrito e com acesso limitado por regiãoO Gemini oferece acesso gratuito à geração básica de vídeos, mas saídas de alta resolução e tempos de geração prolongados exigem uma assinatura do Gemini Advanced.
Se o Omni substituir o Veo 3.1, o modelo de preços poderá mudar. Historicamente, o Google oferece novos recursos de IA em uma estrutura freemium: acesso básico gratuito e recursos premium mediante assinatura. Esperamos uma abordagem semelhante para o Omni, caso seja lançado no Google I/O.
Plataformas de terceiros, como a WaveSpeed AI, já hospedam o Veo 3.1 e planejam adicionar qualquer novo modelo de vídeo Gemini logo após o lançamento público, com preços por segundo que podem ser mais econômicos para cargas de trabalho de produção.
A controvérsia do Gemini Nano: uma nota de cautela sobre implantações silenciosas de IA
Embora o vazamento de informações do Omni gere entusiasmo, as práticas de implementação de IA do Google também têm atraído críticas em 2026. Uma história à parte, mas relacionada: O Google Chrome tem baixado silenciosamente um modelo de IA de 4 GB chamado Gemini Nano para os dispositivos dos usuários sem pedir permissão.
O arquivo, chamado weights.bin, fica localizado no diretório do perfil do usuário do Chrome e é responsável por recursos no dispositivo, como "Ajude-me a escrever" e detecção de fraudes. Os usuários não encontram nenhuma opção para desativá-lo. Quando os usuários excluem o arquivo, o Chrome baixa novamente todo o pacote de 4 GB automaticamente.
Na escala global do Chrome, o custo ambiental de implementar 4 GB em centenas de milhões de dispositivos é estimado entre 6.000 e 60.000 toneladas de emissões equivalentes de CO2. Em muitas partes do mundo, os planos de dados móveis consideram 4 GB como a franquia mensal completa.
A Diretiva ePrivacy proíbe o armazenamento de informações no dispositivo de um usuário sem consentimento prévio. O Chrome funciona perfeitamente bem sem um LLM (Local Load Mechanism) no dispositivo, portanto, nenhuma isenção de "estritamente necessário" se aplica. Vale a pena acompanhar essa controvérsia, visto que o Google se prepara para anunciar recursos de IA ainda mais ambiciosos no IO.
Como rastrear e analisar os desenvolvimentos do Gemini Omni de forma eficiente
Se você está acompanhando a história do Gemini Omni em diversas fontes — TestingCatalog, tópicos do X/Twitter, blogs de tecnologia, a própria documentação do Google — o volume de informações pode ser avassalador. Eu tenho usado iWeaver agregar e estruturar esses vazamentos em uma linha do tempo coerente.
O iWeaver é um agente de IA para fluxos de trabalho de escritório que lida com texto, imagens e documentos sem exigir comandos complexos. Eu o alimento com capturas de tela de vazamentos, artigos de concorrentes e comunicados oficiais do Google, e ele gera resumos estruturados em arquivos doc/pdf. Para quem acompanha notícias de IA em constante evolução em diversas fontes, ele elimina completamente o ciclo manual de copiar, colar e organizar.
O que o lançamento do Gemini Omni significaria para criadores e desenvolvedores?
Se o Google lançar o Omni no IO 2026, as implicações práticas se dividem por público-alvo:
Para criadores de conteúdo
- Um modelo unificado significa gerar uma imagem em miniatura e um vídeo correspondente a partir do mesmo estímulo, com estilo consistente.
- Chega de alternar entre o Veo para vídeo e o Nano Banana para imagens.
- Potencial para geração de áudio no mesmo pipeline (se o Omni realmente abranger todas as modalidades)
Para desenvolvedores
- Um único endpoint de API para geração multimodal simplifica a integração.
- Plataformas como a WaveSpeed AI planejam expor o Omni por meio do mesmo padrão de endpoint compatível com OpenAI que utilizam para Veo 3.1, Seedance 2.0 e Sora 2.
- Os testes A/B do Omni em comparação com modelos especializados tornam-se simples.
Para equipes empresariais
- Faturamento consolidado e gestão de modelos sob uma única plataforma Gemini.
- Redução da complexidade do fornecedor, já que um único modelo lida com o que antes exigia três.
- Potencial de redução de custos com infraestrutura unificada
Quando esperar o anúncio oficial?
O cronograma é apertado. O Google I/O 2026 começa 19 de maioA string da interface de usuário Omni apareceu. 2 de maioUm padrão de vazamentos pré-IO revelando novos nomes públicos é consistente com uma revelação no palco principal.
Com base nos anos anteriores, esperamos:
- palestra principal de 19 de maio — anúncio oficial com vídeo de demonstração
- No mesmo dia ou no dia seguinte. — Documentação para desenvolvedores e acesso à API para assinantes do Gemini Advanced
- Dentro de 1 a 2 semanas — disponibilidade de plataformas de terceiros (WaveSpeed AI, Oimi e outras)
- Dentro de 1 mês — implementação mais ampla, incluindo acesso à camada gratuita
Considere tudo isso como especulação até que o Google o faça oficialmente. A interpretação mais plausível: o Google tem um produto de vídeo chamado Omni em fase final de desenvolvimento, e a previsão de lançamento mais provável é nas próximas duas semanas.
Perguntas frequentes
O que é Gemini Omni?
Gemini Omni é um modelo de IA do Google que vazou e foi descoberto na interface de geração de vídeo do Gemini em maio de 2026. Pode ser um modelo unificado capaz de gerar texto, imagens e vídeo em um único sistema, potencialmente substituindo os atuais modelos de vídeo Veo 3.1 e de imagem Nano Banana do Google.
Onde será realizado o Google I/O 2026?
O Google I/O 2026 acontecerá nos dias 19 e 20 de maio de 2026, durante a conferência anual de desenvolvedores do Google, tradicionalmente realizada no Shoreline Amphitheatre em Mountain View, Califórnia. Atualizações sobre o Gemini e inteligência artificial estão confirmadas na programação.
O Google Veo 3 é gratuito?
O Veo 3.1 está disponível através do Gemini com acesso gratuito limitado. Saídas de resolução mais alta e geração estendida exigem uma assinatura do Gemini Advanced. Se o Omni substituir o Veo 3.1, é provável que o Google mantenha uma estrutura de preços freemium semelhante.
O Google Gemini vai gerar vídeos?
Sim. O Gemini já gera vídeos por meio da integração com o Veo 3.1. O vazamento do Gemini Omni sugere que o Google pode estar incorporando a geração nativa de vídeos diretamente no próprio modelo Gemini, em vez de depender de um pipeline Veo separado.
O Google vai lançar um novo modelo de IA Gemini 3?
Vazamentos sugerem que o Google está testando o Gemini 3.2 e o Gemini 3.5 juntamente com o modelo Omni. O Gemini 3.1 Flash-Lite já foi lançado para o público em geral em 8 de maio de 2026. Grandes anúncios são esperados no Google I/O 2026, nos dias 19 e 20 de maio.
Como o Gemini Omni se compara ao Seedance 2.0?
O Seedance 2.0 da ByteDance atualmente lidera a maioria dos benchmarks públicos de geração de vídeo, com usabilidade comercial superior a 90%. O diferencial do Gemini Omni seria a geração multimodal unificada — processando texto, imagens e vídeo em um único modelo — algo que nenhum gerador de vídeo especializado oferece atualmente.
O que aconteceu com o OpenAI Sora 2?
A OpenAI desativou o aplicativo para consumidores do Sora 2 em 29 de abril de 2026. O modelo permanece disponível apenas por meio de acesso à API, com uma variante Pro para saída de maior resolução.
Qual é o codinome do tucano no Gemini?
Toucan é o codinome interno do Google para o atual processo de geração de vídeo baseado em Veo-3.1 dentro do Gemini. A menção à interface Omni apareceu ao lado de referências a Toucan, sugerindo que pode ser um substituto ou sucessor.




