Google I/O 2026におけるGemini Omniビデオモデル:これまでに判明しているすべて

gemini-omni-video-model-google-io-2026 カバー画像

Google I/O 2026の前にリークされたGemini Omniビデオモデルとは?

2026年5月2日、Xユーザーが @Thomas16937378 GoogleのGemini動画生成タブ内に、次のようなUI文字列を発見しました。 「アイデアから始めるもよし、テンプレートを使ってみるもよし。Omni搭載。」 GoogleのAI情報漏洩を追跡する信頼できるサイトであるTestingCatalogは、この発見をいち早く察知し、数時間以内にAIコミュニティ全体に広まったレポートを公開した。

ジェミニオムニビデオモデル 参照は、GoogleのGemini内部にあるVeo-3.1搭載の動画生成経路の内部コードネームである「Toucan」のすぐ隣に現れた。 Google IO 2026 5月19日~20日に公開されるこのイベントは、単なる騒音として片付けるのは難しい。

私はVeoの初代リリース以来、Googleのジェネレーティブビデオ戦略を追跡してきましたが、ビデオタブに全く新しい製品名が一般向けに表示されたのは今回が初めてです。これまでのアップデート(Veo 2、Veo 3、Veo 3.1)はすべてVeoというブランド名を維持していました。「Omni」は構造的に異なる何かを示唆しています。

「もしGoogleが動画生成向けにGemini Omniをリリースする計画なら、Veo 3.1を上回る性能を発揮する可能性が高いだろう。」 — テストカタログ

ジェミニのUIで実際に何が発見されたのか?

証拠全体はたった一枚のスクリーンショットだけだが、その詳細が重要だ。このスクリーンショットが単なるランダムなコード参照以上の意味を持つ理由は二つある。

  • この文字列はユーザーに表示されますソースコードの中に埋もれていたり、機能フラグの裏に隠されていたりするものではありません。ブランド名を含むUIコピーは、通常、チームが一般公開の準備をしている段階になって初めてその状態になります。
  • 設置場所は「トゥーカン」の隣です。これは、Googleが現在Veoの支援を受けて開発している動画生成ツールに使用している、社内コードネームです。既存の運用パスウェイの隣に新しいコードを配置するのは、スワップ前の標準的なステージングパターンです。

Geminiのビデオタブに新しく作成されたプロフィールに「Powered by Omni」という表示が現れたことから、この機能は最終段階のテスト中であることが示唆される。これは開発者向けビルドやAPKの解析結果ではなく、実際のライブインターフェースに表示されたものである。

考えられる3つの解釈:「オムニ」の正体とは?

アーキテクチャの詳細、ベンチマーク数値、公式声明は入手できていない。しかし、リークされた情報からは、それぞれが段階的に大きな変革をもたらす3つの解釈が可能である。

1. 新しいVeoラッパー

最も混乱の少ない説明:Omniは単にGeminiのビデオタブの新しい製品名であり、 Veo 3.x または Veo 4 内部では実際の生成作業がまだ行われています。静止画用のGemini 3 / 3.1 Flash ImageにNano Bananaが使われているのと同様に、単一のGeminiネイティブ名にブランドを統合することで、一般公開用の文字列が表示される理由が説明できます。

2. ジェミニでトレーニングを受けた新しいビデオモデル

Googleは、Geminiの傘下で、Veoと並ぶ、あるいはVeoに取って代わる全く新しい社内ビデオモデルを開発した可能性がある。現在のVeo(ビデオ用)とNano Banana/Gemini(画像用)という分割は、アーキテクチャ的に不自然だ。Omniは、これらのパイプラインを統合した結果であり、Veo 3.1とは異なる独自のアーキテクチャとベンチマークプロファイルを持つ可能性がある。

3. 真のオムニモデル:画像+動画+その他を単一システムで実現

最も野心的な読書、そして 名前 実際には、画像生成、ビデオ生成、場合によってはオーディオを同じシステムで処理する単一のGeminiオムニモデルが求められています。これは、テキスト-画像-オーディオに対してGPT-4oが位置づけられている方法と同じですが、 ネイティブビデオ出力.

オプション3が正しければ、Gemini Omniは、主要なAIプロバイダーからビデオ出力機能を搭載した初の最高級オムニカメラモデルとなるだろう。 これは意義深い第一歩だ。現在最先端のビデオモデルであるVeo 3.1、Seedance 2.0、Kling 3.0は、いずれもビデオ生成に特化したものであり、画像生成やテキスト推論をネイティブに処理する機能は備えていない。

流出した文字列では、これら3つの可能性を区別することはできない。しかし、Veoのバージョン番号を単に更新するのではなく、「Omni」のような全く新しい公開名を正当化できるのは、オプション3のみである。

Google Geminiはネイティブで動画を生成するようになるのか?

はい、Geminiは既にVeo 3.1との統合を通じて動画を生成しています。Omniが提起する疑問は、Googleが 分割モデル戦略 (ビデオにはVeo、画像にはNano Bananaモデル、テキストにはGemini) 統一モデル あらゆる治療法を一つのシステムで処理できる。

現在、Geminiの動画生成フローは「Powered by Veo 3.1」と表記されている一方、画像生成はNano Banana 2とNano Banana Proに関連付けられている。GoogleはNano Banana ProをGemini 3をベースに構築したもの、Nano Banana 2をGemini 3.1 Flash Imageと説明している。この命名規則だけでも、現在のアプローチがいかに断片化されているかがわかる。

統一されたオムニモデルは、具体的な利点をもたらす可能性がある。

  • あらゆる形態において一貫した品質 テキスト、画像、動画で学習させた単一のモデルは、ストーリーボード画像を生成し、それを動画にアニメーション化する際に、スタイルの一貫性を維持する。
  • よりシンプルなクリエイティブワークフロー 画像モデルと動画モデルを切り替える必要はありません。1つのプロンプトで、一貫性のある画像と動画のシーケンスを生成できます。
  • より迅速な理解 視覚的概念と時間的概念の両方を理解するモデルであれば、複雑なテキスト記述からより正確な動画を生成できる可能性がある。
  • 潜在的なコスト効率化 ―複数の専門的なモデルではなく、1つの大規模なモデルを維持することで、Google規模のインフラコストを削減できる可能性がある。

ジェミニ・オムニと2026年のAIビデオ生成の状況

動画生成は、現在、生成型AIの中で最も競争の激しい分野です。OmniがGoogle I/O 2026で発表されれば、競争が激しく変化の速い分野に参入することになります。2026年5月時点での主要プレーヤーの状況は以下のとおりです。

モデル会社主な強み現状(2026年5月時点)
ヴェオ3.1グーグル映画的なカメラワーク、音声と映像の同期ジェミニに住む(地域限定)
シーダンス 2.0ByteDance公開ベンチマークでトップ、高速/ターボバージョン、90%+の商用利用一般公開されている
ハッピーホース-1.0アリババ人工分析ビデオアリーナで#1を獲得(ELOレーティング1411)一般公開されている
WAN 2.7アリババテキスト/画像/動画編集+音声同期モーション(1080p)一般公開されている
クリング V3.0快手Std/Pro/O3バリアント、月間売上高$20M+一般公開されている
ソラ2オープンAI高解像度版APIのみ利用可能(消費者向けアプリは2026年4月29日にサービス終了)
グロックビデオxAIX/Twitterとの緊密な連携、ソーシャルメディア優先の配信機能の拡張
海洛ミニマックスキャラクターの一貫性が高く、動きが滑らか中国市場での競争

ByteDanceのSeedance 2.0 現在、ほとんどの公開ベンチマークでトップに立っており、FastおよびTurboバージョンにより、映画のようなAIビデオを大量生産でも経済的に実現可能にしている。アリババのHappyHorse-1.0は、ELOレーティング1411で、一時的に人工分析ビデオアリーナのリーダーボードでSeedanceを追い抜いた。

Omniがこれら全てと異なる点は、「omni」という部分にある。 上記に挙げたモデルはすべて、特殊なビデオジェネレーターです。 画像生成やテキスト推論といった機能も備えている製品は他にありません。Gemini Omniがこれらの機能を真に統合しているとすれば、それは唯一無二の存在と言えるでしょう。

Google I/O 2026はどこで、いつ開催されるのか?

Google I/O 2026は、2026年5月19日~20日に開催されます。 このイベントは、Googleが毎年開催する開発者向けカンファレンスで、例年カリフォルニア州マウンテンビューのショアライン・アンフィシアターで開催されています。基調講演では、GeminiをはじめとするAI関連の最新情報が議題として取り上げられることが確定しています。

Omniのリークがイベントのちょうど2週間前に浮上したタイミングは、よく知られたパターンに沿っている。GoogleのIO前のリークサイクルでは、通常、基調講演の2~4週間前にUI文字列やAPKの解析結果が出回り、公式発表前にコミュニティが憶測する時間を与えている。

とはいえ、UI文字列が製品発表前に流出した例は過去にもある。今回のリークについて最も妥当な解釈は以下の通りだ。 GoogleはGemini衛星上でOmniという動画サービスを開発しており、最終段階のテストを行っている。打ち上げの最も可能性の高い時期は5月19日~20日だ。

Googleは新しいGemini 3 AIモデルをリリースするのか?

追加のリークが報告されました パンカジ・クマール Google が新しい Gemini バージョンをテストしていることを示唆しています。具体的には ジェミニ3.2とジェミニ3.5 ― パフォーマンスの向上に重点を置いています。これらはOmniのリークとは別個のものですが、同じIO前テストの段階に含まれています。

テスト中に確認されたその他の機能は以下のとおりです。

  • 「チームフード」メモリー機能 — セッション間で持続する長期的なチャットコンテキスト
  • 「スパーク・ロビン」 — テスト資料でOmniと並んで登場したビジュアルモデルのコードネーム
  • ジェミニ 3.1 フラッシュライト — 2026年5月8日より既に一般提供開始済み

Googleの2026年におけるモデル戦略は、2つのアプローチから成り立っているようだ。コア言語モデルについては、Geminiのバージョンアップ(3.1→3.2→3.5)を段階的に進める一方、マルチモーダル生成のためのOmniでは、アーキテクチャの飛躍的な進化を目指す。

Google Veo 3は無料ですか?

Veo 3.1(現在のバージョン)はGeminiを通じて入手可能ですが、 地域制限付きGeminiでは、基本的なビデオ生成は無料プランで利用できますが、高解像度出力や長時間の生成にはGemini Advancedのサブスクリプションが必要です。

OmniがVeo 3.1に取って代わる場合、価格モデルが変わる可能性がある。Googleはこれまで、新しいAI機能をフリーミアム構造で提供してきた。つまり、基本機能は無料で利用でき、プレミアム機能はサブスクリプション制となっている。OmniがIOで発表される場合、同様のアプローチが取られると予想される。

WaveSpeed AIのようなサードパーティプラットフォームは既にVeo 3.1をホストしており、一般公開後まもなく新しいGeminiビデオモデルを追加する予定で、秒単位の料金体系は制作ワークロードにとってより費用対効果の高いものとなる可能性がある。

ジェミニナノ論争:静かなAI展開に関する注意喚起

Omniのリークは大きな話題を呼んでいる一方で、GoogleのAI導入手法は2026年に批判も浴びている。これとは別に、関連する話として以下がある。 Google Chromeは、ユーザーの許可を求めることなく、Gemini Nanoと呼ばれる4GBのAIモデルをユーザーのデバイスに密かにダウンロードしていた。

weights.binという名前のファイルは、Chromeのユーザープロファイルディレクトリ内に存在し、「文章作成支援」や詐欺検出などのデバイス内機能に利用されています。ユーザーは、このファイルの使用を拒否するためのチェックボックスを見つけることができません。ユーザーがこのファイルを削除すると、Chromeは4GBのパッケージ全体を自動的に再ダウンロードします。

Chromeのグローバル規模では、数億台のデバイスに4GBの容量を配信することによる環境コストは、二酸化炭素換算で6,000トンから60,000トンの排出量と推定されている。 世界の多くの地域では、モバイルデータプランにおいて4GBが1ヶ月分のデータ容量として扱われる。

eプライバシー指令は、ユーザーの事前の同意なしにデバイスに情報を保存することを禁じています。Chromeはデバイス上のLLMがなくても完全に機能するため、「厳密に必要」という例外は適用されません。GoogleがIOでさらに野心的なAI機能を発表する準備を進めている今、この論争は注目に値します。

ジェミニ・オムニの動向を効率的に追跡・分析する方法

複数の情報源(TestingCatalog、X/Twitterのスレッド、技術ブログ、Googleの公式ドキュメントなど)でGemini Omniのストーリーを追っていると、情報量が多すぎて圧倒されてしまうことがあります。 アイウィーバー これらの情報漏洩を集約し、一貫性のある時系列に整理する。

iWeaverは、複雑な指示を必要とせずにテキスト、画像、ドキュメントを処理する、オフィスワークフロー向けのAIエージェントです。リークされたスクリーンショット、競合他社の記事、Googleの公式発表などを入力として与えると、構造化された要約をdoc/pdfファイルとして出力します。数十もの情報源から刻々と変化するAI関連ニュースを追跡している人にとって、手作業によるコピー&ペーストと整理のサイクルを完全に排除できます。

ジェミニ・オムニの打ち上げがクリエイターや開発者にもたらす意味とは

GoogleがIO 2026でOmniを発表した場合、その実質的な影響は対象ユーザー別に見ていくと以下のようになる。

コンテンツクリエイター向け

  • 統一モデルとは、同じプロンプトからサムネイル画像とそれに対応する動画を、一貫したスタイルで生成することを意味します。
  • 動画用のVeoと画像用のNano Bananaを切り替える必要はもうありません。
  • (Omniが本当にすべてのモダリティを網羅している場合)同一パイプライン内での音声生成の可能性

開発者向け

  • マルチモーダル生成のための単一のAPIエンドポイントにより、統合が簡素化されます
  • WaveSpeed AIのようなプラットフォームは、Veo 3.1、Seedance 2.0、Sora 2で使用しているのと同じOpenAI互換エンドポイントパターンを通じてOmniを公開する予定です。
  • Omniと専用モデルとのA/Bテストは簡単に行える

企業チーム向け

  • Geminiの傘下で請求とモデル管理を統合
  • 1つのモデルで従来3つ必要だった処理を処理できるため、ベンダーの複雑さが軽減される。
  • 統合インフラストラクチャによる潜在的なコスト削減

公式発表はいつ頃になるのか

スケジュールはタイトだ。Google I/O 2026が開幕する。 5月19日Omni UI の文字列が表面化しました 5月2日IO(情報公開)前に新たな公的な名前がリークされるというパターンは、基調講演での発表と一致している。

過去数年に基づくと、以下のことが予想されます。

  1. 5月19日基調講演 — デモ映像付き公式発表
  2. 当日または翌日 — Gemini Advanced加入者向けの開発者向けドキュメントおよびAPIアクセス
  3. 1~2週間以内 — サードパーティ製プラットフォームの利用可能性(WaveSpeed AI、Oimiなど)
  4. 1ヶ月以内 — 無料プランへのアクセスを含む、より広範な展開
Googleが公式発表するまでは、これらはすべて憶測として捉えてください。 最も妥当な解釈は、GoogleがOmniと呼ばれる動画サービスを最終段階のテスト中で、最も可能性の高いローンチ時期は今後2週間以内だというものだ。

よくある質問

ジェミニオムニとは何ですか?

Gemini Omniは、2026年5月にGeminiの動画生成UI内で発見された、リークされたGoogleのAIモデルです。これは、テキスト、画像、動画を単一のシステムで生成できる統合モデルである可能性があり、Googleの現在のVeo 3.1動画モデルとNano Banana画像モデルに取って代わる可能性があります。

Google I/O 2026はどこで開催されますか?

Google I/O 2026は、2026年5月19日~20日に開催されるGoogleの年次開発者会議で、例年カリフォルニア州マウンテンビューのショアライン・アンフィシアターで開催されます。GeminiとAIのアップデートは、議題に含まれています。

Google Veo 3は無料ですか?

Veo 3.1はGeminiを通じて利用可能で、無料プランには制限があります。高解像度出力や拡張生成機能を利用するには、Gemini Advancedのサブスクリプションが必要です。OmniがVeo 3.1に取って代わる場合、Googleは同様のフリーミアム価格体系を維持する可能性が高いでしょう。

Google Geminiは動画を生成するのでしょうか?

はい。Geminiは既にVeo 3.1との連携を通じて動画を生成しています。Gemini Omniのリーク情報によると、GoogleはVeoのパイプラインに頼るのではなく、Geminiモデル自体にネイティブ動画生成機能を直接組み込む可能性があるようです。

Googleは新しいGemini 3 AIモデルをリリースするのでしょうか?

リーク情報によると、GoogleはOmniモデルと並行してGemini 3.2とGemini 3.5のテストを行っているようだ。Gemini 3.1 Flash-Liteは既に2026年5月8日に一般提供が開始されている。主要な発表は5月19日~20日に開催されるGoogle I/O 2026で行われる予定だ。

Gemini OmniはSeedance 2.0と比べてどうですか?

ByteDance社のSeedance 2.0は、現在、90%を超える商用利用可能性で、ほとんどの公開動画生成ベンチマークでトップに立っています。Gemini Omniの差別化要因は、テキスト、画像、動画を1つのモデルで処理する統合マルチモーダル生成機能であり、これは現在、どの専用動画生成ツールも提供していない機能です。

OpenAI Sora 2はどうなったのですか?

OpenAIは2026年4月29日にSora 2の一般向けアプリの提供を終了しました。モデル自体はAPI経由でのみ利用可能で、より高解像度の出力に対応したPro版も提供されています。

ジェミニ計画におけるトゥーカンのコードネームは何ですか?

Toucanは、GoogleがGemini内で現在使用しているVeo-3.1ベースの動画生成経路に対して使用している内部コードネームです。Omni UIという文字列がToucanの参照箇所の横に表示されていたことから、Omni UIはToucanの後継または代替となる可能性が示唆されます。