에이

구글 IO 2026에서 공개될 제미니 옴니 비디오 모델: 지금까지 알려진 모든 것

제미니 옴니 비디오 모델 구글 IO 2026 표지 이미지

구글 IO 2026을 앞두고 유출된 제미니 옴니 비디오 모델은 무엇일까요?

2026년 5월 2일, X라는 사용자가 @토마스16937378 구글의 제미니 동영상 생성 탭에서 다음과 같은 UI 문자열을 발견했습니다. '아이디어로 시작하거나 템플릿을 사용해 보세요. Omni에서 제공합니다.' 구글 AI 유출 정보를 신속하게 추적하는 신뢰할 만한 사이트인 TestingCatalog는 이 사실을 빠르게 포착하여 보고서를 발표했고, 이 보고서는 몇 시간 만에 AI 커뮤니티 전반에 퍼져나갔습니다.

그만큼 제미니 옴니 비디오 모델 '투칸'이라는 참조 문구가 제미니 프로젝트 내에서 구글이 현재 사용하고 있는 Veo-3.1 기반 비디오 생성 경로의 내부 코드명 바로 옆에 나타났습니다. 2주 전의 일입니다. 구글 IO 2026 5월 19일~20일에 개막하는 만큼, 그 상영 일정을 단순한 잡음으로 치부하기는 어렵습니다.

저는 Veo가 처음 출시된 이후로 구글의 생성형 동영상 전략을 계속 추적해 왔는데, 동영상 탭에 완전히 새로운 제품명이 공개된 것은 이번이 처음입니다. 이전 업데이트인 Veo 2, Veo 3, Veo 3.1은 모두 Veo라는 브랜드를 유지했습니다. 'Omni'는 구조적으로 뭔가 다른 의미를 내포하고 있습니다.

'구글이 동영상 생성을 위한 제미니 옴니를 출시할 계획이라면, 베오 3.1보다 성능이 뛰어날 가능성이 높습니다.' — 테스트 카탈로그

제미니 UI에서 실제로 발견된 것은 무엇이었을까요?

모든 증거는 단 하나의 스크린샷이지만, 그 세부 사항이 중요합니다. 다음 두 가지 요소 때문에 이것은 단순한 코드 참조 이상의 의미를 갖게 됩니다.

  • 해당 문자열은 사용자에게 표시됩니다.소스 코드에 묻혀 있거나 기능 플래그 뒤에 숨겨져 있는 것이 아닙니다. 브랜드 이름이 포함된 UI 문구는 일반적으로 팀이 공개 릴리스를 준비할 때만 그러한 상태에 도달합니다.
  • 위치는 '투칸' 옆입니다.이는 현재 Veo가 지원하는 비디오 생성 도구에 대한 Google의 내부 코드명으로 알려져 있습니다. 기존 프로덕션 경로 옆에 새 코드를 배치하는 것은 교체 전 표준 스테이징 패턴입니다.

Gemini의 비디오 탭에서 새로 생성된 프로필에 'Powered by Omni'라는 문구가 표시되었는데, 이는 해당 기능이 최종 테스트 단계에 있음을 시사합니다. 이는 개발자 빌드나 APK 분석 결과가 아니라 실제 인터페이스에서 나타난 현상입니다.

'옴니'의 실제 의미는 무엇일까? 세 가지 가능한 해석

아키텍처 세부 정보, 벤치마크 수치 또는 공식 발표는 없습니다. 하지만 유출된 정보는 세 가지 해석을 뒷받침하며, 각 해석은 점진적으로 더욱 혁신적인 변화를 가져올 수 있습니다.

1. 새로운 Veo 래퍼

가장 혼란을 최소화하는 설명은 다음과 같습니다. 옴니(Omni)는 제미니(Gemini) 비디오 탭의 새로운 제품명일 뿐입니다. Veo 3.x 또는 Veo 4 실제 생성 작업은 여전히 내부적으로 진행되고 있습니다. 나노 바나나가 스틸 이미지용으로 제미니 3/3.1 플래시 이미지에 있는 것처럼, 단일 제미니 네이티브 이름으로 브랜드를 통합하는 것이 공개 문자열이 나타나는 이유일 수 있습니다.

2. 새로운 제미니 학습 기반 비디오 모델

구글은 Veo를 대체하거나 그와 함께 사용할 완전히 새로운 자체 개발 비디오 모델인 Gemini를 개발했을 가능성이 있습니다. 현재 Veo는 비디오 처리에, Nano Banana/Gemini는 이미지 처리에 사용되는 분리된 구조는 아키텍처적으로 비효율적입니다. Omni는 이러한 파이프라인을 통합하여 Veo 3.1과는 다른 독자적인 아키텍처와 벤치마크 프로파일을 갖춘 결과물일 수 있습니다.

3. 진정한 옴니 모델: 이미지, 비디오 및 기타 기능을 위한 단일 시스템

가장 야심찬 읽기이자, 바로 그 읽기입니다. 이름 실질적으로 요구되는 사항은 이미지 생성, 비디오 생성, 그리고 가능하면 오디오까지 동일 시스템에서 처리할 수 있는 단일 Gemini 옴니 모델입니다. 이는 GPT-4o가 텍스트-이미지-오디오 처리에 적합한 방식이지만, 그 이상의 기능을 갖추고 있어야 합니다. 네이티브 비디오 출력.

만약 3번 옵션이 맞다면, 제미니 옴니는 주요 AI 제공업체 중 최초로 비디오 출력을 지원하는 최고급 옴니 모델이 될 것입니다. 이는 의미 있는 첫걸음입니다. 현재 최첨단 비디오 모델인 Veo 3.1, Seedance 2.0, Kling 3.0은 모두 비디오 생성에 특화된 모델입니다. 이미지 생성이나 텍스트 추론 기능은 기본적으로 제공하지 않습니다.

유출된 문자열로는 이 세 가지 가능성을 구분할 수 없습니다. 하지만 세 번째 가능성만이 Veo의 버전 번호를 단순히 올리는 대신 'Omni'와 같은 완전히 새로운 공개 이름을 사용하는 것을 정당화합니다.

구글 제미니는 자체적으로 동영상을 생성할 수 있을까요?

네, Gemini는 이미 Veo 3.1과의 통합을 통해 비디오를 생성합니다. Omni가 제기하는 질문은 Google이 기존 방식에서 벗어나고 있는지 여부입니다. 분할 모델 전략 (비디오용 Veo, 이미지용 Nano Banana 모델, 텍스트용 Gemini) 통합 모델 모든 방식을 하나의 시스템에서 처리하는 것.

현재 제미니의 비디오 생성 흐름은 'Veo 3.1 기반'으로 표시되고, 이미지 생성은 나노 바나나 2 및 나노 바나나 프로와 연결되어 있습니다. 구글은 나노 바나나 프로를 제미니 3 기반으로, 나노 바나나 2를 제미니 3.1 플래시 이미지로 설명합니다. 이러한 명칭만 봐도 현재의 접근 방식이 얼마나 파편화되어 있는지 알 수 있습니다.

통합된 옴니 모델은 다음과 같은 구체적인 이점을 제공할 수 있습니다.

  • 다양한 방식에서 일관된 품질 텍스트, 이미지, 비디오를 기반으로 학습된 단일 모델은 스토리보드 이미지를 생성하고 이를 비디오 애니메이션으로 만들 때 스타일의 일관성을 유지합니다.
  • 더욱 간소화된 창작 워크플로우 — 이미지 모델과 비디오 모델 간 전환이 없습니다. 하나의 프롬프트로 이미지와 비디오가 연속적으로 생성될 수 있습니다.
  • 더 나은 즉각적인 이해를 위해 시각적 개념과 시간적 개념을 모두 이해하는 모델은 복잡한 텍스트 설명으로부터 더욱 정확한 영상을 생성할 수 있습니다.
  • 잠재적 비용 효율성 — 여러 개의 전문화된 모델 대신 하나의 대규모 모델을 유지하면 구글 규모에서 인프라 비용을 절감할 수 있습니다.

제미니 옴니와 2026년 AI 비디오 세대의 변화

현재 영상 생성은 생성형 AI 분야에서 가장 경쟁이 치열한 영역입니다. 만약 Omni가 2026년 Google IO에서 제품을 출시한다면, 이미 포화 상태이고 빠르게 변화하는 분야에 진입하게 되는 것입니다. 2026년 5월 기준 주요 업체들의 현황은 다음과 같습니다.

모델회사주요 강점현황 (2026년 5월 기준)
베오 3.1Google영화적 카메라 워크, 시청각 동기화쌍둥이자리 지역에서 거주 가능, 지역 제한 있음
시드댄스 2.0바이트댄스공개 벤치마크 최고 성능, Fast/Turbo 변형, 90%+ 상용 활용성공개적으로 이용 가능
해피호스-1.0알리바바인공 분석 비디오 아레나에서 #1을 획득했습니다 (ELO 1411).공개적으로 이용 가능
완 2.7알리바바텍스트/이미지/비디오 편집 + 오디오 동기화 모션 (1080p)공개적으로 이용 가능
클링 V3.0콰이쇼우Std/Pro/O3 변형, 월 매출 $20M+공개적으로 이용 가능
소라 2오픈AI더 높은 해상도를 위한 프로 버전API 전용 (소비자용 앱은 2026년 4월 29일 서비스 종료 예정)
그록 비디오엑스아이에이X/트위터의 긴밀한 통합, 소셜 미디어 우선 배포기능 확장
하이루오미니맥스캐릭터의 일관성이 뛰어나고 움직임이 부드럽습니다.중국 시장에서 경쟁하기

바이트댄스의 시드댄스 2.0 현재 대부분의 공개 벤치마크에서 최상위권을 차지하고 있으며, Fast 및 Turbo 변형을 통해 대량 생산에 적합한 영화 같은 AI 비디오 제작을 경제적으로 실현 가능하게 만들고 있습니다. 알리바바의 HappyHorse-1.0은 ELO 1411점으로 Artificial Analysis Video Arena 순위표에서 Seedance를 잠시 앞지르기도 했습니다.

옴니를 이 모든 것들과 차별화하는 것은 바로 '옴니'라는 부분일 것입니다. 위에 나열된 모든 모델은 특수 목적의 비디오 생성기입니다. 이들 중 어느 것도 이미지 생성이나 텍스트 추론 기능을 제공하지 않습니다. 만약 제미니 옴니가 이러한 기능들을 진정으로 통합한다면, 독보적인 위치를 차지하게 될 것입니다.

Google IO 2026은 어디에서 언제 개최되나요?

Google IO 2026은 2026년 5월 19일부터 20일까지 개최됩니다. 이번 행사는 구글의 연례 개발자 컨퍼런스로, 역사적으로 캘리포니아주 마운틴뷰의 쇼어라인 원형극장에서 개최되어 왔습니다. 기조연설에서는 제미니 프로젝트와 더 광범위한 AI 관련 업데이트가 주요 안건으로 다뤄질 예정입니다.

이번 옴니(Omni) 유출은 행사 정확히 2주 전에 발생했는데, 이는 구글의 기존 패턴을 따르는 것입니다. 구글은 일반적으로 IO 사전 유출 주기에서 UI 문자열과 APK 분석 자료를 기조연설 2~4주 전에 공개하여 커뮤니티가 공식 발표 전에 추측할 시간을 갖도록 합니다.

하지만 UI 문자열이 제품 출시 없이 유출된 사례는 이전에도 있었습니다. 이번 유출에 대한 가장 타당한 해석은 다음과 같습니다. 구글은 제미니 위성에 탑재할 옴니(Omni)라는 동영상 제품을 개발 막바지 단계에 있으며, 출시 가능성이 가장 높은 시기는 5월 19일에서 20일 사이입니다.

구글이 제미니 3 AI 모델을 새로 출시할 예정인가요?

추가 유출 정보가 보고되었습니다. 판카지 쿠마르 구글이 새로운 제미니 버전을 테스트하고 있다는 것을 암시합니다. 특히, 제미니 3.2와 제미니 3.5 — 더 빠른 성능에 초점을 맞췄습니다. 이는 옴니 유출과는 별개이지만, 동일한 사전 IO 테스트 단계에 속합니다.

테스트에서 발견된 다른 기능은 다음과 같습니다.

  • '팀푸드' 메모리 기능 — 세션 간에 유지되는 장기적인 채팅 컨텍스트
  • '스파크 로빈' — 테스트 참조에서 Omni와 함께 등장했던 시각적 모델의 코드명입니다.
  • 제미니 3.1 플래시라이트 — 2026년 5월 8일부로 이미 일반 판매가 시작되었습니다.

2026년 구글의 모델 전략은 두 가지 방향으로 진행되는 것으로 보입니다. 핵심 언어 모델에 대해서는 제미니 버전을 점진적으로 업그레이드하는 방식(3.1 → 3.2 → 3.5)을, 멀티모달 생성을 위해서는 옴니를 통해 아키텍처를 도약하는 방식을 고려하고 있습니다.

Google Veo 3는 무료인가요?

Veo 3.1(현행 버전)은 Gemini를 통해 구할 수 있지만, 접근 제한 및 지역 제한Gemini 내에서 기본 비디오 생성은 무료로 이용할 수 있지만, 고해상도 출력 및 생성 시간 연장을 위해서는 Gemini Advanced 구독이 필요합니다.

만약 Omni가 Veo 3.1을 대체한다면 가격 모델에 변화가 생길 수 있습니다. 구글은 과거에 새로운 AI 기능을 프리미엄 모델로 제공해 왔습니다. 기본 기능은 무료로 이용하고, 프리미엄 기능은 구독을 통해 사용하는 방식이죠. IO에서 Omni가 출시된다면 비슷한 접근 방식을 취할 것으로 예상됩니다.

WaveSpeed AI와 같은 타사 플랫폼은 이미 Veo 3.1을 호스팅하고 있으며, 새로운 Gemini 비디오 모델이 공개 출시된 직후에 추가할 계획입니다. 초당 가격 책정 방식은 프로덕션 워크로드에 더욱 비용 효율적일 수 있습니다.

제미니 나노 논란: 조용한 AI 배포에 대한 경고

옴니(Omni) 유출 사건이 큰 관심을 불러일으키는 가운데, 구글의 AI 도입 방식은 2026년에도 비판을 받고 있습니다. 별개이지만 관련된 소식입니다. 구글 크롬이 사용자 동의 없이 제미니 나노라는 4GB 크기의 AI 모델을 사용자 기기에 조용히 다운로드하고 있는 것으로 드러났습니다.

weights.bin이라는 이름의 이 파일은 크롬의 사용자 프로필 디렉터리에 있으며, '글쓰기 도움말' 및 사기 탐지와 같은 기기 내 기능을 구동합니다. 사용자는 이 기능을 비활성화할 수 있는 체크박스를 찾을 수 없습니다. 사용자가 이 파일을 삭제하면 크롬은 4GB 크기의 전체 패키지를 자동으로 다시 다운로드합니다.

크롬이 전 세계적으로 수억 대의 기기에 4GB 메모리를 배포하는 데 드는 환경적 비용은 이산화탄소 환산 배출량 기준으로 6,000톤에서 60,000톤 사이로 추산됩니다. 전 세계 많은 지역의 모바일 데이터 요금제에서는 4GB를 한 달 전체 사용량으로 간주합니다.

ePrivacy Directive는 사용자의 사전 동의 없이 기기에 정보를 저장하는 것을 금지합니다. 크롬은 기기 내 LLM 없이도 완벽하게 작동하므로 '반드시 필요한' 예외 조항이 적용되지 않습니다. 구글이 IO에서 더욱 야심찬 AI 기능을 발표할 예정인 만큼, 이 논란은 주목할 만한 가치가 있습니다.

제미니 옴니의 개발 상황을 효율적으로 추적하고 분석하는 방법

테스팅 카탈로그, X/트위터 스레드, 기술 블로그, 구글 공식 문서 등 여러 출처에서 제미니 옴니(Gemini Omni) 관련 소식을 접하다 보면 정보량이 너무 많아 압도될 수 있습니다. 저는 다음과 같은 방법을 사용하고 있습니다. iWeaver 이러한 유출 정보를 종합하고 체계적인 시간 순서대로 정리하기 위해서입니다.

iWeaver는 복잡한 입력 없이 텍스트, 이미지, 문서를 처리하는 사무 워크플로용 AI 에이전트입니다. 유출된 스크린샷, 경쟁사 기사, 구글 공식 발표 자료 등을 입력하면 구조화된 요약본을 doc/pdf 파일로 출력해 줍니다. 수십 개의 출처에서 빠르게 변화하는 AI 관련 뉴스를 추적하는 사람이라면 누구나 iWeaver를 통해 수동으로 복사, 붙여넣기, 정리하는 과정을 완전히 없앨 수 있습니다.

제미니 옴니 출시가 크리에이터와 개발자에게 어떤 의미를 갖는가

만약 구글이 IO 2026에서 Omni를 공개한다면, 그 실질적인 영향은 대상 고객층별로 다음과 같이 분석될 수 있습니다:

콘텐츠 제작자를 위한 정보

  • 통합 모델이란 동일한 프롬프트에서 일관된 스타일로 썸네일 이미지와 그에 맞는 비디오를 생성하는 것을 의미합니다.
  • 이제 동영상 촬영을 위해 Veo를, 사진 촬영을 위해 Nano Banana를 번갈아 사용할 필요가 없습니다.
  • (옴니가 모든 모달리티를 진정으로 지원하는 경우) 동일한 파이프라인 내에서 오디오를 생성할 수 있는 가능성

개발자용

  • 멀티모달 생성을 위한 단일 API 엔드포인트로 통합이 간소화됩니다.
  • WaveSpeed AI와 같은 플랫폼은 Veo 3.1, Seedance 2.0 및 Sora 2에 사용하는 것과 동일한 OpenAI 호환 엔드포인트 패턴을 통해 Omni를 공개할 계획입니다.
  • 특수 모델에 대한 Omni의 A/B 테스트가 간단해집니다.

기업 팀을 위한

  • Gemini의 통합된 시스템 하에서 청구 및 모델 관리가 가능합니다.
  • 하나의 모델로 기존에 세 가지 모델이 필요했던 기능을 처리할 수 있으므로 공급업체 복잡성이 줄어듭니다.
  • 통합 인프라를 통한 잠재적 비용 절감

공식 발표는 언제쯤 예상되나요?

일정이 촉박합니다. Google IO 2026이 개최됩니다. 5월 19일옴니 UI 문자열이 나타났습니다. 5월 2일사전 공개 유출을 통해 새로운 공개 인물들의 이름이 드러나는 패턴은 기조연설 단계에서의 발표와 일관성이 있습니다.

지난 몇 년간의 데이터를 바탕으로 다음과 같이 예상합니다.

  1. 5월 19일 기조연설 — 데모 영상과 함께하는 공식 발표
  2. 당일 또는 다음 날 — Gemini Advanced 구독자를 위한 개발자 문서 및 API 접근 권한
  3. 1~2주 이내 — 타사 플랫폼 이용 가능 여부 (WaveSpeed AI, Oimi 등)
  4. 1개월 이내 — 무료 티어 액세스를 포함한 더 광범위한 출시
구글이 공식적으로 발표하기 전까지는 이 모든 것을 추측으로 간주하세요. 가장 타당한 해석은 구글이 옴니(Omni)라는 동영상 제품을 개발 막바지 단계에 있으며, 출시 시기는 향후 2주 이내라는 것입니다.

자주 묻는 질문

제미니 옴니란 무엇인가요?

제미니 옴니(Gemini Omni)는 2026년 5월 제미니(Gemini)의 비디오 생성 UI에서 유출된 구글 AI 모델입니다. 이 모델은 텍스트, 이미지, 비디오를 하나의 시스템에서 생성할 수 있는 통합 모델로, 구글의 현재 Veo 3.1 비디오 모델과 Nano Banana 이미지 모델을 대체할 가능성이 있습니다.

Google IO 2026은 어디에서 열리나요?

Google IO 2026은 2026년 5월 19일부터 20일까지 캘리포니아주 마운틴뷰의 쇼어라인 원형극장에서 열리는 구글의 연례 개발자 컨퍼런스입니다. 제미니와 AI 관련 업데이트는 확정된 의제입니다.

Google Veo 3는 무료인가요?

Veo 3.1은 Gemini를 통해 제한적인 무료 이용 권한으로 제공됩니다. 고해상도 출력 및 확장된 세대 기능을 사용하려면 Gemini Advanced 구독이 필요합니다. Omni가 Veo 3.1을 대체할 경우, Google은 유사한 프리미엄 가격 구조를 유지할 가능성이 높습니다.

구글 제미니는 동영상을 생성할 수 있을까요?

네. 제미니는 이미 Veo 3.1 통합을 통해 비디오를 생성합니다. 제미니 옴니 유출 정보는 구글이 별도의 Veo 파이프라인에 의존하는 대신 제미니 모델 자체에 네이티브 비디오 생성 기능을 직접 구축하고 있을 가능성을 시사합니다.

구글이 새로운 제미니 3 AI 모델을 출시할 예정인가요?

유출된 정보에 따르면 구글은 옴니 모델과 함께 제미니 3.2 및 제미니 3.5를 테스트 중인 것으로 보입니다. 제미니 3.1 플래시라이트는 이미 2026년 5월 8일에 정식 출시되었습니다. 주요 발표는 5월 19일부터 20일까지 열리는 구글 IO 2026에서 있을 것으로 예상됩니다.

Gemini Omni는 Seedance 2.0과 어떻게 비교되나요?

ByteDance의 Seedance 2.0은 현재 90% 이상의 상용 활용도를 기록하며 대부분의 공개 비디오 생성 벤치마크에서 1위를 차지하고 있습니다. Gemini Omni의 차별점은 텍스트, 이미지, 비디오를 하나의 모델로 처리하는 통합 멀티모달 생성 기능으로, 현재 어떤 전문 비디오 생성기도 이러한 기능을 제공하지 않습니다.

OpenAI Sora 2는 어떻게 되었나요?

OpenAI는 2026년 4월 29일에 Sora 2 소비자 앱 서비스를 종료했습니다. 해당 모델은 API를 통해서만 이용 가능하며, 고해상도 출력을 제공하는 Pro 버전이 제공됩니다.

쌍둥이자리에서 투칸의 코드명은 무엇인가요?

Toucan은 현재 Gemini 내부에 있는 Veo-3.1 기반 비디오 생성 경로에 대한 Google의 내부 코드명입니다. Omni UI라는 문자열이 Toucan 참조 옆에 나타난 것으로 보아 Toucan을 대체하거나 후속 기술일 가능성이 있습니다.