omni動画生成、実際に触ってみました！

Googleの大型アプデまとめ＋Gemini Omni を1日触り倒して気づいた、本領と地味なUIの罠

konmari

5月 24, 2026

Google I/O 2026、観ましたか…？✨

Googleの大型アップデート、もりだくさんすぎて🥹

全部追いきれてないので、まとめにしてみました☺️

エージェントが勝手にOS作ったり、買い物ができたり、検索結果がアプリになって返ってきたり…もう、ぜんぶがぜんぶ未来すぎて、私の脳みそでは1日に消化しきれません。。

そんな盛りだくさんアップデートの中で、私がいちばん気になったのが、

画像生成 × 動画生成（Gemini Omni）

今朝Xで、 Google Flow の Omni が全員開放 されたと聞いてさらにあついです！！

これまでは Google AI のサブスク加入者だけだったのが、無料アカウントでも 1日50クレジット分まで無料 で触れるようになったんです。ありがたい！！☺

️Try in GeminiとTry in Google Flow今回はFlowで検証してみました！

今日はその検証結果をシェアさせてください。

結論から書きますね。

Gemini Omni の本当の強み、私は最初完全に勘違いしてました🥹

最初の失敗：キャラ動画が、ぜんぜん思った絵にならない

最初に私が試したのは、こんな目標でした。

「自分の分身キャラに、Gemini Omni を紹介させる10秒動画を作る」

参照画像として、自分の分身キャラの 特殊表情集 をアップロードして、

「surprised、thumbs up、smile の3つの表情を順番に遷移させる」みたいなプロンプトで生成。

結果、出てきた動画がこちら。

…これね、確かに 似たような 女の子は出てきたんです

メガネ・ペイント柄ジャケットの雰囲気は残ってる。

でも、

髪色のグラデ（紫×ピンク×イエロー → 紫＋オレンジ毛先に変わってる）
髪型（お団子+三つ編み → ストレートロング）
服の配色（ティール+イエロー → シアン+赤+黄）
腕時計（黒い時計、消えてる）

細部がぜんぶ別物になってる。

「あれ、Omniってこんなもんなの…？」って正直凹みました

「ぜんぜん参照が活きないなら、Grok の方がいいかも」

X（旧Twitter）の Grok でも動画生成できるし（かわいいし日本語上手いし）、もしOmniの参照画像がここまで活きないなら、わざわざ Flow にこだわる理由がないなと。

でも、ちょっと待って。

よく読み直すと、Flow の Gemini Omni の 公式デモ用途 にこう書いてあったんです。

「動画と音楽の生成・編集。Omniモデルで、別キャラクターの追加やアングル変更も。」

…って、これ完全に「シーンに新キャラを足すユースケース」なんですよね。

私がやろうとした「キャラのフルプロフィールを動画化」とは、ちょっと違う方向だったかも？

そう思い直して、検証をピボットしました。

方向転換：Omniは物理シミュレーションでこそ本領を発揮する

I/O のスライドや公式の Prompt Guide を読み直すと、Omni の売り文句にはこんなキーワードが並んでいます。

究極の「世界モデル」
物理法則（重力や運動エネルギー）を理解
流体・浮力・粒子の動きを忠実に再現

つまり Omni は、

キャラのデフォルメ再現が得意なんじゃなくて、「世界の物理」を再現するのが本領

なんじゃないか？という仮説に切り替えたんです。

これを試すには、物理現象がしっかり起きる素材 が必要。

私が選んだのは、これ☺️

懐かしの ウォーターゲーム。

水中にカラフルなリングや星が浮いてて、下のボタンを押すと シュポッ！ って空気が出て、リングが舞い上がるアレです。

これを生成するプロンプトはこちらで紹介しています

https://konmari-handout.pages.dev/konmari-prompt/

動画プロンプトはこうしました（コピペで使えるように貼っておきますね）。

A vintage Hokkaido-themed water-filled toy on a sunlit wooden desk.
Water sloshes gently inside the clear plastic box as colorful rings,
hearts, stars, and tiny trees float and tumble with realistic buoyancy
physics. Snowflakes swirl past the illustrated mountain scene. Soft
warm afternoon window light, shallow depth of field. Slow push-in
oner shot, hyperrealistic product photography. Keep the toy and
surrounding objects exactly identical to the reference image.

これで生成した動画がこちら。

水が ちゃんと揺れて
リング・星・木のオーナメントが 浮力で舞い上がって
カメラが ゆっくりpush-in で寄って
雪片が 背景イラストの上を漂う

しかも、

ピンクキャップ・ピンクボタン
「ほっかいどうだいすき♡」のテキスト
札幌時計台・東京タワー・牛・狐・羊・ラベンダー畑
下のアイコン6つ（ラベンダー・牛・味噌汁・ソフトクリーム・メロン）
周りの牛乳マグ・北海道みやげ箱・地図

ぜんぶ完璧に保持されてる。

でも同じ画像・同じプロンプトでもう一度やったら今度は元画像を完全無視。。

「あれ…？さっきは完璧だったのに、今度はなんで参照してくれないの⁇」

ここで、めちゃくちゃ大事なことに気づきました。

見落とし注意

これ、めちゃくちゃ地味なんですが、超重要なポイントです。

Flow で参照画像を効かせるには、

メディアをアップロード
アセット一覧から画像を選択
「プロンプトに追加」ボタンを明示クリック ← ここ
プロンプトに <image> タグで参照が紐付く
生成

この 3番が大事みたい。

参照が聞いてなかった動画のとき、

アップロードはしたけど「プロンプトに追加」を押してなかった

んです🥹

つまり、Omni はテキストプロンプトだけで生成してた。

「Omniが弱い」じゃなくて、

「私がOmniに参照画像を渡してなかった」

が真相でした😳

参照できてなかった動画↓

参照できてた動画↓

バリエーション検証：手で持ち上げる動画

念のため、別パターンも試しました。

「手で玩具を傾けたら、中身が動く」インタラクション系。

A hand gently tilts the same vintage Hokkaido water toy on a sunlit
wooden desk. As it tilts, the colorful rings, hearts, stars, and tiny
trees inside cascade and float with realistic water physics.
Snowflakes drift across the illustrated landscape. Soft warm window
light, shallow focus. Slow oner shot, hyperrealistic photography.
Keep the toy design exactly identical to the reference image.

結果がこちら。

手の指まで自然✨玩具を持ち上げる動きも違和感ゼロ。

中のリングたちは傾きに合わせて動いて、雪片は舞い、構図は崩れず。

Omni、物理シミュレーション部隊として本当に強かった。

公式プロンプトガイドの存在、知ってましたか？

これも検証中に発見した、地味だけど超大事な情報。

実は Google DeepMind が、Gemini Omni の 公式プロンプトガイド を公開してます。

How to create effective prompts with Gemini Omni — Google DeepMind

ここに、5要素プロンプト構造とかカメラ用語とか、コツが全部まとまってます。

抜粋すると、こんな感じ☺️

プロンプトの5要素

Shot framing and motion（フレーミングとカメラ動作）
Style（ビジュアルトーン）
Lighting（光源と質感）
Location（シーン設定）
Action（登場人物・物体の動きと相互作用）

推奨長

20-50語 / 3文

カメラ用語の例

static / locked off / fixed（固定）
push in / punch in / dolly zoom（寄り）
natural smartphone zoom / film camera / webcam style
one continuous shot（=oner）

対話編集の魔法ワード

"edit this keeping everything the same. add ..."

これを使うと、細部を保ったまま 要素を追加できるそうです🥹

私もまだ全部試しきれてないので、これ次の検証ネタですね。

とはいえ毎日50クレジットもらえるんですが、8秒の動画ひとつで25クレジットとかなので、検証はなかなか厳しい😭

今回のもたまたまうまく行っただけの可能性あります😅

まとめ：今日の学びベスト3

検証やって見えたこと、3つに集約しますね☺️

1. Omniの本領は「物理シミュレーション × プロダクトショット」

キャラの一貫性じゃなくて、世界の物理を再現するのが本領。

プロダクト写真・流体・粒子・自然光が絡む素材で本気を出す。

2. Flow には「プロンプトに追加」という地味な罠がある

アップロードしただけじゃ参照されない。明示クリックが必須。

「Omniが弱い」って感じたら、まずココを疑う。

3. 公式プロンプトガイドは絶対に読むべき

5要素構造・カメラ用語・対話編集の魔法ワード、全部書いてある。

自己流より圧倒的にコントロールできるようになる。

次に試したいこと

ここまでで気になってる、未検証ネタを置いておきますね。

アバターを作成・・・って何！

クレジット復活したら試してみます！

進捗あったら、また書きますね。

さいごに

Gemini Omni、Flow 全員開放で 1日2本まで無料 で試せるようになりました。

これから触ろうかなと思ってる方へ、私からの 最初の3アドバイス はこれです。

「プロンプトに追加」を絶対に押す（これだけで結果が激変します）
物理が絡む素材を選ぶ（プロダクト写真・流体・自然光）
公式プロンプトガイドを最初に読む（自己流より100倍速い）

新しいモデルに触れるの、すごくワクワクしますよね…！

「ここもっと知りたい」「ここ詳しく聞きたい」「こういう方法うまく行ったよ！」などあったら、コメントかリプで教えてください✨

私もまだ全然乗りこなせてないので、一緒に発見していけたら嬉しいです！

このポストについてのディスカッション

もっと続けますか？