ついにここまで来た。Gemini Omniの動画生成が強すぎる!
5月末のカンファレンスの時にアップデートがあるとは思っていましたが・・・
やっぱり、と言っていいのでしょうか?Googleの「Gemini Omni」(動画はVeo4?なんでしょうか)が発表されました。
今回特に驚いたのが「動画生成機能の強化」。
単なる画質アップではなく、「動き」「演出」「理解力」が一段上がっていて、細かいプロンプトを設定しなくても「ある程度」いい感じにしてくれます。
今回のアップデートで何が変わった?
主な進化ポイントはココ!
- 動画生成の自然さ向上
- キャラクター維持性能アップ
- カメラワーク強化
- 指示理解能力改善
- 長尺生成の安定化
- シネマティック表現強化
- テキスト→動画の一貫性向上
日本語テキストが崩れない(ほとんど)
試しに、新しくなったGeminiに以下のプロンプトを入れてみました。
「AIでDXがはかどります!」と工事現場で壁にペンキで文字を書く様子
しかも、今まで「Veo3」は8秒の動画だったのですが、OmniといいますかVeo4というのかわかりませんが、2秒も長くなっている!日本語のセリフも大丈夫みたいですね!
実際に触って感じたこと
以前は「1枚絵を動かした感」が強かったんですが、
今回はカット演出として成立するレベルに近づいていました。
動画生成の元ネタに「動画」を入れることもできる!


とにかく画質のクオリティが半端ない!
「シーン設定」を2つしてみました。そして、静止画を2つ上げてケイコちゃんのテニス試合シーンを生成してもらいました。まあ、いろいろツッコミどころ(テニスコートが狭い、ボール一回落ちてるやん!など)満載ですが、画質やエフェクト、アナウンスの日本語などがしっかり入っているので、以前のバージョンより格段に使える素材になっています。あと、「動画」を素材として入れることもできるようになりましたので、一回生成した動画を作り直すにもよいかもしれません。ちょっとGPTっぽく「対話」のメモリで作れるようになっている側面もあるでしょう。
何が一番ヤバいのか
一番大きいのは「動画制作の敷居」が急激に下がったことでしょう。
これまでAfter Effectsや3DCGが必要だった表現が、動画を作ったことがない人でも手軽にAIプロンプトだけでかなり近づける時代になってしまったとも言えます。
OpenAIの「Sora」が現在廃止になってしまったこともあり、「いわゆる3大AI」の中で動画を作るとしたら現状はGeminiになってしまいます。
Gemini Omniは、その流れを一気に加速させる存在になり、他社もまたアプデの追撃をしてくるでしょう(期待)
リアルすぎて違った意味でヤバイ一面も
野球場での始球式の動画を作ってみたのですが、かなりクオリティ高くて「すごい!できた」と思った最後の場面で、実在するメーカーの商品が出てきてしまったのでこれはさすがに使えないですね・・・。ということがGoogleではよくありますので、お気を付けくださいね!

有料課金に踏み切れないアナタへ
「AIって無料で十分じゃない?」
今週もいろいろな方々にお会いしましたが、そう思う気持ちはかなり分かります。
実際、最近の無料AIでも相当なことができます。
ただ、今回のGemini Omniのような動画生成AIを触ると、一度世界が変わります。
特に動画系は、画像AIよりさらに桁違いに計算コストが重い世界です。
1枚の画像ではなく、「数十〜数百フレーム」を連続生成しながら、キャラクターの整合性、カメラワーク、動き、光、時間変化まで維持する必要があります。
これって裏側では、とんでもないGPU計算とトークンコストが動いています。(半端ない電力)
だからこそ、無料枠だけではどうしても制限が強くなります。
逆に言えば、月数百円〜数千円レベルの軽い課金だけでも、一気に「本気のAI体験」へ入れる時代になりました。前回紹介のMV「SYNAPSE CITY」のような音楽動画も、一昔前であれば最低数百万円~数千万とかで数か月の製作費や撮影許可だったり、タレントの雇用などものすごいコストと時間がかかっていたと思います。
画像生成、動画生成、キャラクター維持、シネマティック演出、AI編集、AIアシスタント。
これまで専門ソフトや高性能PCが必要だった世界が、今は個人でも触れるようになっています。
特にクリエイター系の人は、Adobeの月額課金と同様に必要なものとして「創作速度を加速する投資」と考えるとかなり価値があります。
実際、自分も触っていて感じるのは、
「AIをただ使う人」と「AIを深く使い込む人」で、これから数年でかなり差が広がるということです。
もしまだ無料だけで止まっているなら、まずは一番安いプランでもいいので試してみるのをおすすめします!
たぶん最初に感じるのは、「え、もうここまで来てるの?」という驚きだと思います。

