AI画像生成の進化ってすごい!
「たった2年。(むしろ半年)ですけれど、AIの世界では数十年分の進化が起きていました。」
今回は、同じプロンプト(指示文)を使って、2023年と2025年現在のAI画像生成がどれほど変わったのかを比較検証してみたお話です。
シンプルなプロンプト:「サイボーグパンダが荒野でダンスをしてジャンプする画像を作ってください」
このシンプルかつ無茶な指示を、2つの時代のAIに投げかけてみました。
検証用プロンプト:
「サイボーグパンダが荒野でダンスをしてジャンプする画像を作ってください」
1. 2023年:Adobe Firefly(初期)の挑戦

これは当時2023年にAdobeのFireflyで荒野でダンスするサイボーグパンダを作ってみたんですが、「サイボーグ感」はパーツを貼り付けたような質感で、荒野の描写もどこか平面的な印象でした。背景と被写体の馴染み具合も、当時は「AIでこんなに作れるんだスゲー!」と思いましたが、今見ると「いかにもAIで作りました」という初期特有の粗さがありますよね。
2. 2025年12月:Google Geminiによる劇的進化

こちらは同じプロンプトでGEMINI(Nano Banana Pro)でつくってみました。メカニカルなパーツの質感、毛並みのリアリティ、そして「ジャンプしている瞬間」の躍動感が桁違いです。石の影や光彩などがきめ細かくなっています。荒野に差し込む光と影のコントラストが自然で、まるで実写映画のワンシーンのような仕上がりになりました。
比較して分かった「学習量」の差
ここで興味深い実験をもう一つ。同じ2025年12月時点で、あえて同じエンジンの後継である「Adobe Firefly」でもアンドロイドパンダを生成してみました。

結果は……「クオリティは上がっているが、方向性がなんだか微妙」。
画像としての解像度は高いものの、指示に対する解釈がどこかズレていたり、ワクワクするような絵作りには一歩届かない印象でした。一方でGoogle Geminiの圧倒的な「正解率」の高さ。これは、Googleが世界中のウェブ情報を網羅的に拾い上げ、学習に注ぎ込んでいる「学習量」の差ではないかな?と思いました。
- Googleの強み: 膨大なウェブデータから「サイボーグ」「ダンス」「かっこいい」の最大公約数的な正解を導き出すスピードと正確性。
- Adobeの現在地: クリエイティブツールとしての進歩はしているものの、Googleのような「情報の海」を味方につけた学習量の差が、出力の「センス」として現れているのかもしれません。
もちろんChatGPT 5.2でも同じプロンプトで作ってみました。

Google GEMINIとGPTどっちに課金したらいいの?とよく聞かれます。
各AIを組み合わせて使うこともアリ
よくいろいろな方から「Google GEMINIとChat GPT どっちに課金したらいいの?」この2大巨頭について聞かれますが、ワタシは迷わず「両方課金してみて、使わなくなったほうを無料版に戻してみて」と話すようにしています。課金に対してすごく腰が重くなる方も結構いますが、多くの方はどこかで「サブスクを始めたらしばらくやめてはいけない(永続)」と思ってしまっている側面があり、実はそうではなく、「サブスクの利点はすぐに辞められること」だったりします。なので、「こっちはGPTが得意」「こっちはGEMINIが得意」「意外とAdobe Fireflyなどが使える場面もあるかも?」いろいろイラストや画像に関しても特異な部分もあります。
AIは「おもちゃ」から「プロの装備」へ
2023年には「なんか面白い画像できるよね~」くらいの趣味的な「面白いおもちゃ」だったAI画像生成でしたが、2025年の今となっては、プロフェッショナルの要求に応える「頼れるクリエイティブパートナー」といってもいいくらい仕事でも使えるレベルになりました!
もちろん、法整備が追い付いていないという課題もありますが、知財の部分などをしっかり専門家などに相談しながら活用していくと、いい感じの生成ができるのではないでしょうか?ぜひぜひ自社で画像生成をできるようになりたい方お声がけくださいね!
