【AIアニメ】97%AIでOP制作してみた|GPT Image2 × Veo3.1 × SUNO5.5【LUNA CODE】

AIでアニメOP動画作ってみた!

AIで「アニメオープニング」はどこまで作れるのか?

目次

AIでテニスをするとある惑星の話・・・(おい!)

今日は完全にエンタメの話です!今回はGPT Image2 / Veo3.1 / SUNO5.5 その他もろもろを使って、
ほぼすべての工程をAIで制作した

👉実験的なAIテニスアニメ「LUNA CODE」OPを公開しました。

創作AIテニス物語「LUNAR CODE」MV楽曲(フルバージョン歌詞)

作曲:Gemini pro/Gemini Music(プロンプト:ワタス)
作詞:ChatGPT 5.2(プロンプト:ワタス)
編曲:SUNO 5.5
歌唱:SUNO 5.5(AI女性ヴォーカル)
静止画:ChatGPT 5~5.5(プロンプト:ワタス)
動画:Veo3.1,Firefly
動画編集:premiere pro (ここだけ手動)

[Japanese Lylics]
青い光、視界の奥底で (奥底で)
確率は導き出す”次の位置”って (次の位置って)
LUNAR CODEが囁く、論理の迷路 (論理の迷路)
予測された未来、そこに私は居ない
加速する鼓動、回路を焦がして (回路を焦がして)
スピードは限界、デジタルの罠
最後に決めるのはあなたです!

アルゴリズムを超え、コートへ、コートを翔けろ
運命を上書きする、その一瞬
LUNAR CODEが示す、真実の場所
LUNAR CODE、輝き放て!
LUNAR CODE、輝き放て!

軌道の向こう側、経験の重み (経験の重み)
選択の繰り返しが、私を刻む (私を刻む)
AIはただの鏡、映すは可能性 (映すは可能性)
熱い風を掴め、ラケットの先で
ロジックを捨て去り、直感を信じろ (直感を信じろ)
今、この瞬間、運命が踊る 最後に決めるのはあなたです!

アルゴリズムを超え、コートへ、コートを翔けろ
運命を上書きする、その一瞬
LUNAR CODEが示す、真実の場所
LUNAR CODE、輝き放て!
LUNAR CODE、輝き放て!

選択の果てに、答えは無い
ただ、私が居るだけ (最後は私だ!)
LUNAR CODEよ、導け
最後に決めるのはあなたです!

アルゴリズムを超え、コートへ、コートを翔けろ
LUNAR CODE、輝き放て!
LUNAR CODE、輝き放て!

(私LUNAR CODE…)

SUNO5.5が「異常にすごい」理由(音楽生成AI)

結構GPT Image2の話が今月は多いですが、MVを作るなら、今回の制作で一番驚いたのは、正直ここ。「スノ・スノ」って今まで言っててごめんなさい!「スーノ」でしたね!

SUNO5.5の音楽生成クオリティ

今までずっとウン十年もCubaseを使ってきた立場からするともう、「作曲ツールじゃない」んですよ。普通、音楽ってメロディ作って、アレンジして、ボーカル乗せて、ミックスしてっていう工程があるじゃないですか。SUNO5.5はこれ、全部すっ飛ばして完成品が出てくる。ほんとにそのまま使えるレベルで出てきます。「これ仮音源でしょ?」じゃなくて、「これもうリリースできるやつでは?」ってなる感じです。

で、さらにヤバいのがボーカルなんですよね。ここかなり大事なんですが、人間っぽさのレベルが一段違う。発音とか息遣いとか、変な違和感がほとんどない。むしろ下手な仮歌より自然だったりする。(仮歌収録という仕事が消滅したような気も)今回のLUNA CODEの曲も、正直これ差し替えなくていいんじゃないか?って思ったくらいで、そのまま作品として成立してるんですよ。

ここまで来るともう、作曲AIというより音楽生成エンジンって言った方がしっくりきます。

あと個人的に一番すごいと思ったのは、感情がちゃんと乗ることです。これまでのAI音楽って、「それっぽいね」で終わることが多かったんですが、SUNO(特にVer5.5)は違います。例えば今回のテーマでいうと、切なさとか、疾走感とか、余韻とか、そういうのをざっくり投げるだけで、ちゃんと感情として成立する曲になるんです。

これ、映像と合わせたときにめちゃくちゃ効いてきます。要するに、映像がどれだけ良くても音楽が弱いと作品にならない。でも今回は音楽側がちゃんと作品を引っ張るんですよね。ここがかなり大きかったです。

今回は結構メタル系で攻めてみたんですが、EDMとの相性が異常にいい。ビルドアップからドロップまでの流れとか、展開の気持ちよさとか、ちゃんと「AIが分かってる」感じがあります。「AIがそれっぽく作ったEDM」じゃなくて、ちゃんとクラブで鳴る構成になっています。このあたり、かなり完成度高いです。

で、ここからが一番AIっぽいところなんですが、プロンプトで音楽の演出ができるんですよね。「ちょっと切なめで、女性ボーカルで、サビで開放して」みたいなことをそのまま投げると、ちゃんとそれっぽい構成で返ってきます。つまり、作曲スキルがなくても成立する。必要なのはどういう感情にしたいかだけです。BPM135!と数値を具体的に入れてもOK。

ここまで来ると正直ちょっと怖いレベルで、結論としてはこうなります。SUNO5.5は、音楽制作の工程をほぼ破壊してる。これまで当たり前だった作曲、編曲、ボーカル、ミックスが全部一発で出てきます。

画像クリックでフルコーラス聴けます!

【オススメ】(SUNO5.5)こんなに日常をエモい曲も生成できますよ!

【J-ROCK】彼らの毎朝〜小学生男児兄弟の争い〜 karera

Composer: SUNO
Lyrics: Watasu (keyboards creative works.)
Arrangement: SUNO

[Japanese TEXT]
彼ら 彼ら 彼らは毎朝ケンカして 同じ事を繰り返す
(彼ら 彼ら 彼ら 彼ら 彼ら 彼ら) 彼ら!

<break>

彼ら 彼ら 彼らは毎朝ケンカして 同じ事を繰り返す
(彼ら 彼ら 彼ら 彼ら 彼ら 彼ら) 彼ら!
月曜日の朝午前6時 チョーナンは布団を飛び出し
真っ先にユーチューブ観始める
そして ジナンが起き出して
「オマエずるいずるい」と叫び出す

彼ら 彼ら 彼らは毎朝ケンカして 同じ事を繰り返す
(彼ら 彼ら 彼ら 彼ら 彼ら 彼ら) 彼ら!

金曜日の夜午後9時半 ジナンが歯磨き始めると
忽然とチョーナン 乱入して
後から洗面所 独占して
「オレが先だ、先だ」と叫び出す

彼らはどうでもいい事を 毎日争いケンカする
それが小学生というものか・・・
彼ら 彼ら 彼らは毎朝ケンカして 同じ事を繰り返す
(彼ら 彼ら 彼ら 彼ら 彼ら 彼ら)
彼ら! 彼ら! 彼ら!

ただ、ここ勘違いしちゃいけないのがあって、何でもできるわけではないんですよ。曲の方向性とか、世界観とか、どんな感情にしたいかとか、そこは人間が決めないとダメです。つまり、AIが作るのは音で、人間が作るのは作品。歌詞くらいはGPTと会話しながら自分で考えて作っていくのはいいのではないでしょうか?整えるのはAIでいいと思います。

LUNA CODEみたいに、AIというテーマと、人間の感情と、テニスのスピード感みたいな要素があると、SUNOが全部ハマるんですよ。だから今回、映像・音楽・テーマが全部噛み合った。この状態まで持っていけたのはかなり大きかったです。

いやほんと、ここは触った人だけ分かる領域なんですが、「音楽作る」っていう概念そのものが変わりますよね。

作品コンセプト

新千歳空港に降り立つケイコ(GPT5.2)
世界ランキング255位のケイコがひっそり北海道の実家に帰ってくる場面から始まる

話は戻りますが、「LUNA CODE(るな・こーど)」は 👉 AIと人間の境界で戦うテニスプレイヤーの物語
「AIの扱い方、AIをどう受け入れるか」というテーマでセミナー資料を作ってGPTと対話を数時間していましたところ、いつの間にか現時点で「21話」まであるAIテニスのラノベ調物語になってしまったという珍事件がありまして・・・。資料つくるより物語作ったほうが伝わりそう・・・ということで先に世界観やストーリーなどができていました。

お話の内容についてはここでは公開できるかどうかわかりませんが、もしかしたらひっそりとどこかにアップするかもしれません!(いつだろうか)

今回の制作構成

ストーリー構成GPT5.2(アプデ前に作っていました)
キャラクター設定Gemini,GPT Image2
イラストGPT5.2~5.5,Nanobanana2(Gemini)
動画Veo3.1(Gemini)、Adobe Firefly
音楽Gemini Music,SUMO 5.5
その他設定資料の取りまとめは NotebookLMで資料化
細かい設定の値や計算でClaudeを使用(ほんの少し)
最後の動画編集はAdobe Premiere pro(ここも自動化したかった!)

制作割合・時間

約97%:AI で、人間がやったのは主にこれだけ

コンセプト設計
プロンプト設計

動画の選定
カット編集の判断

これを制作する際に動画や静止画の「素材」が必要なんですが、全部が全部使えるわけもなく、プロンプト通りにうまく生成されない動画も多数あり、実際に生成した動画ファイルで「使えるもの」は半分以下ではないでしょうか・・・。

今回、実際の制作時間は数日程度だったのはあらかじめ21話分の「物語」が存在していたからできたというところがあります。カットや動きの内容はストーリーから外れなければいいかな?ということで動画の書き出しも「ストーリ自体」を読み込ませることで時間の節約と方向性のずれを防ぐことができます。

課題はまだまだてんこもり

前半のこのシーンの動画はアプデ前のGPT生成この画像から
後半の雨が降っている動画はGPT Image2生成からのVeo動画

今回よく分かったのは「動画を生成するための基になるイラストが綺麗であれば結構うまくいく」これが重要で、シーンによってはGPTImage2になる前の画像を使ったシーンと、明らかにアプデ後のImage2からの生成だよねというところがわかると思います。(Geminiで生成したところも)。今回はいろいろなAIをあえて使ってみようという実験的なところもあり、今後はまた変わってくるのではないでしょうか?とはいえ、どんどん面白い時代に突入していくことは間違いなしです!

GPT Image2だと本屋で立ち読みする場面まで短いプロンプトで再現できる!(おっとこれは伏線か?)
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次