【前回】
実は作って公開した後に気づいたのですが、音声にパチパチとクリッピングノイズが入ってる・・
作ってる時は自分のPCの処理速度のせいでノイズが出てるだけだと思い込んでた。
どの段階でノイズが入ったのかソースを遡って調べてみるとなんと元々の音声AIの時点から入ってた。
それで他にも気に入らない所とかもあったので別の音声AIで作り直す事にしました。
この音声AIは現時点では世界最高峰の性能を有してると言われています。
その代わり、今まで使ってたAIみたいに大量には生成できなくて少ししか作れない。
(課金すればいいのですが)
【作ったもの】
最初のバージョンと比較用に両方置いておきます。
【初回版】
【修正版】
我ながら、間抜けだと思うのが「てにをは」とか細かい日本語のおかしい所が毎回作ってる時は気づかず公開した後にわかって後悔。
声と絵のマッチング感は初回の方が良いんですよね。
あと、これだけの長さのものは初めて作ったの(MVは除く)ですが、
「セリフの長さ」と「カットの長さ」を合わせるのが大変なんですよね。
そして動画生成AIの
・複数キャラクターを使い回す
というのは今回のメインテーマだったのでこれは割と上手くいったとは思うのですが、その代償としてリップシンクは省略したのでやっぱり違和感はありますね。
現状何もかもできるという動画生成AIは存在しないので、複数のツールを併用しないといけないのですが、それをやったとしても、例えば一つの画面に複数の人物がいる時のリップシンクはこちらの意図通りに出力されることはまずないので、その点一つとってもこちらの思う通りのカットというのは難しい訳です。
後は色々上げだしたらキリがないのですが、音声の方は相変わらずイントネーションがおかしいところが多々ありますし、絵も音もまだまだ理想には程遠いですね。
ということで、一旦動画はお休みして別のことに力を入れたいと思います。
動画はネックになってる箇所が改善されて、これまで作ったものより確実に理想に近づけると分かった時点でまた再参入したいと思います。