Stable Diffusion の動画版 「Stable Video Diffusion」が出ていたので、
早速、チェック。
語句指定ではなく、1枚の画像を、random seed にて、お任せ変換。
動作確認するだけなので、縦横比も、未修正。
Stable Diffusion系なら、ローカルで動くので、エロでも使えそうだが、
現状では、あくまで「研究用」らしく、イカンのかもしれない。
元画像
↓
Gen-2
Stable Video Diffusion
よもや、こう動くとは。 想像の上を行く凄さではあるが、左の女性、右目と左目の形が違ってしまうのは、少々、いただけない。 通行人の動きも変だけど、現状では許容範囲。
元画像
↓
Gen-2
Stable Video Diffusion
1枚目とは対照的に、こちらは、カメラの動き、女性の顔の変化など、いろいろとダメ。 もろもろ、良いところなし。あれだけうまく変換した1枚目と、どの要素が、違うのか。
元画像
↓
Gen-2
Stable Video Diffusion
花火の描写も、Gen-2のほうが良い。 AIは、花火の認識が得意、というわけでも無いのね。
元画像
↓
Gen-2
Stable Video Diffusion
ズームしてるだけでは…。 おかしな世紀末感はあるが、Gen-2のほうが、圧倒的に良い。
元画像
↓
Gen-2
Stable Video Diffusion
やや、大雑把だが、動きは悪くなし。 雲が動き、自分も動いて、散歩してるような気分に。
画像1枚で、4秒の動画を作るのに、7~8分かかった。
まだちょっと、当たりはずれはあるけれど、ここから、進化する一方であることを思えば、期待はもてそう。
当たりはずれがあるほうが、出来上がりを待つワクワク感があるので、
いまや、どんな指定をしても、そこそこ良い画像を作ってくれる、画像aiより、楽しみがいがあるのかも。