Stable Video Diffusion

2023/11/23 日記

Stable Diffusion の動画版　「Stable Video Diffusion」が出ていたので、
早速、チェック。

語句指定ではなく、１枚の画像を、random seed にて、お任せ変換。
動作確認するだけなので、縦横比も、未修正。

Stable Diffusion系なら、ローカルで動くので、エロでも使えそうだが、
現状では、あくまで「研究用」らしく、イカンのかもしれない。
　
　
元画像

↓
Gen-2

Stable Video Diffusion

よもや、こう動くとは。　想像の上を行く凄さではあるが、左の女性、右目と左目の形が違ってしまうのは、少々、いただけない。　通行人の動きも変だけど、現状では許容範囲。

　
元画像

↓
Gen-2

Stable Video Diffusion

１枚目とは対照的に、こちらは、カメラの動き、女性の顔の変化など、いろいろとダメ。　もろもろ、良いところなし。あれだけうまく変換した１枚目と、どの要素が、違うのか。

　　
元画像

↓
Gen-2

Stable Video Diffusion

花火の描写も、Gen-2のほうが良い。　AIは、花火の認識が得意、というわけでも無いのね。

　
元画像

↓
Gen-2

Stable Video Diffusion

ズームしてるだけでは…。　おかしな世紀末感はあるが、Gen-2のほうが、圧倒的に良い。

元画像

↓
Gen-2

Stable Video Diffusion

やや、大雑把だが、動きは悪くなし。　雲が動き、自分も動いて、散歩してるような気分に。

画像１枚で、４秒の動画を作るのに、７～８分かかった。

まだちょっと、当たりはずれはあるけれど、ここから、進化する一方であることを思えば、期待はもてそう。

当たりはずれがあるほうが、出来上がりを待つワクワク感があるので、
いまや、どんな指定をしても、そこそこ良い画像を作ってくれる、画像aiより、楽しみがいがあるのかも。