Stable Video Diffusion

Stable Diffusion の動画版 「Stable Video Diffusion」が出ていたので、
早速、チェック。

語句指定ではなく、1枚の画像を、random seed にて、お任せ変換。
動作確認するだけなので、縦横比も、未修正。

Stable Diffusion系なら、ローカルで動くので、エロでも使えそうだが、
現状では、あくまで「研究用」らしく、イカンのかもしれない。
 
 
元画像


Gen-2


Stable Video Diffusion

よもや、こう動くとは。 想像の上を行く凄さではあるが、左の女性、右目と左目の形が違ってしまうのは、少々、いただけない。 通行人の動きも変だけど、現状では許容範囲。


 
元画像



Gen-2


Stable Video Diffusion

1枚目とは対照的に、こちらは、カメラの動き、女性の顔の変化など、いろいろとダメ。 もろもろ、良いところなし。あれだけうまく変換した1枚目と、どの要素が、違うのか。


  
元画像


Gen-2


Stable Video Diffusion

花火の描写も、Gen-2のほうが良い。 AIは、花火の認識が得意、というわけでも無いのね。


 
元画像


Gen-2


Stable Video Diffusion

ズームしてるだけでは…。 おかしな世紀末感はあるが、Gen-2のほうが、圧倒的に良い。


 

元画像


Gen-2


Stable Video Diffusion

やや、大雑把だが、動きは悪くなし。 雲が動き、自分も動いて、散歩してるような気分に。


 

画像1枚で、4秒の動画を作るのに、7~8分かかった。

まだちょっと、当たりはずれはあるけれど、ここから、進化する一方であることを思えば、期待はもてそう。

当たりはずれがあるほうが、出来上がりを待つワクワク感があるので、
いまや、どんな指定をしても、そこそこ良い画像を作ってくれる、画像aiより、楽しみがいがあるのかも。




シェアする

  • このエントリーをはてなブックマークに追加

フォローする