DALL-E3 の画像生成が凄いと、Twitterで流れてくるので、確認。
※ プロンプトは、英語で指定
※ 画像は取捨選択せず、最初に出力された4枚のみ使用
「渋谷、ストリートスナップ」
DALL-E3
Midjourney 5.2
Stable Diffusion
渋谷の街を、適切に出力してるのは、DALL-E3だが、まだ不自然。
最小限の単語で、指定したので、プロンプトの巧拙の影響が大、なのだろうけど、
“自然なストリートスナップ”を作るのは、まだ、難しそう。
ただ、DALL-E3は、ChatGPT経由だと、
適切なプロンプトを補足してくれるので、かなりラクではあるのと、
画像生成aiは、”被写体がカメラのほうを見ない” という指定が、通らないことが多いので、
“ストリートスナップ”という点では、DALL-E3 のみ、成立している印象。
「部屋、東京、20代、独身、TOKYO STYLE」
DALL-E3
Midjourney 5.2
Stable Diffusion
DALL-E3 は、”現役の写真家の名前” は、指定不可とのこと。
ただ、”20代、独身” の部屋にしては、どれも不自然で、
ギリギリ、それっぽいのは、Midjourney 5.2
「大量の本、本棚、部屋、書斎、広い机、読書する女性」
DALL-E3
Midjourney 5.2
Stable Diffusion
” 「TOKYO STYLE」っぽい部屋 ” という画像を作るのも、まだ難しそう。
ただ、それっぽさという点では、Midjourney 5.2 が、いまのところ、まだ有利。
DALL-E3は、サーバーが混雑してるらしく、4枚中2枚しか、出力されないことも多し。
試しに、同じプロンプトで、連続して生成してみると、
こんな画像が、続けて出たりもする。
ちゃんと、その都度、生成してるようでもあり、
特定の風景・構図で、パーツを組み合わせてるようでもあり。