DALL-E3

2023/10/6 日記

DALL-E3 の画像生成が凄いと、Twitterで流れてくるので、確認。

※　プロンプトは、英語で指定
※　画像は取捨選択せず、最初に出力された４枚のみ使用
　
　
「渋谷、ストリートスナップ」

DALL-E3

Midjourney 5.2

Stable Diffusion

渋谷の街を、適切に出力してるのは、DALL-E3だが、まだ不自然。

最小限の単語で、指定したので、プロンプトの巧拙の影響が大、なのだろうけど、
“自然なストリートスナップ”を作るのは、まだ、難しそう。

ただ、DALL-E3は、ChatGPT経由だと、
適切なプロンプトを補足してくれるので、かなりラクではあるのと、

画像生成aiは、”被写体がカメラのほうを見ない” という指定が、通らないことが多いので、
“ストリートスナップ”という点では、DALL-E3　のみ、成立している印象。

　
　
　
「部屋、東京、20代、独身、TOKYO STYLE」

DALL-E3

Midjourney 5.2

Stable Diffusion

　
DALL-E3　は、”現役の写真家の名前” は、指定不可とのこと。
ただ、”20代、独身” の部屋にしては、どれも不自然で、
ギリギリ、それっぽいのは、Midjourney 5.2
　
　
　
「大量の本、本棚、部屋、書斎、広い机、読書する女性」

DALL-E3

Midjourney 5.2

Stable Diffusion

　
” 「TOKYO STYLE」っぽい部屋 ” という画像を作るのも、まだ難しそう。
ただ、それっぽさという点では、Midjourney 5.2　が、いまのところ、まだ有利。
　
　

　
DALL-E3は、サーバーが混雑してるらしく、４枚中２枚しか、出力されないことも多し。
試しに、同じプロンプトで、連続して生成してみると、
こんな画像が、続けて出たりもする。

　

　

ちゃんと、その都度、生成してるようでもあり、
特定の風景・構図で、パーツを組み合わせてるようでもあり。

関連記事