かなりの無茶ぶりにも対応できる、ChatGPT-4o + 他の画像生成AI

 

ChatGPT-4o 無料ユーザーにも解放となりましたが、無料ユーザーはChatGPT-4oの画像生成は使用できません。

ChatGPT-4o にプロンプトを出力してもらって、そのプロンプトを使って、他の画像生成AI(Stable Diffusion, Microsoft Copilot, Adobe firefly等)で生成することになります。

その方法を書きました!


まず、ChatGPT-4o の方で、

#命令文:
あなたは、最高のアートディレクターです。
{注文}と{考慮する事}を元に{制約条件}に従って、最高の作画アイディアの詳細を記述して下さい。

#考慮する事:
・{#注文}から構成要素を抽出し、要素ごとに、状態、振る舞い、他の要素との関連性、他の要素に与えている影響、他の要素から受けている影響等を考慮
・人物に関しては、服装、髪型、表情、年齢、性別などの外見の特徴、人物の表情や心境や心象風景も考慮する
・オブジェクトの配置、カメラの視点、画角は、主要なオブジェクトがはっきり見え、画角内の収まるように工夫する
・必要に応じて、シーンに適切な照明やVFX、カメラ、レンズ、シャッタースピード等も考慮する。

#制約条件:
・{#注文}に従って、コンテンツポリシー違反のない作画アイディアの詳細を考える。
・画像生成の専門家に1枚の画像で表現してもらう事を前提に作画アイディアの詳細を記述する。
・できる限り長く詳しく作画アイディアの詳細を記述すること。
・日本語で記述すること。
・無言で作画アイディアの詳細を記述すること

#注文:

#出力:
【作画アイディアの詳細】

 

ここまでを送信し、【作画アイディアの詳細】が出力されたら、次に、

 

#命令文:
あなたは、最高のデザイナーです。
{制約条件}と【作画アイディアの詳細】に従って可視化するためのプロンプトを出力してください。

#制約条件:
・プロンプトの頭に、"hyper realistic digital portrayal of "を必ず付けること。
・プロンプトは500文字以内の英語で、可能な限り詳しく記述すること。
・無言で1つのプロンプトの出力を行うこと

#出力:
プロンプト:

 

と、入力し、プロンプトが出力されるのを待ちます。

※プロンプトは500文字以内の英語で、可能な限り詳しく記述すること。

の部分は、500文字以内となっていますが、多くの画像生成AIの上限が500文字以内であることが多いので、500文字としています。

画像生成AIによって、上限が違いますので、それに合わせて書き換えて下さい。

プロンプトが出力されたら、コピーして、ご利用の画像生成AIのプロンプト入力欄に貼り付けて生成してください。

 


では、例を見て見ましょう。

--- 入力 ---

#命令文:
あなたは、最高のアートディレクターです。
{注文}と{考慮する事}を元に{制約条件}に従って、最高の作画アイディアの詳細を記述して下さい。

#考慮する事:
・{#注文}から構成要素を抽出し、要素ごとに、状態、振る舞い、他の要素との関連性、他の要素に与えている影響、他の要素から受けている影響等を考慮
・人物に関しては、服装、髪型、表情、年齢、性別などの外見の特徴、人物の表情や心境や心象風景も考慮する
・オブジェクトの配置、カメラの視点、画角は、主要なオブジェクトがはっきり見え、画角内の収まるように工夫する
・必要に応じて、シーンに適切な照明やVFX、カメラ、レンズ、シャッタースピード等も考慮する。

#制約条件:
・{#注文}に従って、コンテンツポリシー違反のない作画アイディアの詳細を考える。
・画像生成の専門家に1枚の画像で表現してもらう事を前提に作画アイディアの詳細を記述する。
・できる限り長く詳しく作画アイディアの詳細を記述すること。
・日本語で記述すること。
・無言で作画アイディアの詳細を記述すること

#注文:
・テーマ : 街の中に居る少女
・少女の性格 : 天真爛漫、明朗快活
・街の状態 : 少女の性格と真逆の状態
・日時 : 昼
・季節 : 真夏

#出力:
【作画アイディアの詳細】

--- 出力 ---

【作画アイディアの詳細】

街中にいる天真爛漫で明朗快活な少女のイラストを一枚制作してください。以下の詳細を元に、構成要素とシーンの配置を考慮してください。

少女の描写
服装: 明るい色のサマードレスを着用。ドレスはひまわりのような黄色で、軽やかに揺れるデザイン。
髪型: 髪は肩までの長さで、自然なウェーブがかかっている。髪の色は明るい茶色。
表情: 大きな笑顔で、楽しそうにしている。目は輝いている。
年齢: 8歳から10歳くらい。
性別: 女の子。
心境や心象風景: 無邪気で楽しそうに街を歩いている。ポジティブでエネルギッシュな雰囲気を感じさせる。
街の描写
状態: 少女の性格と真逆の状態、つまり、陰鬱で静かな雰囲気。建物は古びていて、色褪せている。ゴミや落書きが目立つ。人通りが少なく、寂れた感じがある。
オブジェクトの配置: 少女を中心に据え、周囲に古びた建物やゴミが散乱している路地を配置。建物の窓や壁には落書きや汚れがあり、店のシャッターは閉まっている。
照明: 日中の自然光を利用。強い夏の日差しが差し込んでいるが、街全体はどこか薄暗く感じる。
カメラの視点、画角: 少女を中心に、彼女の楽しげな姿が際立つように配置。全体の構図は広角で、背景に街の荒廃した様子がはっきりと見えるようにする。
その他の要素
他の人物: 必要に応じて、遠くに通行人が見える程度で良い。彼らは無関心で、無表情に歩いている。
VFX: 特に不要。リアルな描写を重視する。
シーズン感: 真夏の暑さを表現するため、道路や建物の影が短く、強い日差しを感じさせる描写を取り入れる。
この指示を元に、少女の天真爛漫な様子と対照的な街の雰囲気を一枚の画像で表現してください。

--- 入力 ---

#命令文:
あなたは、最高のデザイナーです。
{制約条件}と【作画アイディアの詳細】に従って可視化するためのプロンプトを出力してください。

#制約条件:
・プロンプトの頭に、"hyper realistic digital portrayal of "を必ず付けること。
・プロンプトは500文字以内の英語で、可能な限り詳しく記述すること。
・無言で1つのプロンプトの出力を行うこと

#出力:
プロンプト:

--- 出力 ---

hyper realistic digital portrayal of a cheerful, energetic young girl walking in a gloomy, rundown city. The girl, around 8 to 10 years old, has shoulder-length wavy light brown hair and is wearing a bright yellow summer dress that sways lightly. She has a big smile and sparkling eyes, exuding a positive and lively vibe. The city around her is in stark contrast, with old, faded buildings covered in graffiti and dirt, and scattered trash in the alleys. The streets are mostly empty, with a few distant, indifferent passersby. The scene is lit by strong summer sunlight, casting short shadows and a bright yet somewhat darkened atmosphere. The girl is at the center, highlighting her joyful presence amidst the decayed surroundings.

 


この出力されたプロンプトを、いくつかの画像生成AIに入力して生成してみました。

 

Stable Diffusion

ローカル環境にインストールすれば、無料で無制限で使えますが、高価なグラボが必要になります。


Leonald.ai

1日150クレジット無料で使えます。(1回の生成に10~15クレジット使うので、1日10枚は生成できます。)



Microsoft Copilot

DALL-E3を使用していますので、ChatGPT Plus の画像生成に最も近い感じですが、アスペクト比が1:1に固定となります。

無料で使用可能です。

 

Adobe Firefry

Adobeのサブスクリプションに加入していれば、利用できます。

クオリティーは、もう少し頑張ってほしい感じです。一応最新モデルでやっているんですが・・・

 

2024年06月04日