AI画像を作るときの呪文(プロンプト)の単語を(, カンマ)で区切る理由は何?
日本語の句読点(、や。)ではいけないの?
私も上記のような疑問がありましたが、どうやらカンマで区切るのには、AIにとって超重要な意味があるみたいです。
そこで今回は、画像生成AIのプロンプトで(, カンマ)を使う意味を徹底解説します。
>>書籍:「画像生成AI Stable Diffusion スタートガイド」を注文する
スポンサーリンク
もくじ
AIイラスト生成で使われる「, カンマ」の3つの意味
1. 意味がごちゃ混ぜになるのを防ぐ「仕切り」
AIは、呪文(プロンプト)を、「バラバラのキーワードのリスト」としてみています。
カンマがない場合:
例えば、「赤いリボンのロングヘアの女の子」みたいに文章のように書くと、AIは全部の単語がくっついているので、「赤」がリボンだけでなく、髪や服にも影響して全部を赤くしようと混乱するかもしれません。
カンマがある場合:
リボンは赤, 髪は長い, 描くのは女の子
というように、カンマで区切ると、カンマがそれぞれの単語の間に透明な仕切りを入れてくれます。
指示を一つ一つはっきり分けて伝えられるので、色が混ざったりする失敗が減ります。
2. 「何をどこに使うか」をハッキリさせる「整理整頓」
カンマは、「ここから次の指示だよ!」とAIに伝えます。
これにより、それぞれのキーワードが、誰(何)に関する指示なのかをAIが理解しやすくなります。
- 例えば、「女の子, 笑顔」と書くと、「笑顔」という表情の指示は、直前の「女の子」に使うんだな、とAIはすぐに理解できます。
- もしピリオド(女の子. 笑顔)を使うと、前の情報が途切れて、「誰が笑顔なの?」とAIが迷ってしまうかもしれません。
カンマは「次の指示も前の指示の続きだよ」という流れを保ってくれます。
3. 大事な指示を先に伝えるための「流れ」を作る
AIは、基本的に前に書かれた単語ほど、それを「最も重要だ!」と考えて、強く絵に反映させようとします。
つまり、カンマは、「前に書いた単語ほど重要度が高い」というルールを壊さずに、スムーズに次のキーワードにバトンを渡す役割があります。
- カンマのおかげで、「女の子」→「黒髪」→「ジャンプ」のように、一番大事な要素から順番に、AIに力を込めて描かせることができるわけです。
要するに…
カンマは、AIに「キーワードはこれとこれだよ!」とリストの区切りを明確に示し、一番大事なことから順番に反映させるための、プロンプトの基本ルールということです。
ワンポイントアドバイス
カンマの後には半角スペースを入れよう(, )
現在のAIモデルは、主に英語の膨大なデータで学習されています。
英語圏では、リストの要素を区切る場合や、分の途中で区切りを入れる場合に「, 」の後にスペースを入れるのが標準的な文章の書き方です。
そのため、AIは、この「, + スペース」という形式を、最も自然で分かりやすい「キーワードの区切り方」として見ています。
>>書籍:「画像生成AI Stable Diffusion スタートガイド」を注文する
呪文のカテゴリーが切り替わるときの「, カンマ」の影響
プロンプトは、AIに対する「命令のバトンリレー」だと思ってください。
前の命令が次の命令に情報を渡していくような感じです。
例えば、見た目の情報(黒髪、ロングヘア)を渡した後で、すぐに動きの命令(動作)を渡したら、前の見た目はどうなるのかを見ていきましょう。
答えはシンプルです。
1. 「見た目」は確定するから消えない!
プロンプトの前半(女性, 黒髪, ロングヘア)で、AIはすでに「この人は黒くて長い髪の毛なんだな」という基本設定をしっかり頭に入れました。
- 絶対に消えないルール: この基本設定(黒髪、ロングヘア)は、命令が進んでもキャンセルされることはありません。
2. 「動きの命令」は「表現」を変える!
次にジャンプするや走るなどの「動作」の命令が来るとします。
これは、AIに対して「さっき決めた見た目(黒髪ロングヘア)を、この動作に合わせて描いてね!」という指示になります。
動きの命令が加わると起こること
動作の命令は、「ロングヘア」を「もっと生き生きとした表現」に変えます。
- 動作なしの場合: ロングヘアは、ただ下に垂れた静かな長い髪。
- 動作ありの場合: ロングヘアは、ジャンプの勢いでフワッと宙に舞い上がっている長い髪に変わります。
まとめ
カンマの後に「動作」を置くと、AIは「見た目(属性)」を確定させた上で、その見た目全てに「躍動感(動き)」を上乗せします。
つまり、「ロングヘア」という属性はそのままに、「動きのあるロングヘア」へとパワーアップすると覚えておけばOKです!
>>書籍:「画像生成AI Stable Diffusion スタートガイド」を注文する
呪文のカテゴリー内に他のカテゴリーの単語を入れるとどうなる?
「黒髪, ジャンプする, ロングヘア, 女性」
このように、カテゴリー(見た目)の途中に動作が入ると、AIの処理がどう変わるか。
AIはプロンプトを左から処理するので、この順番だと、AIは「見た目」を完成させるよりも先に「動き」の命令を受け取ってしまいます。
問題点1:ロングヘアの表現が弱くなる
「ジャンプする」という最優先の命令が先に来てしまうので、その後に来た「ロングヘア」は優先度が少し下がってしまいます。
- 影響: 髪の毛の長さが中途半端になったり、期待したほど長く描かれなかったり、ロングヘアの描写が不安定になることがあります。
問題点2:動きが強くなりすぎる
「ジャンプする」が見た目(属性)を確定させる前に入り込んでしまうため、ジャンプという動きが画像全体に強烈に反映されすぎることがあります。
- 影響: 髪だけでなく、服や背景の描写が、必要以上に激しくブレているような、過剰に動的な絵になってしまう可能性があります。
結論
AIイラスト生成では、「見た目の情報(属性)」は必ず固めてから、「動き(動作)」や「場所(背景)」の情報を指示しましょう。
>>書籍:「画像生成AI Stable Diffusion スタートガイド」を注文する
プロンプトの呪文には書く順番があります!実用的な順番テンプレートを知りたいあなたは下記の記事をご覧ください。
>>関連記事:AIイラストの呪文には順番がある!実用的で役立つ「プロンプト順番テンプレート」をシェアします
プロンプトの区切りで「. ピリオド」を使ってはいけない理由
AIに絵を描かせる時、プロンプトに「,(カンマ)」ではなく「.(ピリオド)」を使ってはいけないのには、ハッキリとした理由があります。
ここでは、「女の子, 公園でジャンプ」というプロンプトで解説しましょう。
ピリオドは「強制終了」のボタン
本来の正しいプロンプトの並びである「女の子, 公園でジャンプ」を「女の子. 公園でジャンプ」にすると…。
AIは以下のように解釈します。
- AI君:「女の子って指示が来たぞ!」
- AI君:「あれ?でも次の指示の「公園でジャンプ」の前が、ピリオドになってる…」
- AI君:「ってことは、女の子の話はもう終わりで、ここで文脈がとぎれたんだな」
- AI君:「次は新しく公園でジャンプする画像を作ればいいんだな。あれ?でも、誰がジャンプするの?」
AI君の視点
- カンマ(,)の場合: 「女の子, 公園でジャンプ」
- AI君:「女の子の指示が来た。カンマだ。よし、女の子を維持したまま、次の『公園でジャンプ』の命令を実行するぞ!」
- ピリオド(.)の場合: 「女の子. 公園でジャンプ」
- AI君:「女の子の指示が来た。ピリオドだ。前の指示は終了! 次の『公園でジャンプ』は新しいタスクだ!」
このように、ピリオドはあなたが意図しないところで「前の命令を終わらせる」という強力な効果を持ってしまうため、プロンプトではカンマを使うのが鉄則なのです。
>>書籍:「画像生成AI Stable Diffusion スタートガイド」を注文する
日本語のプロンプトでもカンマを使うおう
日本語プロンプトでキーワードを区切る場合は「,(カンマ)」を使う方が一般的で、推奨されます。
AIは「外国人」だと思って話しかけよう
AIイラストを作るための基本的な仕組みは、もともと英語のデータをたくさん使って開発されました。
- 英語のルール: 英語ではリストを区切るとき、「,(半角カンマ)」を使うのが普通。
- AIの慣れ: AIは、この「,」の区切り方を「これが一番正しい区切り方だ!」と最初から教え込まれて育っている。
なので、日本語でプロンプトを書く時も、日本語の「、(読点)」ではなく、AIが慣れている「,(半角カンマ)」に合わせてあげる方が、AIはスムーズに指示を理解してくれるということです。
「、」は区切る位置で意味が変わってしまうことがある
例えば、「彼女は美しく飾られた部屋に入った。」という文章を「、」で区切ってみると…。
- 「彼女は美しく、飾られた部屋に入った。」
彼女自身が美しかった。その彼女が飾られた部屋に入ったという解釈になります。 - 「彼女は美しく飾られた部屋に、入った。」
飾られていた部屋が美しかった。その部屋に彼女が入ったという解釈。
この2つをプロンプトで表すと、以下のようになります(英語)。
- beautiful woman, entering, decorated room
- beautifully decorated room, woman, entering
AIはプロンプトを左から順に処理し、左側にある単語に高い優先度を与えます。
もしあなたが「彼女」と「部屋」のどちらに美しさを反映させるかで生成される画像に違いが生まれてしまうわけですね。
つまり、
- 「彼女の美しさ」を優先したいなら、beautiful woman(美しい女性)を左側に配置する。
- 「部屋の美しさ」を優先したいなら、beautifully decorated room(飾られた美しい部屋) を左側に配置する。
このように、日本語の読点(、)の位置の違いは、AIプロンプトにおいて「美しさ」というキーワードを「女性」と「部屋」のどちらにカンマで強く連結させるか、そしてそれをプロンプトのどこに配置して優先度(重み)を与えるか、という決定的な影響を与えるのです。
読点「、」は自由度が高く、文章の意味の区切りだけでなく、「息継ぎ」をするために使われることもあります。
読点を使ったとしても、AIはあなたの意図通りに判断してくれることもありますが、あなたが何を一番強調したいのか、それを単語として一番左側に置けるかを考えなければなりません。
その点、ひとつひとつを単語として、カンマ「, 」で区切るほうがAIは安定して判断してくれます。
>>書籍:「画像生成AI Stable Diffusion スタートガイド」を注文する
あなたのイメージどおりのAIイラストを生成するために、多くの手法を学びたいあなたは下記の記事をご覧ください。
>>関連記事:【完全版】あなたのイメージどおりのAIイラストの作り方を徹底解説!を読む
カテゴリーを区切りたいときはピリオドではなく「BREAK」を使おう
単語と単語の間を区切る「BREAK」
BREAKは、「カンマ」よりもずっと強い区切りで、前と後のキーワードが絶対に混ざらないように、強力な壁を作る役割があります。
役割のイメージ
- カンマ(,): 「赤と青の指示だよ、少しは分けてね。」(影響が少し残る)
- BREAK: 「赤と青は絶対にまざるな! ここで作業を完全に分けろ!」
BREAKを使う理由
例えば、「赤い服の女の子」と「青い背景」を描きたいのに、服に青い色が少し混ざってしまうとき。
red dress BREAK blue background
と書けば、色の影響が互いに届かなくなるため、意図通りに色が分かれて安定します。
BREAKは、色やテーマが混ざるのを防ぐための、強力な仕切りということですね。
ピリオド「. 」とBREAKの違い
ピリオドとBREAKは同じように見えますが、全然違います。
確かにBREAKは、単語と単語の間に起こる影響をシャットダウンしてくれますが、プロンプト全体は、「ひとつの大きなイラスト」という目的で機能し続けます。
一方、ピリオドは、プロンプトを途中で切断し、文脈そのものを破壊してしまうリスクがあります。
BREAKとピリオドの決定的な違い
- BREAK:絵の目的も主役も変えずに、色や要素が混ざるのを防ぐための道具。
- ピリオド:絵の目的と主役を途中で強制的に終わらせてしまう、危険な区切り。
手っ取り早く「BREAK」の使い方や意味について知りたいあなたは下記の記事をご覧ください。
>>関連記事:複数キャラクター生成における単語「BREAK」の絶大な効果とは。を読む
>>書籍:「画像生成AI Stable Diffusion スタートガイド」を注文する
スポンサーリンク