「本気の育毛日記」2周年!真実を伝えます

【完全版】AIイラストで2人(複数)キャラクターを完ぺきに生成する方法

「2人(複数)キャラクターを生成したいのに、服の色が混じったり、指示通りのポーズになってくれない…」

こんにちは、本槻優子です。

複数のキャラクター生成は、AIにとっても難しい分野。
そこに私たち人間が正確なプロンプトを指示しなくてはならないので、もう大変だよね。
けれど残念ながら、「BREAK」というプロンプトさえ指示すれば解決するなんて呑気な解説があふれているけれど、現実はそんなに甘くない。

そこで今回は、Stable Diffusionとナノバナナに絞って、複数(2人)キャラクターを確実に生成する方法を解説していくよ。
私が1,000回以上(※ガチです)生成した経験を踏まえた記事だから、きっとあなたの役に立てるはず。

この記事を読めば、あなたは自分の思い描く通りの2人のキャラクターを、運任せではなく、あなたの実力で生成することができるようになるわ。

さて、ひとみちゃん。あなたも一緒に学ぶように。

ひとみ:
え?あ…はい(いきなりの指名!?)。

2人(複数)のキャラクターを生成するための黄金テンプレート

結論から言うと、AIイラストで2人のキャラを生成するためのプロンプトの順番は以下の通りよ。

【簡略版】とにかくサクッと分けたい!

  • [品質] + [全体の背景] + [1人目の特徴・位置] + [2人目の特徴・位置] + [禁止事項]

このテンプレートの詳しい解説をこれからしていくね。

何も考えずに二人のキャラを生成してみた

まず上の画像を見て。

ひとみ:
はい。私が生成した画像です…。

まるで「手だけカオス」だね。

ひとみ:
ひどいです!私はちゃんと二人の女性が戦っているシーンを生成したつもりです。
悪いのは、その通りに生成してくれないAIなんです!

AIに文句言う前に、自分のプロンプトの『解像度』を疑いなさい。
AIは放っておくと、つい「手抜き」をしたくなるものなの。
二つことを別々に考えるより、一つにまとめて適当に平均を出すほうが楽だからね。
そんな風に「ごちゃ混ぜ」になった情報を、プロンプトを使って丁寧に取り分けてあげるのが、私たち人間の役割よ。

ひとみ:
じゃあどうすればいいんですか?

そうね。今回は、画像生成でよく使われるStable Diffusionナノバナナに絞って解説するね。

Stable Diffusion編:分割プロンプト「BREAK」を使おう

Stable Diffusionにおいて、プロンプトは単なる「お願い」じゃなくて「数値」。
AIは一度にたくさんのことを覚えるのが苦手で、だいたい「75文字分(トークン)」くらいごとに区切って考えているの。その区切りを無理やり「リセット」して、AIの頭をスッキリさせる魔法の合図がBREAK構文よ。

失敗:BREAKを使わなかった時の例

AIイラスト:BREAKを使わなかったプロンプト例

日本語プロンプト:
アニメスタイル、横顔、銀色のボブヘア、青い目、青い服、剣、女性、黒のポニーテール、赤い目、赤い服、槍、女性、戦闘、荒野
英語のプロンプト:
Anime style, side view, silver bob hair, blue eyes, blue clothing, sword, woman, black ponytail hair, red eyes, red clothing, spear, woman, fighting, wilderness

このプロンプトの狙いは、ざっくりというと、「女性同士の剣と槍の戦い」ね。
でもこのプロンプトは、女性の特徴をただ並べただけ。
その結果、2人の髪の色や形が指示通りにいかず、服も赤と青の区別なく両者に反映されちゃったわけ。
AIは2人目の説明はどこから始まるのかを判断することができなかったようね。

ひとみ:
つまり、指示する側がプロンプトを区切らなかったため、AIはそのとおりに区別しなかったということですね。

では、私が作った成功例を見てみましょうか。

成功:BREAKを使ったときの例

AIイラスト:BREAKを使ったプロンプト例

日本語プロンプト:
アニメ風、傑作、最高品質、女性二人、対面戦闘、激しい戦闘、火花が散る、モーションブラー、荒野の戦場、横顔、ローアングル、BREAK、左の女性、銀髪、ボブヘア、青い目、青い布の服、真剣な表情、歯を食いしばる、1本の剣、斬撃、BREAK、右の女性、黒髪、ポニーテール、赤い目、赤い金属鎧、笑い、槍、斬撃、
英語プロンプト:
Anime style, masterpiece, highest quality, two women, face-to-face combat, intense combat, sparks flying, motion blur, wilderness battlefield, profile, low angle, BREAK, woman on the left, silver hair, short bob, blue eyes, blue cloth clothing, serious expression, clenching teeth, one sword, slashing attack, BREAK, woman on the right, black hair, ponytail, red eyes, red metal armor, laughing, spear, slashing attack,

このプロンプトの狙いは失敗画像と同じ通り、「女性同士の剣と槍の戦い」。
今度は「BREAK」を使って、女性の特徴を区切っているわ。

まず、ローアングルの次にBREAKを入れて、その後に女性の説明を入れているよね。
これは、「今から女性の説明を始めますよ」の合図になってるわけ。
そして、一人目の女性の説明が終わったら再度BREAKで区切り、2人目の女性の説明に入る。
こうすることで、一人目の女性と二人目の女性の特徴を明確に区別することができるのよ。
結果、二人の特徴をすべて画像に反映させることができたね。

ひとみ:
なるほど。BREAKは前の説明をぶつ切りにして、次の状況説明にフレッシュな状態で入ることができるというわけですね。

優子のワンポイントアドバイス!

  • プロンプトを見ればわかるけど、女性の説明をするときに、「左の女性、右の女性」と方向を定めているよね。
    こうすることで、AIは「この女性は左側(右側)に生成すればいいんだな」と判断してくれるの。構図を指定したい場合は、前後左右、上下などの方向を指定してあげよう。
  • 今回の成功した要因のひとつに、細かい状況説明があげられるわ。
    例えば、色を指定するときに、単純に「青、赤」と指示するのではなく、「青い布の服、赤い金属鎧」というように質感何が青い(赤い)のかを明確に示してあげるとその色が反映されやすくなるよ。

でもね…。「BREAK」にはちょっとした落とし穴があるの。

ひとみ:
落とし穴って何ですか?

それは後で話すね…。

ナノバナナ編:文章で指示する文系型

ナノバナナにBREAKを使っても無駄よ。
AIの特性としては「言葉の意味」を重んじる傾向があるの。いわば、「文学少女」だと思ってね。
つまり、ナノバナナの場合は、「文章」で複数キャラクターを指示するの。

失敗:状況説明が足りない例

日本語プロンプト:
アクロバティックな動きをしている二人の女性。一人は赤い服、もう一人は青い服
英語プロンプト:
Two women performing acrobatic moves. One in a red outfit, the other in a blue outfit.

ひとみ:
これこれ! 動きのポーズを指定するといつも2人の手足が絡まるんです。まるで「人間知恵の輪」みたい。

アクロバティックって具体的にはどんなポーズなのか。2人の女性のうちどちらが赤くてどちらが青なのか。
これでは腕が絡まってしまうのも無理はないね。

成功:空間と禁止事項を明文化

日本語プロンプト:
躍動感のあるアクロバット演技。上の女性は空中で抱え込み宙返りをしており、鮮やかなネオングリーンのレオタードを着ている。それとは対照的に、下の女性は地面にしっかり立ち、黒い運動服を着ている。二人の体の間にははっきりとした隙間があり、それぞれの腕や脚は明確に分かれている。
英語プロンプト:
A dynamic acrobatic performance.The top woman is performing a tuck somersault in mid-air, wearing a vibrant neon green leotard. In contrast, the bottom woman is firmly planted on the ground, wearing a black athletic outfit. There is a clear physical gap between their bodies, and  each person’s limbs are distinctly separate.

私がこのプロンプトで特に気をつけたのは、以下の点だよ。

  • 【上下の空間の指示】:
    The top womanとThe bottom womanを明確に指定し、重力方向での位置関係をAIに叩き込んだよ。
  • 【対比の強調】:
    In contrast(対照的に)という接続詞を使うことで、AIに「これは全く別の存在だ」と強く意識させたの。
  • 【色の絶対的区分】:
    ネオングリーンとブラックという、お互いを全く汚さないコントラストの強い色を選んだよ。
    さらに、leotard(レオタード)や athletic outfit(運動着)といった素材と形状まで指定することで、AIが色を混同する余地をなくしたのよ。
  • 【物理的隙間の明示】:
    There is a clear physical gap between their bodies(二人の間にはすき間がある)とeach person’s limbs are distinctly separate(腕や脚はわかれている)という一文は、AIが安易に体を融合させないための最終防衛線。これを入れないと、AIはすぐに融合させようとするわ。

優子のワンポイントアドバイス!

  • 空間支配:
    Top / Bottomで重力方向の位置を固定して構図を固めるのよ。
  • 禁則事項の言語化:
    clear physical gap(明確な隙間)と書くことで、AIの「くっつけたい本能」を理性で抑え込むの。

【比較】Stable Diffusionとナノバナナ、どちらを使うべき?

Stable DiffusionにはStable Diffusionの、ナノバナナにはナノバナナの、それぞれに適した「複数キャラクターの切り分け方」があるのを理解しておいて。

簡単にまとめると…

  • Stable Diffusionは『計算機』。数式のように記号と重みで縛る。BREAKで物理的な区切りを作る。

  • ナノバナナは『翻訳家』。情景をありありと描写して聞かせる。

こうして見てみると、理系と文系に似てるわね。
SDは理系、ナノバナナは文系、みたいな感じ。
これを基準にして自分の得手不得手を把握してもおもしろそうだね。

どちらがいいとかはないよ。
大事なのは、AIの処理の仕方は2つのパターンがあるんだと知っておくこと。

最後に、あなたが今日から使えるプロンプトの「型」を授けてあげる。

【簡略版】とにかくサクッと分けたい!

  • [品質] + [全体の背景] + [1人目の特徴・位置] + [2人目の特徴・位置] + [禁止事項]

これを使って2人キャラクターの生成の練習に使ってみて。
もう少し細かく設定した「型」もあるよ。

【細分化版】プロのこだわりを出したい!

  1. 品質・全体設定: 全体の画質、人数(2girls)、場所など
  2. 1人目の定義: 配置(left/top)、髪、目、服の素材、ポーズ
  3. 区切り: SDならBREAK、ナノバナナなら対照的な接続詞「In contrast(対照的に)」
  4. 2人目の定義: 配置(right/bottom)、髪、目、1人目と違う素材の服、ポーズ
  5. 禁止事項: 「重ならない」「腕は独立している」「隙間がある」

ひとみ:
よし、さっそくこのテンプレートで生成してみます!

私が実際に「剣士の決闘シーン」を生成して見えた真実

私が実際に生成して気づいた、複数キャラクターの生成の難しさを2つ話すね。

まずは、「BREAKの落とし穴」について。
使っているAIツールによっては、BREAKが全く機能しないことがあったの。
ナノバナナもそうだけど、そのほかのAIツールでもまったく無視されるなんてザラだったよ。

例えば、BREAKを使っても色の混ざりや構図の違いは起こってしまうことが多々あったの。
下の画像を見て。

この画像のプロンプトはStable Diffusionでローラを設定したもので、ガッツリBREAKで指示して作ったものだったんだけど、全く効果なし。
むしろ、めちゃくちゃな仕上がりになってしまったよ。

もうひとつ、BREAKが効いてないんじゃないかと思ったのは、下の画像が生成されたとき。

剣の根元にBREAKと書かれているのがわかる?
イラスト自体に文字が浮かんでいるということは、BREAK本来の区切りの役割ではなく、ただの文字、もしくは言語としてAIに認識されたのかもしれない。
結果、AIは「BREAKという単語をイラストに反映させればいいのかな」と考えたのかもね。
これはあくまで私の考えだけれど。

ひとみ:
えっと…。じゃあBREAKはあまり意味をなさないんですか?

意味がないわけではないと思うけど、個人的にはあまり使わないかな。

ひとみ:
じゃあどうすればいいんですか?

ひとつは、ナノバナナのような言語系のAIで文章を書いて2人を生成してもらう。
もうひとつは、ガチャ要素になるけど、何度も生成してこれだ!というものを見つけ出すか。

少なくとも最低限、以下のことを試してから判断してね。

【今日紹介したプロンプトを試せるチェックリスト】

  • 「1人の女性」、「もう一人の女性」というようにくくりを作った?
  • 左右、または上下の配置を言葉で指定した?
  • 二人の「色」だけでなく「質感(素材名)」を変えた?
  • 「重なり合わない」という禁則事項を英語で入れた?

【簡略版】とにかくサクッと分けたい!

  • [品質] + [全体の背景] + [1人目の特徴・位置] + [2人目の特徴・位置] + [禁止事項]

このチェックリストと型がいわば複数キャラクター生成の基本だよ。
まずはナノバナナでこのチェックリストを使って感触を確かめてみて。

ひとみ:
なかなか2人のキャラクターを生成するのは難しそうですね。

そうね。だからこそ、最終手段を使おう。

ひとみ:
最終手段があるんですか!?

えぇ。それは添付画像を使うこと。
ナノバナナでは添付画像をつけることができるから、自分で書いた2人のキャラクターの成り形や構図を簡単に書いて、画像として貼り付けるの。

例えば、下の画像を見てみて。ひとみちゃんが書いた下手くそな絵よ。どんな意図があるの?

ひとみ:
下手じゃないです!苦手なだけです~。
ザックリ言うと、ポニーテール女子とショートヘア女子が、アフタヌーンティーを楽しんでいるシーンですね。

 

なるほど。じゃあ私が状況を付け足してプロンプトを指示してみるね。

プロンプト(日本語):
アニメスタイル、傑作、最高品質、2人の女性、青空、緑の木々、カフェテラス、白くて丸いテーブル、アフタヌーンティースタンド、コーヒーカップ、一人目の女性、左に座る、黒髪、ポニーテール、赤い綿製のタートルネック、コーヒーカップを持つ、笑顔、相手を見る、話す、二人目の女性、右に座る、銀髪、ショートボブ、黒い革のジャケット、パンケーキを食べる、澄ました表情、相手を見る、二人は重ならない、隙間がある

このプロンプトでできたのが、下の画像ね。

ここで大事なのは、「プロンプトはしっかり書くこと」
プロンプトで細かい指示を出さないと、添付画像には近いけどどこが違う画像が出てきてしまうの。

下の画像は、添付画像を乗せて、単純に「アニメスタイル、二人の女性がアフタヌーンティを楽しんでいる」というプロンプトを指示したものよ。

左の子なんて席を立ってしまってるよね。二人ともこっち向いているし。
でもまぁ、添付画像のひとみちゃんの絵が下手過ぎて、左の女の子は立っているように見えるけど。
もし、二人の女性がアフタヌーンティーを座りながら楽しんでいるというイメージなのであれば、プロンプトでしっかり「座った女性」であることをAIに指示することが重要ね。
プロンプトの重要性がわかったかな?

ひとみ:
はい。確かに自分で書いた絵は下手ですけど…。「添付画像+詳細なプロンプト」で確実な2人のキャラクターが生成できるんですね!

そう。では、ひとみちゃん。
これで解説は終わり。早速2人のキャラクター作りを楽しんでね。

ひとみ:
わかりました!まずはナノバナナで文章でプロンプトを書いてみようと思います!
もう一度、チェックリストをおさらいしますね。

【今日紹介したプロンプトを試せるチェックリスト】

  • 「1人の女性」、「もう一人の女性」というようにくくりを作った?
  • 左右、または上下の配置を言葉で指定した?
  • 二人の「色」だけでなく「質感(素材名)」を変えた?
  • 「重なり合わない」という禁則事項を英語で入れた?

【簡略版】とにかくサクッと分けたい!

  • [品質] + [全体の背景] + [1人目の特徴・位置] + [2人目の特徴・位置] + [禁止事項]

Q&A

Q:BREAKを使っても色が混ざったり構図が全然違うものになったのですが、どうすればいいですか?

A:先ほど紹介したチェックリストをもう一度ていねいに確認しよう。2人の女性の特徴をしっかり練ってからプロンプトとして並べてみて。
AIはパターンが崩れると混乱しやすいから、女性の特徴を書いたプロンプトの順番は2人とも同じ順序で並べよう。
それでもダメなら、あとはひたすら生成を繰り返して修正していくこと。生成ガチャと呼ばれてしまうけど、イメージ通りのAIイラストが欲しいのなら、あきらめずに何度もトライしてね。

ひとみ:
実際、優子さんもたくさん練習して生成してましたもんね。一発で思い通りの画像が作られることは稀(まれ)と思ったほうがむしろいいですよね!

さて、あとは実践あるのみ。頑張ってね。

執筆:本槻優子(サポート:ひとみ)

AIイラストを最高の出来にするテクニックはまだまだあります。詳しい内容を知りたいあなたは下記の記事をご覧ください。
>>関連記事:【完全版】あなたのイメージどおりのAIイラストの作り方を徹底解説!を読む

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です