AIで思い通りの画像を生成するコツ

この画像もAIにて生成しています

AI画像生成に詳しくない方のために説明しておくと、AIに画像を生成させるためには、単語や短いテキスト文で、何を描くかをAIに指示する必要があります。この時の単語や短いテキスト文をプロンプトと言います。そして思い通りの絵を生成するのは、このプロンプト作りが肝になります。

では、どのようなプロンプトを書けばいいのか。正直これはどのサービスでどのモデルを使うかによっても異なってくるので、あくまでも一般論としてまとめておきます。

画像生成の全体イメージ

まず、AIと言われても具体的なイメージが掴めないという人もいると思いますので、現実社会で考えてみます。

今、目の前に100人のアーティストがいます。私は彼らに「かわいい犬」を描いてくれと依頼します。すると100人が100人、異なる構図、異なる画材、異なる色使いで絵を描いてくれます。

その100枚の絵の中に、私が想定していた絵があるかもしれません。ないかもしれません。とにかく全部がバラバラです。

そこで、「かわいいチワワ」の絵を描いてと依頼します。続いて「野原を駆け回っているかわいいチワワ」の絵を描いてと依頼します。最後に「春に草花の咲き乱れる高原の草原を駆け回っているかわいいチワワと一緒に走っている若い女性」の絵を描いてと依頼します。

実際にサンプルとして生成してみました。4枚目の犬がチワワなのかどうかちょっと怪しいですがw

最初は100枚がバラバラの絵だったものが、依頼を重ねるにつれてどんどん似たような感じの絵になってきます。当然思い通りの絵が仕上がってくる確率も高くなってきます。これがAIによる画像生成の、そしてプロンプトのイメージです。

プロンプト作りの重要ポイント

一般的に以下の3点が重要ポイントです

1:明確な指示

明確で具体的な指示をすることで、指示内容をAIが理解しやすくなります。例えば「4本足の毛むくじゃらな生き物」では、その意味するものは犬なのか猫なのか、もしかしたら熊かもしれません。

最初から「犬」と明確に指示すべきですが、もっと明確にしようとした場合、AIによってはゴールデンレトリーバーとラブラドールレトリーバーの区別がつかないかもしれません。それ以前に犬種までは理解していない可能性もあり得ます。そこは目の前のAIがどこまで理解しているのかをまず把握する必要があるでしょう。

2:詳細な指示

先ほどの「チワワ」の事例のように、詳細な指示をすることで、思い描くイメージに近づけていくことが出来ます。逆に自分がAIだとして考えてみてください。「かわいい犬」と言われて絵を描いたら、「こんなんじゃない」と言われても困ってしまいますよね。

じゃぁ具体的にどんな「かわいい犬」を描いて欲しいのかもっと詳しく説明してくれよ!となるでしょう。AIの気持ちになってw詳細に指示してみてください。

3:全体的な指示

前述の明確や詳細な指示と矛盾しているようですが、全体の包括的な指示も必要になります。要するに、雰囲気とか感情表現とか、絵の全体的なイメージを指示することで、AIが絵を描きやすくなります。例えば「浜辺に立つ男女」だけでは、やはりAIは困ってしまいます。

具体的に二人の服装だったり、その季節だったり、髪型だったりを指示したとしても、AIにはその二人がラブラブなのか、喧嘩中なのか、絶望しているのか、あるいは見ず知らずの二人なのかさっぱり検討がつきません。

ちょっと抽象的にはなってしまいますが、全体的にどういう雰囲気の絵を描いて欲しいのかを指示してやることも大事になります。

その他のポイント

言語

現在一般的に使用されている画像生成AIは英語を基本として作られています。もちろん日本語を含めた多言語対応になっているものもありますが、現実問題として、画像生成AIにChat-GPTやBeing CHATのように完璧な日本語理解力を求めるのは酷というもの。

日本語でプロンプトを書いていて、どうも指示内容が上手くAIに伝わっていないと思われる部分があれば、そこだけでも英語にしてみる、場合によってはプロンプト全体を英語にしてみることで、意外とすんなりクリアしてしまう場合もあります。

もちろん、英語なんてわからないという人でも大丈夫。ありがたいことに「Google翻訳」がありますw

記号

AIモデルによっては、プロンプトに一定のルールに基づいた記号の使用が認められている場合があります。詳しくはそのAIモデルごとのドキュメントなどを確認いただく必要がありますが、記号というのがどういうものか、以下にいくつか一般的なものを記載しておきます。

<>:特定の要素や特性を強調
<<>>:特定のシーン全体を強調
[]:特定のオブジェクトや要素を指定
{}:特定の属性や特性を指定
():補足情報や説明を指定

公序良俗

多くの画像生成AIは公序良俗に反する画像は生成できません。プロンプトの段階で弾かれる場合もあれば、生成された画像をチェックして非表示にしてしまうものもあります。

とはいえ、中には何でもありなサービスもありますから、個人的にどうしてもそういう画像を作ってみたいという場合は、対応しているものを探してみてください。

私は知ってるけど教えませんw

本当に大事なのは

実は思い通りの絵を描くには、ここまで述べたこと以上にもっと大事なポイントがあります。それはとにかく回数を重ねることです。「チワワ」の事例でいけば、100人に描いてもらってもダメだったら1,000人に。それでもダメなら10,000人に描いてもらうというチャレンジが必要になってきます。

回数を重ねることで、そのAIの得手不得手、理解している部分とそうでない部分など、特徴が見えてきます。AIに対するあなたの理解力が上がることで、プロンプトの精度もぐんぐん上がっていくことになります。

まとめ

ここまで長々と書いておきながら、最後に回数とか経験が大事なんて言われるとガッカリしてしまうかもしれませんが、まあ何事もそんなものです。思い通りの絵なんて描けないじゃないかと匙を投げ出してしまう前に、もう少しチャレンジしてみてください。

ここに書いていることは一般的な話ばかりであり、人それぞれが感じ取れるコツのようなものがたぶん回数を重ねることで見えてくるはずです。それでは素敵なAI画像生成ライフをお楽しみください。

 

最後に、愛媛らしくみかん畑を背景にした画像を生成してみました