skip to Main Content

画像AIに自分好みの絵を描かせる「呪文」の作り方とは?英語が苦手でも大丈夫!

文字を入力することで非常に美麗な画像を生成してくれるAI画像生成が最近流行しています。
Twitterなどに挙げられているAI生成の画像を見て、自分も作ってみたいと思った方は多いのではないでしょうか。

しかし、自分の思い描く好みの絵を生成するには英語で入力しなければいけません。日本語を入力しても画像は生成されますが精度は落ちます。
英語が苦手でも効果的な呪文を唱える方法はないのでしょうか?今回は英語が苦手な人でもAI画像生成で好みの絵を描くために効果的な「呪文」の作り方について解説します。

プロンプト(呪文)とは

プロンプトとは記号を用いて画面上にコマンド入力位置を表示するものです。
プロンプトが表示されている間はコンピュータがユーザーの命令を受け付けられる状態になっていることを示しており、
ユーザーはプロンプトの後ろに実行したい英語のコマンド(呪文)を入力します。

たとえばMidjourneyの場合、Discordのメッセージ欄に「/imagine」と入力するとpromptが表示されます。その後ろに英語の呪文を入力し、送信ボタンを押すと画像が生成されます。

AIは呪文を受け取ると学習データの中から共通部分をあわせることで共通しない部分を消し、画像を生成します。

呪文詠唱の仕方によって画像の違いが視覚的に確認できるため、工夫次第で理想に近い画像を生成できるかに高い関心が集まっています。そうした関心や勢いにより、AI画像生成の呪文に関するブログや動画などが増えていき、プロンプトエンジニアリングと呼ばれる分野も注目されています。

AI画像生成の仕組み

まず最初に、AI画像生成の仕組みを簡易的に説明します。

①呪文を受け取る

②呪文の内容に近いタグを持つ複数の画像を学習データから検索して受け取る

受けとった画像を採点者達とし、生成した画像と似ているか採点させる試験を行う

④様々な画像が生まれるよう採点者が異なる試験を分岐しながら改変を繰り返す

最終的に多くの採点者達にある程度似た画像が生成される


学習データとは画像と文字で一組になったデータセットのことを指します。

AIは物体そのものや構造、機能、関係性などを認識しているわけではありません。

この場合でいうと、「油絵風のバナナ」はAIにとって学習データの中にある「バナナ」「油絵風」の文字・画像と「共通点が多い部分」でしかなく、「油絵風のバナナ」そのものを認識していません、

AIはデータ上にある画像とテキストだけで考えているため、「バナナ」と紐づく単語も全て別々のものであり、共通しやすい部分とそうでない部分でしかないため背景と物体の区別も付いていないのです。

そのため、AIにとってプロンプト(呪文)は画像生成のベクトルを定めるだけのものといえるでしょう。

AI画像生成に好みの画像を描かせる呪文に必要な要素

AI画像生成のベクトルは学習データの中に無数に存在します。そのため、闇雲に単語を並べても、単語同士が互いにベクトルを打ち消し合ってしまいます。

AIに自分好みの絵を描かせるために、呪文に必要な要素は以下のとおりです。

  • ベクトルの方向が強く当てはめられており曖昧さのない語彙力
  • 再現性の高い言葉の組み立て方

上記の要素が必要な理由は、入力された呪文を学習データの中から共通しやすい部分とそうでない部分で考えるAIにとって、「内容がブレずに何度も出てくる画像と文字のセット」には強い力が生まれるからです。

ベクトルの方向が強く当てはめられており曖昧さのない語彙力

ベクトルの方向が強く当てはめられており曖昧さのない語彙力とは、学習データの中にある「●●は■■だ」を的確に選び出すための精度を上げる言葉のことです。人物画の大家の名を唱えると、顔の生成やライティングが安定します。

たとえば、呪文の最後に「in Hayao Miyazaki style」と入力するとジブリに出てくる優しいアニメーションのような雰囲気になります。これはAIが記事と画像のセットから「宮崎駿は日本のジブリスタジオ風の絵を描く」と学んでいるからです。

他にも「アンリアルエンジンや平均的なコンセプトアート画像は絵がうまい」とAIが学習データの中で認識しているため、「Unreal Engine」「beautiful concept art of」などの言葉は画質を向上させる力強い言葉といえるでしょう。

night view

night view by unreal engine

beautiful concept art of night view 

beautiful concept art of night view by Hayao Miyazaki style ,unreal engine

night view taken by Canon EOS 5D Mark4 and SIGMA Art Lens 35mm F1.4 DG HSM, F1.4, ISO 200 Shutter Speed 2000

再現性の高い言葉の組み立て方

どの単語をどういう順番で組み立てるかによって生まれる画像の品質を大きく左右されるため、再現性の高い言葉の組み立て方は好みの画像を生み出す呪文のために重要です。

基本的に前置詞、関係代名詞の前の単語など、手前にある文ほど強く、後ろにある単語ほど弱いですが、最後の文はある程度強く反映されます。

「night view with cat」(猫のいる夜景)

「cats with night view」(夜景を眺める猫)

※使用ツール:Stable Diffusion Demo(https://huggingface.co/spaces/stabilityai/stable-diffusion)

同じように見える呪文でも、このように猫の扱いが大きく異なるのがわかります。

呪文詠唱リズムのフォーマット

好みの絵を生成するのに、以下のような構成が定番となっているようです。

<全体のフォーマット><主題><主題の補足><作者><全体の補足><フレーバー>

引用元:「魔術として理解するお絵描きAI講座」(https://note.com/fladdict/n/n0f0be20e3e23)

全体フォーマット

  • Detailing :非常に精緻な~表現
  • a photo of:写真表現
  • a portrait of:人物写真
  • a cartoon of:漫画風
  • illustration of:精緻なイラストレーション
  • a scene of the movie that:映画の一場面
  • oil painting of:油絵風
  • water painting of:水彩画風
  • pencil sketch of:鉛筆画
  • ancient:古代風
  • futuristic:未来的な

英霊

英霊とは画家のことです。ダヴィンチやダリなど、世界的に有名な作家の名前を入れると顔の生成やランディングが安定します。

  • by  <画家>  style
  • 例)by CASPAR DAVID FRIEDRICH and CLAUDE LORRAIN
  • in <映像作品> style

全体の補足

高級一眼カメラ&レンズと撮影設定は再現性と精度が高く、画質、ボケ具合、画角、ノイズなど複数要素をまとめて安定管理できるだけでなく、構図とライティングの向上までしてくれます。なので、呪文詠唱の末尾につけておくことをオススメします。

by Canon EOS 5D Mark4 and SIGMA Art Lens 35mm F1.4 DG HSM, F1.4, ISO 200 Shutter Speed 2000

フレーバー

  • perfect lighting
  • 8k
  • realistic photo
  • unreal engine
  • manga
  • kawaii

オプション

  • –w 2048 –h 1024:縦と横の大きさ
  • –ar 16:9:画像の縦横比16:9
  • –q 0.25:精度を落として爆速で4枚出力
  • –s スタイライズ変数(デフォルトは2,500)小さいほど平凡、大きいほど抽象的
  • ::(重み)hot dog::1.0 apple::0.5

CatchyのAI画像生成機能を活用する

AIの学習データにおけるテキストは基本的に英語です。好みの画像を描かせたいけど英語が苦手だから呪文が思いつかない人は少なくないでしょう。

そんな方におすすめなのが、様々なシーンで使える文章作成サービスが100以上揃っている、AIコピーライティングツール「Catchy」です。

「Catchy」の「AI で画像生成するテキストを作成」を利用すれば一から英文を考える手間を省くことができます。時には自分では思いもしなかった文章を付け加えてくれるかもしれません。実際に「AI で画像生成するテキストを作成」の使用例は以下のとおりです。

ただ英語に変換するだけでなく、補足もしてくれます。英文を作るのが苦手な方でもコピペするだけで簡単に画像生成が可能です。

作成された下書きからさらにブラッシュアップをする

「Catchy」に作成してもらった文章をそのまま入力しても自分の好みの画像とはいえません。AIが作成した文章はあくまで下書きと考え、ブラッシュアップすることでようやく自分好みの画像を生成する呪文ができあがります。

フォーマットを参考にして加えつつ、グーグル翻訳を頼りに何度も書き直していきます。

  • <全体フォーマット>Detailing water painting of
  • <主題>壊れた鏡から異世界に落ちていく赤いシャツを着た金髪の少年を描いた水彩画。 背景は真っ青な空に浮かぶ巨大な城と飛んでいる龍です。
  • <英霊>by Hayao Miyazaki style and Makoto Shinkai style
  • <全体の補足> by Canon EOS 5D Mark4 and SIGMA Art Lens 35mm F1.4 DG HSM, F1.4, ISO 200 Shutter Speed 2000
  • <フレーバー> perfect lighting,8k,unreal engine,kawaii,anime,
  • <オプション> –ar 16:9

Detailing water painting of a blond boy in a red shirt falling through a broken mirror into another world by Hayao Miyazaki and Makoto Shinkai style.The background is a huge castle floating in the deep blue sky and a flying dragon.by Canon EOS 5D Mark4 and SIGMA Art Lens 35mm F1.4 DG HSM, F1.4, ISO 200 Shutter Speed 2000,perfect lighting,8k,unreal engine,kawaii,anime,–ar 16:9

A detailing watercolor painting in which a blond hair boy falls into another world through a broken mirror by Hayao Miyazaki and Makoto Shinkai style.The background is a huge castle floating in the deep blue sky,a flying dragon, by Canon EOS 5D Mark4 and SIGMA Art Lens 35mm F1.4 DG HSM, F1.4, ISO 200 Shutter Speed 2000,perfect lighting,8k,unreal engine,kawaii,anime,–ar 16:9

A detailing watercolor painting in which a blond hair boy falls into another world through a broken mirror by Hayao Miyazaki and Makoto Shinkai style.The background is a huge castle floating in the deep blue sky,by Canon EOS 5D Mark4 and SIGMA Art Lens 35mm F1.4 DG HSM, F1.4, ISO 200 Shutter Speed 2000,perfect lighting,8k,unreal engine,kawaii,anime,dragon,–ar 16:9

A detailing watercolor painting of a blond hair boy and dragon, falling into magical and fantasy world through a broken mirror by Hayao Miyazaki and Makoto Shinkai style.the background is a huge castle floating in the deep blue sky,Canon EOS 5D Mark4 and SIGMA Art Lens 35mm F1.4 DG HSM, F1.4, ISO 200 Shutter Speed 2000,perfect lighting,8k,unreal engine,kawaii,anime,–ar 16:9

A detailing watercolor painting in which a blond hair boy falls into another fantasy world through a broken mirror by Hayao Miyazaki and Makoto Shinkai style.The background is a black dragon, the deep blue sky,a huge castle floating , by Canon EOS 5D Mark4 and SIGMA Art Lens 35mm F1.4 DG HSM, F1.4, ISO 200 Shutter Speed 2000,perfect lighting,8k,unreal engine,kawaii,anime,–ar 16:9

※使用ツール:Stable Diffusion Demo

ドラゴンをブラックドラゴンと特定したことでようやく現れてくれました。
少し付け加えたり、入れ替えただけでこんなにも変わります。どれも小説の挿絵にできそうなステキな絵ですね。

まとめ

AIによる画像生成は学習データの中にある画像とテキストの組み合わせから検索するため、学習データの中に存在しないものは反映されません。

逆にいえば、学習データの中にあるものであれば様々な関連性のあるものを引っ張り上げてくれます。

AIコピーライティングツールを利用すれば、一から英文を考える手間を省くことができるので、英語が苦手な方でも自分好みの絵をAIに描かせる呪文を作ることができます。この機会にチャレンジしてみてはいかがでしょうか。

すべてのビジネスマンのための、コンテンツ・文章作成のコツをわかりやすく紹介するブログです。
アイディアの出し方、SNS運用、営業メールの作成コツなどを投稿しています。

Back To Top