ガラパゴス化という言葉があるよ…
2023年1月のAI画像生成最新トピックを紹介!AI画像生成の進化はとまらない

2022年は「Stable Diffusion」やOpenAIの「DALL-E2」などのモデルが注目されるなど、テキストを入力するだけで誰でも簡単にイラストを作成できるテキスト・画像AI生成モデルの分野が急速に拡大していきました。どんどん進化していくAI画像生成の世界はどうなっていくのでしょうか。2023年1月に起こったAI画像生成の最新トピックを紹介します。
Contents
新しいAI画像作成モデル「Muse」
Google は、「Muse」と呼ばれる新しいテキスト画像 AI 生成モデルを発表しました。 他の画像作成 AI とは異なり、既存の画像を編集する機能が特徴です。
従来の画像生成 AI はゼロから画像を生成することに重点を置いていましたが、完全に意図した画像を作成することは依然として困難です。しかし、Museを使用することで、既存の画像を簡単に編集できるため、意図した画像を簡単に作成可能です。そのため、Photoshopなどの画像編集ツールの代わりになる可能性があります。
Googleはすでに「Imagen」と「Parti」という画像生成AIモデルを発表していますが、2023年1月に発表された「Muse」は主要なAIモデルとどう違うのでしょうか。特徴を紹介します。
従来の画像生成AIより高速
1つ目は「従来の画像生成AIより高速」なことです。MuseStable Diffusion 1.4では、画像 (512×512) あたりの生成時間が以下のように異なります。
・Muse:1.3 秒
・Stable Diffusion 1.4:3.7 秒
生成時間がこのように異なるのは、従来のノイズから開始して徐々に除去することでデータを生成する「拡散モデル」 とは異なり、Museは量子化されたトレーニングイメージのセット (イメージトークン) を使用し、サンプリングの反復回数を減らし効率を向上させているからです。そのため、従来の画像生成AIよりも非常に高速で絵を作り出すことができます。
既存の画像を編集する機能
2つ目は「既存の画像を編集する機能」です。Museは、従来の画像生成 AI のようにゼロから画像を生成するだけでなく、既存の画像を編集することも可能です。
たとえば、「皿に置かれたケーキとカップに入ったカフェオレ」の写真を用意し、「花のラテアートが描かれたカフェラテの隣にあるクロワッサン(A croissant next to a latte with a flower latte art.)」とテキストを入力すると、皿やカップはそのままにクロワッサンと花のラテアートの部分だけが置換されています。
参照:All about デジタル「Googleが発表したテキスト画像AI生成モデル『Muse』とは?」
同様に、「赤ワインのグラスとキャップの隣にある赤ワインのボトル」の写真が与えられた場合、「白ワインのグラスとコルクの隣にある白ワインのボトル(A bottle of Pinot Grigio next to a glass of white wine and a cork.)」というテキストを入力することで、赤ワインが白ワインに、キャップはコルクに置換されています。
参照:All about デジタル「Googleが発表したテキスト画像AI生成モデル『Muse』とは?」
マスクを使用した修正も可能
Museには画像の一部の要素を指定する「マスク」機能を使用して、マスク内だけを修正する「Inpainting」と、マスク外だけを描き足す「Outpainting」を行うことができます。
参照:All about デジタル「Googleが発表したテキスト画像AI生成モデル『Muse』とは?」
「Inpainting」:マスクで指定した部分(マスク内)が指定されたテキスト通りに置換
参照:All about デジタル「Googleが発表したテキスト画像AI生成モデル『Muse』とは?」
「Outpainting」:マスクで指定した部分はそのままで、マスク外の部分が指定されたテキスト通りに置換
Muse は現在一般には未公開
AI データセットに偏りがある可能性があるため、Googleは米国で利用可能なベータ版 (Imagenのみ) を除いて、Museを一般に公開していません。何故なら、GoogleがMuseのような AI ツールの一般的なリリースにより、学習教材に偏りが生じ、正確な画像を生成できなくなる可能性があると考えているからです。
Museが一般公開されると、画像生成だけでなく画像編集の分野にも大きな変化がもたらされる可能性が高いでしょう。
株式会社neoAIが「DreamIcon」をリリース
株式会社neoAIは2023年1月6日、新サービス「DreamIcon」のリリースを発表しました。
neoAIとは
neoAIとは、東京大学発AIスタートアップです。レコメンデーションAI・画像処理AI・生成AIをコア技術に、企業のAI導入から運用までを一気通貫で支援するAIパートナー事業を展開しています。
DreamIconの特徴
「DreamIcon」には以下のような特徴があります。
参照:PRTIMES「(株)neoAI 、AIによる顔アイコン生成サービス『DreamIcon』をリリース」
画像から様々なタイプのアイコンが作成可能
「DreamIcon」とは、ユーザーが描いた絵(写真)を10枚アップロードすると、AIが20種類以上のテーマに沿ったアイコン画像を生成してくれるWEBサービスです。様々なタイプのアイコンを作成可能であり、ユーザーのイメージに合わせてカスタマイズできます。
コミュニティ機能も備えているので、他のユーザーが作成したアイコンも見ることができます。
固有の人物画像生成が実現可能
「DreamIcon」は、Googleが2022年8月に発表した最先端の画像生成AIをベースにしているので、短時間で固有の人物画像の大量生成が実現可能であり、画像から画像を生成できるのでデザインのスキルがなくても美しいアイコンを作成できます。現在犬や猫などの動物用も開発中だそうです。
「AIピカソ」が世界初の素材サイト「AI素材.com」をリリース
2023年1月6日、AIお絵描きアプリ「AIピカソ」を提供するAI Picassoは、用途に合わせた画像素材をAIで生成できる世界初の素材サイト「AI素材.com」をリリースしました。
「AI ピカソ」とは
「AI ピカソ」とは、テキストや簡単なスケッチから画像を生成するAI お絵かきアプリのことです。簡単なラフスケッチを描いてAI に絵を完成させたりすることもできます。
「AI素材.com」とは
「AI素材.com」とは、用途に合う画像が検索で見つけられない場合でも、AIで生成することができる素材サイトのことです。利用方法は以下のとおりです。
①サイト(AI素材.com https://aisozai.com/ )にアクセス
②検索窓に単語をスペースで区切るのではなく、シチュエーションを説明するように入力
(例)☓「花束 かわいい男の子 持っている」 ○「かわいい男の子が花束を持っている」
③表示画像のなかにいいのがあればクリックして詳細ページに移動しDL
参照:AI素材.com
欲しいものがなければ検索結果の最下部にある生成ボタンを押すと15秒ほどで再生成されます。また、欲しい画像に近い画像が検索結果にある場合は、該当画像の詳細ページで生成する際に使用したプロンプトが記載されています。記載されているプロンプトを編集することで似た画像を生成することが可能です。
ユーザーは状況に合わせて自分だけのカスタムイメージを簡単に入手できるので、パワーポイントを使ってプレゼンテーション資料を作成する社員や学生、Web制作者、YOUTUBE動画作成者にとって心強いサイトになるのではないでしょうか。期間限定で高画質な画像も無料で利用可能です。
現在は画像素材のみの提供ですが、今後は以下のことを予定しているそうです。
・音楽や動画、3Dモデルなどの素材へと拡大
・画像を部分的にAIで編集するなどの高度なカスタマイズ機能の提供
まとめ
検索に言葉を入力するだけでイメージに近いキレイな素材を作成して提供してくれる「AI素材.com」は、ブロガーにとって非常に心強い味方になってくれます。また、高速で既存の画像を編集できる「Muse」は現在一般には非公開中ですが、Photoshopなどの画像編集ツールの代わりになる可能性があり、今後が非常に楽しみです。
さらに、AIは固有の人物を大量に生成するのが難しいとされていましたが、株式会社neoAIの「DreamIcon」によって実現可能となりました。2月には犬、猫用のサービスも出ています。どちらも有料ですが、気になる方は試してみてはいかがでしょうか。
今後もこのような最新トピックについての記事を提供していきますので、ぜひ引き続き読んでくださると嬉しいです。
この記事を書いた人:赤堀堂馬(あかほり どうま)
大阪育ちのWEBライター。小説やイラスト、動画作成、ハンドメイドなど様々な創作活動を行っている。色んなところにアンテナを張ることで、様々な視点を持ち原稿を書いている。ポメラニアンが好き。