!!! サイト改修中のため表示が乱れる場合があります(1月末頃まで) !!!
画像生成AI / スタイル変換

14-17. 文章から画像を生成できる「VQGAN+CLIP」と「DALL-E mini」を試してみた

やること

文章から画像を生成する手法「VQGAN+CLIP」「DALL·E mini」が公開されていますので、ファッション画像の生成を試してみましょう。

VQGAN+CLIP

Katherine CrowsonさんとRyan Murdochさんが、Transformerモデルを利用して高解像度画像生成する「VQGAN」と、テキストと画像を結びつける「CLIP」を組み合わせたとのことです。

Ryan Murdochさんのギャラリー

Tour of the Sacred Library
Come, walk with me for a while through latent space.

Katherine Crowsonさんのgithub

GitHub - nerdyrodent/VQGAN-CLIP: Just playing with getting VQGAN+CLIP running locally, rather than having to use colab.
Just playing with getting VQGAN+CLIP running locally, rather than having to use colab. - nerdyrodent...
DALL·E mini

Boris Daymaさんらは、テキストから画像を生成する「DALL·E」をより軽量に再現したとのことです。

DALL·E mini

Weights & Biases
Weights & Biases, developer tools for machine learning

github

GitHub - borisdayma/dalle-mini: DALL·E Mini - Generate images from a text prompt
DALL·E Mini - Generate images from a text prompt. Contribute to borisdayma/dalle-mini development by...

生成条件

どちらも文章から画像を生成できますが、「VQGAN+CLIP」は基礎となる画像を入力することもできるようです。

テキストVQGAN+CLIPDALL·E mini
fractal dressテキストのみ
テキスト+基礎画像
テキストのみ
A woman is wearing a dress with a fractal pattern.
She is standing and reading a book.
テキスト+基礎画像テキストのみ
peacock dressテキストのみ
テキスト+基礎画像
テキストのみ
A woman is wearing a dress with a peacock feather pattern.
She is standing and reading a book.
テキスト+基礎画像テキストのみ
lightning dressテキストのみ
テキスト+基礎画像
テキストのみ
A woman is wearing a lightning patterned dress.
She is standing and reading a book.
テキスト+基礎画像テキストのみ

基礎画像にはネットから拝借した以下を用いました。

出力画像は複数枚を結合して並べました。本来は個別に出力されます。

VQGAN+CLIP

fractal dress

fractal dress+基礎画像

A woman is wearing a dress with a fractal pattern. She is standing and reading a book.+基礎画像

peacock dress

peacock dress+基礎画像

A woman is wearing a dress with a peacock feather pattern. She is standing and reading a book.+基礎画像

lightning dress

lightning dress+基礎画像

A woman is wearing a lightning patterned dress. She is standing and reading a book.+基礎画像

DALL·E mini

fractal dress

A woman is wearing a dress with a fractal pattern. She is standing and reading a book.

peacock dress

A woman is wearing a dress with a peacock feather pattern. She is standing and reading a book.

lightning dress

A woman is wearing a lightning patterned dress. She is standing and reading a book.

まとめ

これらの手法はこの世にない画像を生成できる点が魅力的で、デザイナーに新しい着想を与えることが期待されます。AIを活用したデザインスキームがますます発展していくことでしょう。

ただし、いまのところ、このような服が発表されたとしても「AIがデザインした」という触れ込みが先行してしまい、既存のデザインと同じ土俵では評価されません。AIブームの落ち着きを待つ必要があると考えます。

リアクションのお願い

「参考になった!」「刺激された!」と思ったらぜひリアクションをしましょう。エンジニアの世界はGive and Takeによって成り立っています。これからも無料で良質な情報にアクセスできるよう、Giveする人への感謝をリアクションで示しましょう!

この記事をシェアする

自身のブログ等で使用する場合は引用を忘れずに!

また、寄付も受け付けています。コーヒー1杯でとても喜びます(*˘︶˘*)

 Amazonでギフト券(アマギフ)を贈る

こちらのリンク から金額を指定してお贈りください。(デフォルトで10000円になっているのでご変更ください)

配送:Eメール
受取人:staffあっとvigne-cla.com
贈り主:あなたのお名前やニックネーム
メッセージ:◯◯の記事が参考になりました。など

のようにご入力ください。見返りはありませんのでご了承ください。

 Amazonで食事券(すかいらーく優待券)を贈る

500円 1000円 2000円 5000円 からお贈りください。

配送:Eメール
受取人:staffあっとvigne-cla.com
贈り主:あなたのお名前やニックネーム
メッセージ:◯◯の記事が参考になりました。など

のようにご入力ください。見返りはありませんのでご了承ください。

 その他、ギフト券やクーポン券をメールで贈る

デジタルのギフト券/クーポン券はメールアドレス(staffあっとvigne-cla.com)までお送りください。受領の返信をいたします。
紙のギフト券/クーポン券は 「郵便物はこちらへ」の住所 まで送付してください。名刺やメールアドレスを同封していただければ受領の連絡をいたします。
余った株主優待券等の処理におすすめです。
いずれも見返りはありませんのでご了承ください。

不明点はSNSでお気軽にご連絡ください

ビネクラのTwitter・Youtubeでコメントをください!


Slack・Discordの場合はこちらの公開グループに参加してShoya YasudaまでDMをください!


※当ブログに関することは何でもご相談・ご依頼可能です。

この記事を書いた人
Yasuda

博士(理学)。専門は免疫細胞、数理モデル、シミュレーション。米国、中国で研究に携わった。遺伝的アルゴリズム信者。物価上昇のため半額弁当とともに絶滅寸前。

タイトルとURLをコピーしました