!!! サイト改修中のため表示が乱れる場合があります(1月末頃まで) !!!
画像生成AI / スタイル変換

4-1. CNNでケーキ画像の次元圧縮(Auto-Encoder編)

やること

画像というものは非常に高次元の情報を持っています。例えば128*128pxの画像は、128*128*3ch=49152次元の情報を含んでいます。人間は高次元の情報を処理できない動物なので、2~3次元くらいにまで情報を圧縮もしくは削減する必要があります。今日は、CNNでケーキ画像の次元圧縮をしてみましょう。

使うもの

Google Colaboratoryが利用可能です。

Google Colab
AIワークショップ|初心者だけどCNNで次元圧縮できちゃった (2019/02/25 19:00〜)
# 「そうだ、次元を圧縮しよう」 中高生のなりたい職業ランキング1位「次元圧縮師」(大きな声で嘘をつく) ## オンラインコミュニティ 情報交換・質問・クレームなどはAI FASHIONのSlack(...

オートエンコーダとは

オートは「自分自身」、エンコーダは「変換器」です。オートエンコーダは、入力と同じ出力を出す変換器のことです。「意味なくない?」と思ってしまいますが、変換の途中で情報の通り道を絞ることで、情報の次元圧縮ができます。ニューラルネットを用いたオートエンコーダは、砂時計型のモデルです。すなわち、前半は畳み込みによって2次元まで圧縮し(エンコーダと呼ぶ)、後半はアップサンプリングによって元の画像サイズまで展開します(デコーダと呼ぶ)。

ニューラルネットモデル

1-3, 1-4で用意した、10種のケーキの画像(計400枚)を用います。オートエンコーダは教師なし学習ですので、学習には「apple」「cheese」といった教師ラベルは用いません。

プログラムを実行する

配布された「autoencoder_1.py」を実行すると、「cake_AE1_para/」フォルダが生成され、1エポックごとに重みとバイアスが保存されます。学習は、1-4で言及した、Kerasの「フォルダから画像を読み込みながら(リサイズはしないけど)水増ししながら正解ラベル(この場合は入力と同じ画像)を作りながら学習する」という必殺技を存分に使用していますので、コードは比較的短くシンプルです。

結果

1エポックごとに、規定のケーキ画像10枚を用いて、オートエンコーダの性能確認をしています。しかし、さすがに「2次元」は絞りすぎたのでしょう。情報を入力画像をほとんど復元できていません。つまり、オートなエンコードができませんでした。

リアクションのお願い

「参考になった!」「刺激された!」と思ったらぜひリアクションをしましょう。エンジニアの世界はGive and Takeによって成り立っています。これからも無料で良質な情報にアクセスできるよう、Giveする人への感謝をリアクションで示しましょう!

この記事をシェアする

自身のブログ等で使用する場合は引用を忘れずに!

また、寄付も受け付けています。コーヒー1杯でとても喜びます(*˘︶˘*)

 Amazonでギフト券(アマギフ)を贈る

こちらのリンク から金額を指定してお贈りください。(デフォルトで10000円になっているのでご変更ください)

配送:Eメール
受取人:staffあっとvigne-cla.com
贈り主:あなたのお名前やニックネーム
メッセージ:◯◯の記事が参考になりました。など

のようにご入力ください。見返りはありませんのでご了承ください。

 Amazonで食事券(すかいらーく優待券)を贈る

500円 1000円 2000円 5000円 からお贈りください。

配送:Eメール
受取人:staffあっとvigne-cla.com
贈り主:あなたのお名前やニックネーム
メッセージ:◯◯の記事が参考になりました。など

のようにご入力ください。見返りはありませんのでご了承ください。

 その他、ギフト券やクーポン券をメールで贈る

デジタルのギフト券/クーポン券はメールアドレス(staffあっとvigne-cla.com)までお送りください。受領の返信をいたします。
紙のギフト券/クーポン券は 「郵便物はこちらへ」の住所 まで送付してください。名刺やメールアドレスを同封していただければ受領の連絡をいたします。
余った株主優待券等の処理におすすめです。
いずれも見返りはありませんのでご了承ください。

不明点はSNSでお気軽にご連絡ください

ビネクラのTwitter・Youtubeでコメントをください!


Slack・Discordの場合はこちらの公開グループに参加してShoya YasudaまでDMをください!


※当ブログに関することは何でもご相談・ご依頼可能です。

この記事を書いた人
Yasuda

博士(理学)。専門は免疫細胞、数理モデル、シミュレーション。米国、中国で研究に携わった。遺伝的アルゴリズム信者。物価上昇のため半額弁当とともに絶滅寸前。

タイトルとURLをコピーしました