!!! サイト改修中のため表示が乱れる場合があります(1月末頃まで) !!!
画像生成AI / スタイル変換

2-5. たった1枚の画像で超解像!?SinGANを試す

はじめに

 今更ですが、昨年末に話題になったSinGANを使ってみました。SinGANはICCV2019で発表されたモデルです。このモデルの驚くべき点は画像1枚で学習できることです。また1つのモデルで画風変換、超解像、画像編集、画像のアニメーション化など様々なタスクをこなすことができる汎用性の非常高いモデルです。

SinGANで超解像を試してみる

 それでは早速、公式実装で128×128の画像を512×512の画像に高解像度化したいと思います。同時に、超解像のWebサービスのwifu2xで試した結果とも比較してみます。実行環境はGoogle Colaboratoryです。

Google Colab
GitHub - tamarott/SinGAN: Official pytorch implementation of the paper: "SinGAN: Learning a Generative Model from a Single Natural Image"
Official pytorch implementation of the paper: "SinGAN: Learning a Generative Model from a Single Nat...
waifu2x

まずは公式実装にある画像で試してみます。

左がwaifu2xで右がSinGANです。waifu2xの方は油絵のようになってしまっています。一方、SinGANはかなり精度の高い超解像ができています。

次に風景写真で超解像を試してみましょう。上側の画像が低解像度の画像で、下側の左側からwaifu2x、sinGAN、本物画像になります。waifu2xはやはり絵画のようになってしまっています。sinGANは公式にあった画像のときとは違い、かなりノイズが入ってしまいました。

次に花柄の模様で超解像を試してみました。これはwaifu2xの方が良い画像になっていますね。waifu3xはイラストモードと写真モードがありますが、イラストのような画像の超解像の方が得意なのかもしれません。一方、SinGANでも解像度は上がっていますが、こちらもノイズが混じってしまっています。

最後にコンクリートのテクスチャーで実施してみます。こちらも最初の風景写真と同様の結果になりました。

まとめ

 今回、SinGANを使って超解像を試してみました。1つのモデルが終了するまでは40分ほど時間がかかりました。結果ですが、SinGANで高解像度化した画像にはノイズが入ってしまいました。SinGANは画像1枚から学習できるのですが、画像の種類のよっては得手不得手があるように思います。次はSRGANやTacoGANなどそれ以外の超解像アルゴリムを試してみようと思います。

リアクションのお願い

「参考になった!」「刺激された!」と思ったらぜひリアクションをしましょう。エンジニアの世界はGive and Takeによって成り立っています。これからも無料で良質な情報にアクセスできるよう、Giveする人への感謝をリアクションで示しましょう!

この記事をシェアする

自身のブログ等で使用する場合は引用を忘れずに!

また、寄付も受け付けています。コーヒー1杯でとても喜びます(*˘︶˘*)

 Amazonでギフト券(アマギフ)を贈る

こちらのリンク から金額を指定してお贈りください。(デフォルトで10000円になっているのでご変更ください)

配送:Eメール
受取人:staffあっとvigne-cla.com
贈り主:あなたのお名前やニックネーム
メッセージ:◯◯の記事が参考になりました。など

のようにご入力ください。見返りはありませんのでご了承ください。

 Amazonで食事券(すかいらーく優待券)を贈る

500円 1000円 2000円 5000円 からお贈りください。

配送:Eメール
受取人:staffあっとvigne-cla.com
贈り主:あなたのお名前やニックネーム
メッセージ:◯◯の記事が参考になりました。など

のようにご入力ください。見返りはありませんのでご了承ください。

 その他、ギフト券やクーポン券をメールで贈る

デジタルのギフト券/クーポン券はメールアドレス(staffあっとvigne-cla.com)までお送りください。受領の返信をいたします。
紙のギフト券/クーポン券は 「郵便物はこちらへ」の住所 まで送付してください。名刺やメールアドレスを同封していただければ受領の連絡をいたします。
余った株主優待券等の処理におすすめです。
いずれも見返りはありませんのでご了承ください。

不明点はSNSでお気軽にご連絡ください

ビネクラのTwitter・Youtubeでコメントをください!


Slack・Discordの場合はこちらの公開グループに参加してShoya YasudaまでDMをください!


※当ブログに関することは何でもご相談・ご依頼可能です。

この記事を書いた人
Mizukami

専門は分子生物学とタンパク質工学。Webアプリや画像系・テキスト系の深層学習に強みがある。食べ物は床に落ちても30秒ルール。

タイトルとURLをコピーしました