ACGAN

概要

ACGAN(Auxiliary Classifier Generative Adversarial Network)は、DCGANではランダムノイズ列から画像を作っていただけにすぎない学習に加えて、画像のクラスラベル情報をGeneratorに入力しDiscriminatorで補助的なクラス識別タスクを行うことで、高精度な画像を生成できたネットワーク.学習は128x128の画像を入力としてImageNetの画像を使用している.
Facebookシェア Twitterツイート LINEで送る このエントリーをはてなブックマークに追加
この章を学ぶ前に必要な知識
0
条件
  • 128x128の画像が入力
効果
  • ImageNetの画像生成をこれまでより高精度に実現
ポイント
  • Discriminatorにおいてクラス識別を行う補助的(Auxiliary)なタスクを行わせることで向上
  • Generatorにはノイズとクラス情報を加える

解 説

ACGAN(Auxiliary Classifier Generative Adversarial Network)は、画像のクラスラベル情報をGeneratorに入力しDiscriminatorで補助的なクラス識別タスクを行うことで、高精度な画像を生成できたネットワーク.通常のGANではノイズ列のみを入力に画像を出力し、Discriminatorで真偽を判定するのみでクラス識別は行っていなかった. Generatorにはクラス情報c とノイズ列を入力として与える.このcを変更することで指定したクラス、例えば"飛行機"といったようなクラスに絞って画像生成が可能になる. 学習はImageNetの画像を128x128の画像入力として使用している.
ACGANについて
Generatorの入力ではノイズ列とクラスラベルをつなげたベクトル. Discriminatorの出力では、真偽とクラスを出力.両方の誤差を使って誤差逆伝播を行う.
ACGANの論文に関しては右のリンクを参考にしてください. 他にこの論文において紹介される内容について以下に簡単にまとめる. ・低解像度の画像では見られないが高解像度の画像ではクラスを識別できる情報が含まれている. ・生成画像の質の評価として生成できる種類と生成される画像の質(識別性能)の両方を考慮する方法について提案.
ACGANにおいて比較的綺麗に画像生成できた例
この章を学んで新たに学べる
Comments

Reasons
>>隠す