イベント名
2023年3月スマートインフォメディアシステム研究会(SIS)
発表年月日
2023/03/03
タイトル
オートエンコーダによるセマンティックな画像処理について
On Semantic Image Processing with Autoencoder
講演者
辻 裕之(神奈川工科大学), 
抄録
変分オートエンコーダ(VAE)の潜在空間は概念的にうまく構造化されており、入力画像を潜在空間にマップしたうえで簡単なベクトル演算を行うことによりセマンティックな画像操作を実現できるという利点があるが,一方で再構成した画像にボケが生じる等の画像品質上の問題があることが知られている.これに対し近年では,GANや拡散モデルといった深層生成モデルの生成器をDecoderとして採用するとともに,任意の入力画像を潜在空間上にマップするEncoderを新たに構築することにより,VAEでは実現できなかった高品質な画像の再構成を可能とするオートエンコーダが提案されている.本稿では,近年提案されたEncoder-Generatorタイプのオートエンコーダの動向と,これらを用いたセマンティックな画像処理について述べる.
Variational Auto Encoder (VAE) has a conceptually well-structured latent space and can realize semantic image manipulation through simple vector operations on the latent space, but on the other hand, it is known to have image quality problems such as blurring in the reconstructed image. Recently, autoencoders that employ generators of deep generative models such as GAN and diffusion models as decoders, combined with encoders that map arbitrary inputs to the latent space, have been proposed to enable high-quality image reconstruction that could not be achieved with VAE.This paper describes the recent trends of Encoder-Generator type autoencoders and semantic image processing using these autoencoders.
キーワード
深層生成モデル, オートエンコーダ, VAE, GAN, 拡散モデル, 潜在空間

Webinar視聴