gan application

自2014年Ian Goodfellow提出了GAN(Generative Adversarial Network)以来,对GAN的研究可谓如火如荼。各种GAN的变体不断涌现,下图是GAN相关论文的发表情况:

GANs 现在可以做什么?

GAN应用史

首先简单介绍一下GAN出现以来GAN变体们的进化史:

GAN的CV史

  • GAN最初用来生成一维信号(语言,语音)以及简单的二维信号(minist)
  • 后续研究者提出DCGAN, 可以相对更有效的生成二维的图像信号(但分辨率仍然很小,多数只有 6464 或 128128 ),这是 GAN 首次在图像生成取得很大的进步。
  • 2016年,商汤-香港中文大学联合实验室与罗格斯大学等机构提出了 StackGAN 算法,发明了更好的神经网路结构,将生成图像的分辨率从 $128128$ 大幅提升到 $256256$。
  • 随后, NVIDIA 一篇以名人的脸孔为训练素材,生成出相当逼真的假名人照的论文,将分辨率一举拉高到 1024*1024,立刻令外界惊叹,GAN 一战成名。
  • 今天,GAN不仅在二维图像的生成上有成熟的发展与应用,在三维信号以及高维信号的应用上也取得了不错的进步,例如视频生成,三维重建等。

详细的展示将以几篇优秀的论文呈现

GAN新的网络结构

GAN变体如火如荼地今天,不仅出现了很多应用,也出现了一些网络结构上的改进.例如 CGAN, cycleGAN, DualGAN, DiscoGAN, TripleGAN...

本博客将展示CGAN, cycleGAN,stackgan,stylegan等

GAN的对抗思想被其他深度学习应用引入(目标检测、对抗攻击、信息检索、贝叶斯理论、Capsule、强化学习、离散输出“NLP”、自编码器、半监督学习,增强了原始应用的性能。

一开始外界普遍认为 GAN 只是一个生成模型,不过其实对抗性的思想对于改进现有 AI 算法同样很有帮助。举例来说,传统的深度学习算法可以看作 GAN 的生成器,引入鉴别器后,可以改良原有模型的任务表现,让现有 AI 算法做的更好、生成更接近真实的结果。商汤-香港中大联合实验室教授吕建勤从事研究 GAN 进行图像超分辨率,不仅是把低分辨率的图像提高,将其变为高分辨率图像,还可以近一步自动美化图像的风格和细节。

另一位商汤-香港中大联合实验室教授林达华则是以 GAN 增强图像标题生成的真实性。图像标题生成主要是希望通过计算机看懂图像,并且用自然语言来描述图像内容,加入鉴别器可以判断这句话是人类撰写还是电脑生成的,借由这种方式让原来 AI 模型生成的标题更有“人味”、更自然。也有许多从业者将 GAN 引入机器翻译、人脸识别、信息检索等方向,在去年取得很好的突破。

本博客主要介绍IRGAN,graphgan,SeqGAN

本文标题:gan application

文章作者:dinry

发布时间:2019年06月18日 - 21:06

最后更新:2019年06月18日 - 21:06

原始链接:http://dinry.github.io/gan-application/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。