2018 年最棒的三篇 GAN 论文

  • 2019-05-13 11:08
  • 3T比特

AI 科技评论按:本文作者 Damian Bogunowicz,于去年在慕尼黑大学获得硕士学位,主攻机器人、认知和智能专业方向,他在参与一个研究项目的过程中阅读了大量计算机视觉深度学习相关论文,并从 Reddit 网站上「What are best papers regarding GANs for 2018 you read?」这一话题讨论受到启发,挑选出来 2018 年度三篇最佳 GAN 论文,并整理成文进行发布。 AI 科技评论编译如下。

今年我很荣幸能参与到一个研究项目中,它要求我熟悉大量计算机视觉深度学习相关论文,让我深入到这个领域中学习,在此过程中,对于该领域在近两三年时间里所取得进步,我深为震撼。同时,图像修复、对抗样本、超分辨率或 3D 重建等所有不同的子领域从最新进展中获益颇丰,让人兴奋并激励人心。然而,现在人们对生成式对抗网络(GAN)这一神经网络进行了大量炒作(在我看来,这一定是有原因的)。我认同这些模型非常好,同时我也一直在留意关于 GAN 的一些新观点。

受 Reddit 网站上「What are best papers regarding GANs for 2018 you read?」这一话题讨论(话题讨论网址: http://www.reddit.com/r/MachineLearning/comments/a8th4o/d_what_are_best_papers_regarding_gans_for_2018/)的启发,我决定对 2018 年度最有趣的 GAN 相关论文进行简要回顾。这个清单是主观性非常高的——我选择的研究论文不仅是当前最新的,也是最酷、并能给人惊喜的。在本文的第一章,我会介绍三篇论文。顺便一提,如果你对于此前的 GAN 相关论文感兴趣,这篇文章(阅读地址:http://medium.com/nurture-ai/keeping-up-with-the-gans-66e89343b46)将会对你有所帮助,作者提到的其中一篇论文甚至就是我今天要介绍的最佳论文。

    1.《GAN 剖析:可视化和理解生成式对抗网络》(GAN Dissection: Visualizing and Understanding Generative Adversarial Networks)——即使生成式对抗网络周围充斥着大量炒作,不过显而易见,这种技术迟早会进行商用。然而,正因为我们对它们的内部机制了解甚少,我认为它仍然很难去开发一个可靠的产品。这篇论文朝未来迈进了一大步,到那个时候,我们可以真正地掌控生成式对抗网络。各位一定要去看看论文作者们制作的超棒的交互式 demo,它的结果十分惊艳。

    2.《基于样式的生成式对抗网络生成器架构》(A Style-Based Generator Architecture for Generative Adversarial Networks)——英伟达的研究团队经常能提出开创性的概念(2018 年很棒的图像修复论文:http://www.youtube.com/watch?v=gg0F5JjKmhA,使用神经网络进行图形渲染的最新 demo:http://www.youtube.com/watch?time_continue=2&v=ayPqjPekn7g)。这篇论文也不例外,另外,展示他们研究结果的视频简直令人着迷。

    3.《进化的生成式对抗网络》(Evolutionary Generative Adversarial Networks)——这篇论文可读性非常高并且十分巧妙。进化算法与生成式对抗网络的结合——这注定就会很厉害。

《GAN 剖析:可视化和理解生成式对抗网络》(GAN Dissection: Visualizing and Understanding Generative Adversarial Networks)

论文地址:http://arxiv.org/pdf/1811.10597.pdf

    摘要

    这篇文章于 2018 年 11 月 26 日被收录。作者创建了一个很不错的项目网站,交互式 demo 也在该网站上,大家可前往下方地址观看:

    http://gandissect.csail.mit.edu/

      主要思路:

      毋庸置疑,生成式对抗网络证明了深度神经网络有多大的能力。机器学习生成效果惊人、高分辨率的图像这种方式是美好的,就仿佛它像我们一样理解这个世界。不过,正如其他出色的统计模型一样,它们最大的缺陷就是缺乏可解释性。这项研究为理解生成式对抗网络带来了非常重要的进展,它让我们找到对从属于级别 c 的特定目标负责的生成器中的单位。作者们称,我们可以观察到生成器的一个层,并且找到该层的单元的子集,在生成的图像中,这些单元决定 c 级别目标的生成。作者通过引入剖析(dissection)和干预(intervention)这两个步骤,为每一层级搜索出了一组「具有因果关系」的单元。此外,它可能是首次为理解生成式对抗网络的内部机制提供系统分析的一项工作。

        方法:

        生成器 G 可以看做是一个潜在向量 z 到一个生成图像 x 的映射:。我们的目标是理解内部表示 r,它是生成器 G 中某个特定层的输出。

        原标题:2018 年最棒的三篇 GAN 论文|图像|生成器|网络|

头条推荐
图文推荐