NVIDIA利用GAN合成MRI成像,解决AI训练数据采集难的问题

  • 2018-09-18 09:49
  • 百家号
  人工智能都有一个共同特点,那就是需要大量数据集来训练,比如谷歌子公司DeepMind开发的顶尖诊断系统需要使用来自7500名病人的15000张扫描图,更麻烦的是其中有些数据集很难获得。

  近日,NVIDIA Mayo Clinic(梅奥诊所)和MGH&BWH Center for Clinical Data Science(麻省总医院与布莱根妇女医院临床数据科学中心)的科研人员似乎找到了上述问题的解决办法,即一种能够自主生成训练数据(脑肿瘤3D MRI图像数据)的神经网络。

  据青亭网了解,这款AI是科研人员使用Facebook PyTorch深度学习框架开发,并使用NVIDIA DGX超级计算机来训练的,训练的数据使用了由生成式对抗网络(GAN)(由生成样本的生成器和分别生成样本与真实样本的判别器两部分组成的神经网络)生成的逼真脑瘤MRI成像。

  为了训练生成式对抗网络,这组科研人员使用来自阿兹海默症神经成像研究项目(ADNI)和多式脑肿瘤图像分割基准(BRATS)的两个公开数据集。因为内存和算力有限制,科研人员不得不将扫描成像的分辨率从256x256x108降低到128x128x54。

  在训练过程中,科研人员在生成式对抗网络的生成器中输入ADNI的成像数据,生成器学习模仿ADNI的成像合成大脑成像(包含白质、灰质和脑脊液),接下来在生成器中输入BRAT数据集时,其会生成肿瘤的完整切割成像。生成式对抗网络还会为扫描图进行标记,人类专家做这项任务要花数小时才能完成,因为生成式对抗网络将大脑成像与肿瘤切割成像分成了两组来标记,科研人员便可以修改肿瘤大小和位置,还可以将肿瘤“移植”到健康的大脑上。

  科研人员表示,这是第一次出现使用合成的大脑成像来训练神经网络的技术,这也很好地保护了病人的隐私,因为生成式对抗网络合成的成像数据是匿名的。

  经过测验,科研人员使用生成式对抗网络合成的大脑成像,与真实大脑成像数据训练出的机器学习模型准确率达到了80%,比仅使用真实数据训练的模型准确率提高了14%。

  这些科研人员表示,在未来他们希望能提高训练图像的分辨率,使用更大、测试对象多样的数据集,并且将合成的脑成像做得更自然,减少叠加的痕迹。

  当然,这也并不是NVIDIA科研人员第一次利用生成式对抗网络合成脑成像了,今年五月其曾展示了一款能够将CT扫描图变成2D MRI成像的系统,还有一款快速、准确配准MRI成像的系统。

头条推荐
图文推荐