“垃圾基因”数据库收获了全球遗传学家“粉丝”

  • 2019-10-09 12:00
  • 科技日报

“比喻,如果我们的遗传信息是一座山,遗传学家知道山中有金,但是他们使用use头。我们的工作是为他们创造一个'采矿机'并帮助他们。速度更快;它们展示了我们已经挖掘的内容,并为方便起见将它们构建为资源库。”华中农业大学信息科学与健康医学教授龚静解释了他们的研究。

龚静的团队最近在英国《核酸研究》杂志上发表了三篇文章。他们对各种癌症中遗传变异的功能进行了深入分析,并发现了大量调节非编码核糖核苷酸(ncRNA)和选择性聚腺苷酸化(APA)的遗传变异位点。该数据库开放给世界各地的研究人员共享。

“其中一个数据库已经上线一个多月,并且在22个国家/地区进行了1446次访问!”龚静在接受《科学技术日报》采访时说,她可以吸引来自世界各地的粉丝进行自己的研究。我很高兴。

“垃圾基因”中的“挖宝”

龚静详细解释了其中一项研究,她说:“表达定量性状基因座(eQTL)是指可以影响基因组中基因表达的遗传变异基因座。 eQTL分析是分析遗传功能并发现疾病基因的重要方法之一,已广泛应用于遗传研究。”

基因分为编码基因和非编码基因。但是,当前大多数研究集中在基因相关eQTL识别的编码上,非编码相关eQTL系统的分析非常少见。龚静说,非编码大于编码基因数据。十年前,人们并不认为这很重要。有人甚至称它为“垃圾基因”,但现在每个人都发现它具有越来越多的功能,甚至参与了癌症的发展。

从事生物信息学研究多年的龚靖一年前发现缺乏与非编码相关的eQTL系统的分析,并决定带领团队填补这一空白。他们利用来自癌症基因组图谱(TCGA)的近10,000个样本的基因组和非编码表达信息,系统地分析了33种癌症的遗传变异与非编码表达之间的关系。

他们在33种癌症中进行了大规模的多组学分析,确定了超过600万个顺式eQTL和700,000个与长非编码相关的反式eQTL。他们进一步关联并分析了已鉴定的eQTL和癌症患者的生存信息,并鉴定了8235个长的非编码RNA-eQTL和116个与总体患者生存相关的microRNA-eQTL。

基于此,他们建立了一个在线数据库。在此网站上,其他研究人员可以轻松浏览和查询各种与癌症相关的eQTL数据。

这些eQTL数据将有助于了解遗传风险等位基因如何促进肿瘤发生和发展,并帮助遗传学家更好地理解非编码基因在癌症进展中的作用和生物学机制,因为潜在的癌症靶标开发提供了新思路。

也可以扩展到动植物

科学博士和博士学位选择了生物信息学的背景来给予龚敬更多的跨学科思维。她认为,生物信息学的一项重要职责是为生物学家,遗传学家以及临床医生提供更方便的工具和数据资源。

龚静说:“由于与非编码相关的eQTL研究很少,这意味着可供我们参考的研究方法较少,因此方法的选择,数据收集和分析以及相关数据库为了提高我们的研究的可信度和可行性,我们使用了来自专业癌症数据库的表型样本和生存信息,这些数据是经过行业认证的可靠数据。“

在数据库构建方面,如何体现专业科学,同时使用户易于使用和易于理解?他们花了很多时间。他们更改了多个版本,包括颜色匹配,排版和内容填充。目的是为其他研究人员提供一个直观的数据库,以尽最大努力展现专业数据库的特征。

他们的遗传研究方法不仅可以用于癌症,而且可以用于其他疾病。同时,它可以扩展到动植物的研究。最近,他们通过广泛收集动物基因组并对其进行测序,为13种物种建立了基因组参考板,并创建了用于动物遗传数据填充的数据库。该数据库可广泛用于动物遗传学,育种和质量改良的研究。数据库中的数据和提供的工具可以大大降低研究成本和时间,并大大提高研究效率。

龚静表示,他们将在未来继续维护并不断更新这些数据库,希望使更多的研究人员受益。此外,他们还考虑基于已开发的数据库进一步深化研究,并确定潜在的功能遗传基因座。

特别地,通过生物信息学方法获得的结果与人群的分子流行病学和分子生物学相结合,以进一步探索遗传基因座的功能。希望通过多维分析来发现和识别某些与癌症有关的生物标志物或药物靶标,真正将生产,教育和研究结合起来,并促进临床生物医学实践,使公众受益。

头条推荐
图文推荐