你好,游客 登录
背景:
阅读新闻

遗传密码+大数据:吹散精准医学的迷雾

[日期:2017-09-14] 来源:大数据周刊  作者: [字体: ]

  2015年1月20日,美国总统奥巴马提出美国要开启精准医学研究,从此美国的精准医学走上国家计划的轨道。随后,精准医学在全世界蓬勃发展。

大数据

  首先我们需要厘清,精准医学的核心是什么,精准医学的本质是什么?

  我的理解是,精准医学的本质就是:组学数据与医学的结合。近代生物医学革命性的变化就是得到了以遗传密码为基础的大数据。因此,这个数据刚开始价格很高,现在变得普通、便宜了,任何人都可以得到自己的遗传密码。这些遗传密码构建的数据库可以用来对疾病进行判断。所以说,精准医学的核心就是增加了以遗传密码为代表的大数据。

  第二,精准医学虽然是把组学大数据加到临床医学当中来,但它的意义并不仅仅在于提高了临床医学的几个百分点,可能还有更深刻的意义,就是可以使医疗健康的概念发生本质变化。

  健康科学的核心是什么?是诊断治疗。现在人们是有了病才去医院。有了精准医学以后,可以对任何人在他的整个生命中做全方位的监控。这个时候我们实际做的并不是对病人进行治疗,而是对每一个活在世界上的人的健康做测量,使得有一些疾病不发生或者延缓发生,提高生活质量。所以精准医学的概念下,健康医学的概念将从现在诊断治疗为主发展到精准医学实现以后的健康保障为主。有资料显示,2018年全球跟精准医学相关的产业和带来的产值将达到2000亿美金。因此精准医学研究已经成为新一轮国家科技竞争和引领国家发展潮流的制高点。

  第三个要说的就是实现精准医学要建立哪些基础。一是组学大数据基础。利用大数据分析的理论技术和方法,通过组学数据的获取和大数据挖掘的方法,获得分子水平和疾病相关的知识。如果没有这些基础,我们就不能够得到有效的知识。但目前,我们的基因组充其量只利用了3%,97%都没有挖掘,潜力巨大。

  二是把分子基础的变化、组学的桥梁和当前的影像学和声化学结合起来。精准医学是建立在现代临床基础上,两者是相关的,没有现在临床的结合,精准医学独自是不能实现目标的。

  第四个问题是精准医学现在走到哪一步了。我自己的观点是精准医学刚刚上路,因为我们离达到上面所说的精准医学核心这个目标差很远,而且遇到了很大的困难和挑战。

  例如在遗传密码研究方面的挑战就是基因组当中的暗信息。我们现在可以花五六千测得自己完整的遗传密码。但问题是,这个遗传密码我们能读懂多少?我告诉大家,真正从根本上从规律上能懂的部分不超过3%。

  从这个简单的例子就可以看到,其实我们精准医学才处在起步阶段,我们的起步点就是分析这3%,但在全世界科学家的不断努力下,未来将会做到更精准。

  最后,就是数据分析所遇到的挑战。从样本源来讲,虽然我们的数据源很大,比如说我们要研究肺癌,要得到样品,找100个肺癌的人就很难了。但如果你的样本是百数量级的,这个模型是不熟练的,这样的变量都是几千个,你只能收集几百个,远远不够。而且引发某一疾病的因素不仅仅是每一个基因的变化,还要考虑各个遗传密码的相互作用,也就是说复杂网络。这些复杂网络是动态的,由于网络之间都是有目的的,而且这个复杂网络是双向的,本身不是单一的。所以它可能是双色和多色的。

  另外就是数据共享的问题,我们知道要做大数据,现在每个医院都存在数据,怎么在国家层面上数据共享,不仅仅是科学问题,还有管理问题、共享问题,没有大数据的共享,那我们就是在大数据时代做小数据的工作,所以这个问题实际上是更难解决的问题。

  第五个问题就是机会。举个例子,基因组的研究,我们的遗传密码知道3%,97%都不知道,对精准来讲是很不利的,但对于创新来讲,是绝对的机遇。

  从信息传递的观点来讲,任何一个基础遗传要发挥生物学作用,所谓信息发放发表,就要产生一个由它制造出来的东西,所以当人们了解这97%是有用的时候就去找这97%的遗传密码有没有产物、有没有信息发放。

  精准医学虽然面临巨大的挑战,但是一个挑战引发出无限的机会,所以非编码的研究对疾病的诊断治疗提供了全新的平台,或者为全新的药物的设计和研发提供了方向和全新的思维模式。

  (作者系中国科学院院士,本文摘编自“第二届大数据科学与工程国际会议”发言)





收藏 推荐 打印 | 录入:Cstor | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款