郭为:决定颠复性技术突破的因素

2019/03/25

       其实我进入这个领域完全是被动的,我也不知道生命科技能干什么,我只是把这个被动的过程跟大家分享,看看我们后面有没有什么机会去合作。

       中国的整个计划生育的人口,政策的数据模型是我们出的,我们做了十几年,所以说实际上温总理在的时候,结论已经出来了,但是温总理说交给下一任政府,所以说克强总理上来就改了一胎化的政策,变成二胎化。我们人口国务院所有数据模型里面我们是做得最好的,在卫计委和卫生部合并的时候,因为李斌主任当了主任,所以说我们就有机会参与到,就叫卫建委的“十三五”规划,做“十三五”规划的时候,因为我们是搞数据的,所以说我们提出医疗健康大数据的问题,就是从数据的角度怎么来看这个发展,这样的话整个卫建委的“十三五”的IT规划就围绕着大数据的应用。卫计委说讲了半天,这个理论能不能给我们做一个例子,怎么来完成。

       我说这也是很被动的,因为当时我们跟医科院,由于各种各样的关系,我们有一些长期的项目合作,863、我们也是提供运算能力,因为医生有运算恐惧的,他们愿意把这块计算采集计算交给我们做,我们就是半卖半做,成本都控制不住,就考虑到长期的医疗,你看病的时候,咱们不能做别的,就在这方面帮助医生成名。做这个过程中,我们感觉健康医疗是一个很有价值的,所以我们感觉能不能把健康医疗数据作为一个案例,一个demo,就是整个健康大数据是一个整体,把肿瘤能不能拿出来作为一个方面。后来卫计委就同意了这块,就和整个中国的,正好东肿瘤也是国家的肿瘤数据中心,所以说围绕这个就开始做这件事情,做的过程当中,实际上我们和交通大学,原来张杰当校长的时候我们有很好的工作,所谓合作就是让我们赞助他钱,他要请教授和什么的,他预算内的钱不够,他就给我各种地方挂名,他有一个全中国最大的医学转化中心,那它跟brog有合作,他们又没有运算能力,因为交大都是医学专家,所以说能不能帮他们瘦一瘦中国的肌肉,给了我们一个非常小的case,就展示一下我们会做生命科学的计算。跟brog交流过程中,发现我们有这个潜资,就某种情况下外包给我们一些数据计算的能力,这样使得我们学会了怎么样去计算基因,怎么样把基因做计算。

       由于做了基因的计算之后,实际上再加跟卫计委大数据,因为全球做医疗数据方面整理最好的是英国,所以说中国政府就跟英国建立了一个合作关系,由我们来实施,把中国的预报系统完全学习英国的预报系统,在这个过程当中,剑桥大学吉林肯就参与进来了,他又跟我们说,你们能不能跟他们合作,所以说我们一路来,就是在被动的,不知不觉的走进了一个叫生命计算的领域。

       所以在去年年初,因为这样一个实践过程中,我就产生很多思考,虽然我们过去做了很多商业的运算,但是还是第一次走向一个直接面对科学的一种运算,所以说我自己总结出来,未来颠复性的技术,给中国科学党组汇报的时候我就说,颠复性的技术可能是数据产生的,今天数据产生,我结合我在医疗领域的实践可能有三个东西最重要,能不能突破?第一个我想就是知识突破。几位科学家刚才讲了,我认为在知识突破层面上,对世界的认知层面上怎么样去突破,这是一个很大的课题,这是第一。

       第二个课题,走到现在,人类是计算能力的突破,实际今天我们比如说手机这些,其实就是计算能力的突破,大家都在讲80年代,80年代的286是12道的运算速度,那我们今天的手机是2G的运算速度,其实今天整个运算速度的提升,使得大数据成为可能。那我们当时在跟复旦大学儿科做合作的时候,就用肯知尼的基因图谱,做小孩的基因运算的时候,传统的运算能力是24个月,那就没有意义了。我们现在通过跟brog的合作(音)掌握了新的运算方法,加上我们对技术架构的了解,就可以30分钟完成预算,30分钟完成预算就可以进入临床。去年2018年我们做了17000例小孩罕见病的诊断,这个诊断超过了90%多,还是比较准确的。

       第二个就是运算能力,其实我们的长项是运算能力上怎么样不断的提升。去年我们还有一个突破,除了辅助治疗之外,我们还和医药结合,帮助一些大的国外的药厂开始做运算。第三,我认为很重要的颠覆就是数据,如何把数据拿到,传统的方法都是采集一步一步走,如果说把一些沉淀的数据,或者是采集过程中快速的获取数据,那么长期以来,这是我们的长项。今年1月份我们和北京大学联合得了一个国家发明一等奖,也是北大出来的,北大从49年建国之后,还没有拿过一个国家发明一等奖,这是第一个。自然科学奖拿过,发明一等奖没有拿过。

       这个就是我们跟雷红院士团队一起做的,就是在数据采集上,这里面比较复杂,我们叫黑箱理论,我们不需要打开数据,也不需要打开数据软件,我通过系统工程的办法来获取活化的数据资源,这样就使得我们在数据领域里边,谷歌和苹果做到可读不能写,我们做到可读可写,重构这个数据。整个下来,我认为整个未来技术性的颠复,创新的颠复就是三个领域,你如何在知识图谱上,第二个是计算能力上,第三个是数据采集上,包括大家今天讲的AI的,讲了各种学习的技术,我认为都是在这三个方面来辅助支撑,使得它做得更好,但是你再支撑,比如说知识图谱,没有一流的科学家,它是算不出来的,所以说它很多东西,人的功能是很难替代的,但是计算能力是综合性的东西,特别是今天说的软件,因为我自己搞软件,可能是自夸一点,确实是未来这个世界是软件高于一切,就是怎么样在软件的形式上有一个新的认知,特别是云来了之后,云对软件的定义又发生了一个变化。这么多年来,计算机大的更新变化,就是软件所影响的变化。

       所以我讲,我进入这个领域,完全是被动的,但是歪打正着,赶上了刚才田源倡导也好,几位科学家倡导也好的大健康领域,当时卫计委主任鼓励我进入这个领域,就说未来这个领域是财富最多的,因为我感觉这个太难,一开始我不太想进入这个领域,因为国内有那么多搞医疗领域信息化的公司,我们再参合,大家再PK,因为我自己本身是做金融的,做政府数据的。确实是进入到这个领域,将来还需要各位老大多给指点,如果有需要,我们在计算能力上提供一些支持,我们也可以开展很好的合作,我们其实别的不会,就会计算,我们第一个突破是辅助治疗,第二个突破是制药方面的支撑,第三个方面我们希望将来在保险领域做一个支撑。前两个已经是突破了,已经做完,现在我们正在攻第三个方面。确实是很花钱,到现在没有回报,我们现在做所有的东西都没有财务上的回报,一直在投入。

关闭