郭为:探索健康大数据

2018/09/11

其实这个题目本来离我们很远,我们是做数据的。但是我们在做数据的过程中发现,其实大健康这件事离我们很近。


什么叫大数据?大数据就是在虚拟环境下去还原一个系统,在还原系统的过程中发现这个系统的特征或规律,并利用这些特征和规律在现实生活中进行改变。我想这就是大数据的一个本质。


为什么会和健康有关系呢?其实我们今天在讲智慧城市、大数据时是离不开人的,因为人是城市中最重要的因素。离不开人就意味着我们要获得人的一些数据,人的什么数据最有价值?首先是最有价值、最容易变现的信用数据。第二个就是老百姓最关心的健康数据。事实上,治病、制药甚至保险,都是利用数据、模型在进行。在现实中怎样对一个人、一个系统进行全面的观测和数据采集,从而服务于人本身,这就是我们在做的健康大数据的工作。


我们怎么进入这个领域的?主要是由于当时我们给区域做区域医疗卫生的服务。因为我们有大数据采集、管理技术,通过这些技术从管理上为区域的卫生医疗提供帮助。我们有一些中国知名的医学者朋友,他们在从医学进入数据科学的时候,因为不是专业做这方面工作,出现了专业上的鸿沟,希望我们提供一些支持。在这过程中,我们开始联合做课题。我们最早从肿瘤,如中国常见病食道癌这个项目开始做起,做了六七年,取得了非常大的成功。我们发现,数据对于治病能产生非常大的帮助。其实,我认为如果真正从医疗的角度来讲,某种疾病的数据可能更有价值,而泛泛的数据并没有多大价值。所以我们开始专门探讨肿瘤、罕见病等这些疾病的数据如何获取。


由于我们有科研技术,国家卫计委就给予我们一个授权,希望我们将中国的肿瘤大数据进行统一存储和管理。后来体育总局及很多相关部门就希望把这种模式推而广之,比如用云的方式来做健身房投资等等。


我们认为从数据采集的角度来讲,把一个人从早上醒来,到结束一天的工作,甚至睡觉等这些数据,从出生甚至在胎儿期直到去世的数据,都收集起来,把人整个的一生和数据结合起来,可能会很有价值,因此我们想在这方面做一些探索。但是我们不懂医疗,只能通过数据的方式来做。


由于掌握了数据技术,我们和全球最顶尖的科学家建立了联系,比如剑桥大学肯·杰尼卡这样的研究机构,它主要做全球罕见病、肿瘤的知识图谱,即如何将关于这些疾病的科学论文转化成可认知的知识图谱,这也是英国卫生部非常支持的一个项目。合作伙伴非常喜欢我们,因为可能别人去做计算需要一个月甚至更长的时间,而我们在迅速优化、迭代之后计算时间大幅缩短。比如我们在复旦儿科的项目,按照传统的计算需要两年时间才能将疾病诊断出来,那就失去了医学的意义,但是经我们优化后,30分钟就可以把它计算出来,从而可以直接进入辅助诊断阶段。所以,我们就是在发挥自身的优势来一步步做。


最后,我们希望将来各个环节都可以进行计算,我们为此也单独成立了一个公司,专门做医疗健康。现在飞利浦看到我们的技术后,也愿意与我们一起合作。飞利浦本身就在图像后处理方面,也就是立体还原、3D还原方面做得最好,而还原之后如何进行人工智能和大数据的运算?我们就在这方面进行合作,推出了“神飞云”影像云平台。其实我们就是给各个行业赋能。


我希望通过参加这个论坛向大家学习,看看有哪些想法能够让我们借鉴,此外希望能发掘合作机会,一起做某些方面的药物研究。我们希望能从数据上为加速进入临床提供全方位支持。怎么做?我们在档案里提取有价值的病例、病人,然后跟踪,系统地、分布式地去做数据的验证,使得药物能够尽快上市等。
关闭