我以前在大学担任教授,在学校里做了很多研究,后来去了商界。我认为学术研究和社会发展是不可分割的。当进行学术选择时,如果选错了方向,会成为一生的悲哀。
未来大数据
举个例子,说起大数据,大家通常会想到存储、速度、算法、算力等。但如果对于大数据对社会的价值、社会规则对大数据的约束、商业模式和数据之间的关系、数据的伦理以及获取数据的艺术这些要素不能很好的理解,那么你的研究一定是苍白的,因为没有办法在丰富的世界里表现出它的价值。
我读研究生的时候,最火的研究方向是计算机网络、VR、人工智能,也有一部分人从事自然语言理解的研究。在美国国家标准技术研究院学习期间,我认为未来的网络协议需要支持更安全、更复杂、更可靠的服务,为此我们做了很多标准。但一直到今天,TCP(传输控制协议)仍然主导着网络世界,此前的研究并没有用上。
所以,当我们进行学术研究时,我们需要看清社会的发展趋势,看到未来可能承载你的成就的平台,而不能只是顺着所有人的共识去做。当所有人都认为某个方向就是未来的时候,最好不要再去做这个领域,因为太晚了。当别人对你想进行的研究持怀疑态度时,可能那就是你最好的机会。
在大数据时代,我们首先要认识到时运来自于什么。大数据时代的研究和过去所进行的很多研究的根本不同点在于环境。数字社会支撑了大数据时代。现在的计算成本、存储成本、通信成本都越来越低,平台越来越多,网络实体越来越丰富,获取数据的成本也越来越低。
但是为什么大数据的应用并不如预期?互联网是获取个人数据的主要渠道,数据是每位用户自发提供的。但是想要进行精准的计算,支持可靠的算法,不仅要有个人数据,还需要来自于组织的数据。也就是说,解决大数据应用问题需要高质量的多源数据与相应领域知识的结合。数据融合,不只是数据层面的融合,还包括数据与规则的融合、数据与伦理的融合,以及数据与商业模式的融合。数据只有和商业融合在一起,才能形成一种新的模式。我们要超越的不只是对数据的认识,还有对其他行业的认识。
另外,大数据研究的思维方式也在发生变化。在数据利用上,需要有跨越技术的思维。没有高质量的数据,就没有精准的应用技术。但高质量的数据从哪里来?它来源于对相应领域的知识的理解。同时,数据利用需要开放合作。虽然每个人都倾向于有自己的技术、算法,但事实上,算法和技术正在更快速的平台化、免费化。大数据和人工智能的算法,未来一定是充分免费的。在这个领域里,几乎没有独立创造商业价值的空间。因为大数据和人工智能只有在应用中才能得到完善,在解决方案中才能获得价值。
未来,大数据领域的赢家一定是赢在思维上,靠新学术思维取胜。当你不能构造一种崭新思维的时候,你的时运就和这种技术无缘。
此外,大数据也为我们带来了很大的商业空间。其一是个性化与精准化营销,银行业有客户意见挖掘、高端客户流失预警;媒体行业有热点分析、个性化内容推荐;航空行业有常旅客识别、旅客画像。其二是组织高效运营与风险管控,金融行业有防欺诈,航空行业有防恶意占座、机票价格监测等。
在大数据应用过程中,伦理问题是需要特别注意的,其中涉及到隐私、公平、安全、社会价值、开放等。找到技术和伦理的结合点,会是大数据未来发展的重要领域。数字社会已经覆盖了中国大部分人口,一个没有文化、没有伦理的数字社会,不是可持续发展的社会。
综上,未来大数据发展有以下几个趋势:首先是个人与行业数据的融合,没有这种融合就没有精准和可靠的应用。二是技术和工具的平台化、普及化。三是纯技术的商业空间更小。四是大数据的行业应用更有价值。五是数据+算法+领域知识+商业模式不可分割。
东软对技术的思考
在过去的 27 年中,东软致力于推动我国国民经济基础设施与提高重要民生领域的信息化水平,在众多行业拥有领先的市场占有率。东软为 7 亿人提供社会保险服务与支持系统,其中电力营销系统为 4 亿人支付电费提供服务。对于这些技术的意义,我们需要有超越技术层面的思考。
我以医疗健康为例谈超越技术。医疗要求用复杂的生态系统来实现。当我们谈到大数据时,就会谈到健康;谈到健康时,就会谈到医院。我们要在这中间找到技术发展的方向。当找到了技术发展方向时,就可以构造组织,构造人工智能应用的范围;然后用人工智能技术控制医疗费用支出等。我们要构造互联网云医院,使得更多的医疗行为从大医院走向基层。我们要实现医疗的公平性,控制不断上涨的医疗费用。我们要实现医疗的分层次服务,建立个人的动态健康与医疗档案,使医疗更加个性化和精准。数据和 AI 会让基层医院更强大。
由此可见,超越技术已经变成从事技术研究的必须选择。如果不了解社会,不了解生态,不了解其他行业,数据又从何谈起?
大数据是新商业的支撑,只有在开放、融合、创造的环境下,大数据才能体现其价值。教育、科研方式与过去的传统模式不一样了,而制约它的正是,我们是否能适应这个时代的变化,适应新商业、新零售、新学术、新科研。