戴文渊:AI泡沫何时破裂

2018/05/08
       这些年来我最为关注的是人工智能如何与企业、企业家结合,帮助企业成为更好的企业。


       在企业中,通常有三类人:高层,战略的制定者;中层,策略的制定者;基层,策略的执行者。过去十多年,互联网和移动互联网改变的正是企业的基层。过去,银行与客户接触的主要方式是门店,通过门店内大量的柜员来和客户打交道。而互联网和移动互联网出现之后,柜员的作用被降低了,越来越多的机器替代了柜员去和客户进行交流。但互联网和移动互联网没有改变的是中后台人员的工作,仍然有很多各行各业的专家在企业的中后台从事研究工作。在当前的人工智能热潮下,我们希望机器能够帮助中后台工作人员,提升企业效率。这就是第四范式想要解决的问题,即我们存在的意义。


       第四范式名字的来源与1998年图灵奖的获得者科学家Jim Gray(吉姆·格雷)有着紧密联系。Jim Gray认为,过去的发展经过了三个范式,其中第二范式——理论范式非常重要,就像牛顿、爱因斯坦提出的理论;第三范式——科学范式的出现,使我们可以用计算机对理论进行大量推演;在未来将进入第四范式阶段,更多的理论将由计算机的数据而非科学家去产生。目前我们可能认为数学、物理是一门科学,各个行业的业务场景则被看作经验主义。我们希望在未来的各行各业中能出现更多机器科学家,通过这些机器发现的规律可能带来人类科学的大爆炸。那时,科学将不仅局限于物理、化学、生物,每个行业都会成为科学。


       其实计算机在做科学研究的时候与人类相比还是有一些不一样的,有它自身的优势,也有劣势。人类在宏观层面更强,而计算机则更擅于微观层面。比如同样一件事情,牛顿在提炼三大定律的时候必然会看到很多物理现象,最终总结出三条定律来对这些物理现象进行概括。如果交给计算机来做,方法上则会有所不同,因为计算机拥有无穷的精力,可以做非常细致的事情,可能会将所有物理现象数据化并分割,按照不同数据区间进行规律总结,每个数据区间总结出三条规律,最后可能总结出三千条定律。


       基于这样的方法论,我们可以把它应用到各行各业,比如人工智能如何做医疗。其实医生也是科学家,会基于他的经验去总结行业规律,而计算机可以抓住很多医生没有发现的规律。我们去年和瑞金医院合作,判断一名患者是否会在三年内患糖尿病。在此之前,医生总结出的规律大概在几十条左右,而通过计算机总结出了50万条规律,这是一个很明显的对比。最终结果是机器判断的准确率比最好的人类专家提升了2~3倍。


       在金融反欺诈领域,我们与一家业内领先的银行进行合作。过去,基于业务数量及案件,由几十名专家共同合作总结的欺诈规律为一千条左右;在使用计算机之后,根据他们的数据总结出了25亿条规律。现在较火的互联网个性化内容的分发也是同样的道理,让计算机总结出更多规律。由于人的精力有限,不可能总结出二十几亿条规律。人类需要做的是抓大,而不是在这些小的层面投入无尽的精力。


       今天我们似乎感觉AI能在很多方面改变一家企业,但落地的时候仍会遇到很多困难。现在大家经常讨论人工智能是否有泡沫,其实我们把它在各行各业的价值发挥出来,就绝对不可能有泡沫出现。原因是什么?很重要的一点是人才的分布。


       AI人才主要集中在大城市和大公司,薪酬分布在1~5万元之间,说明了人才稀缺、价格高。人工智能领军人物的薪水可能是普通从业者的50倍,但这50倍的投入往往都请不到一个领军人物,这是很糟糕的情况。我们需要的不是让那些我们所崇拜的科学家去做AI,而是让更多的科学家们都去做AI,让这个世界上有几十万,甚至上百万的人工智能从业者。我们并不需要几十万个领军人物,而需要让所有人都能够拥有产生人工智能的能力——这是可以实现的。


       再设想一下,很多人都养过宠物,比如狗或者猫。我们会教狗做一些事情,但为什么我们不能教机器做一些事情?因为交互方式不一样。我们教狗的方式就是巴甫洛夫的条件反射方式,不断让狗看见鸡腿和铃铛,从而产生联系,最后它听到铃铛就知道要吃东西。但现实中机器并不是这样,机器是通过矩阵运算、牛顿法的方式来进行学习的,因此我们应该去改变机器的学习方式,让机器也通过巴甫洛夫实验的方式去学习,让更多的人接触到人工智能。


       在这样的情况下,我们开始做一些不一样的事情。由于机器是基于过去的知识与经验,经过无数次思考与进步,最终输出一个最优策略。因此,需要构建以机器“学习—思考—行为”的外部环境,总结为“BRAIN”:在机器的“学习”过程中,需要为它创造学习环境,业内称之为过程数据(Big-data)、反馈数据(Response);其次,机器的“思考”过程需要匹配合适的算法(Algorithm)以及能够满足数据量的计算资源(Infrastructure);最后,要将AI的决策应用到具体的生产环境中(Needs),在最终的“行为”空间里去创造价值。


       但当前行业内全链路的建设还非常不完善,有碍AI价值的最大化。这也是为什么第四范式专注于为企业建设AI核心系统,打通企业产生AI能力的最重要的原因。只有把AI全链路的基础夯实,将良好的学习环境、优秀的大脑和广泛的落地实践相结合,企业的数据资源和算法能力才能真正转化为商业环境中决胜的产业革命动能。


       从数据、人才到场景应用,AI跨越工业化的红线门槛过高,导致了目前只有少部分能够合纵连横的大企业受益于此。更多企业想参与进来,往往是选用AI公司提供特定场景的技术,来解决单一的业务问题,这不仅局限了各行业对于AI应用场景的想象空间,也使企业自身不具备AI能力,在AI推动的技术革命中处于被动局面。


       为此,在过去三年业界都在追捧效果更好的算法时,我们在扎扎实实地研发低门槛的领先算法,找到技术要进入人类生活必须达到的最优解。发展至今,第四范式已经将AI落地的条件“BRAIN”,封装到了机器学习平台“第四范式先知”企业AI核心系统中。“第四范式先知”企业AI核心系统集合了数据核心、算法核心和生产核心三大模块,囊括了AI“学习—思考—行为”过程的基础要素,并以容易使用的AI系统的形式,让所有普通人成为AI的建立者与使用者,在各自行业快速、低成本、大规模地落地AI。


       人工智能行业已经打响技术落地的最关键战役,厮杀场地也从实验室转战到金融、医疗、教育、制造业等各个工业领域。对于人工智能从业者来说,不要一味地追逐算法与炫技,一切阻碍AI落地的困难才是要征服的目标。对于企业家而言,要更加警惕没有场景落地和平台支持的AI“空中楼阁”。

关闭