戴文渊 :AI泡沫何时破裂

2018/04/08
       这些年来我最为关注的,是人工智能如何与企业、企业家结合,帮助一家企业成为更好的企业。

在一家企业中,通常有三类人:高层,战略的制定者;中层,策略的制定者;基层,策略的执行者。在过去十多年,互联网和移动互联网改变的正是企业的基层。过去银行与客户接触到主要方式是门店,通过门店内大量的柜员来和客户打交道。而互联网和移动互联网出现之后,柜员的作用被降低了,越来越多的机器替代了柜员去和客户进行交流。但互联网和移动互联网没有改变的是中后台人员的工作,仍然有很多各行各业的专家在企业的中后台从事着他们的研究工作。那么在当前的人工智能热潮下,我们考虑的是什么呢?我们希望机器能够帮助到中后台的这些工作人员,来提升企业的效率。这就是第四范式所想要解决的问题,即我们存在的意义。

第四范式名字的来源与一位名叫Jim Gray(吉姆·格雷)的科学家有着紧密的联系,他是1998年图灵奖的获得者。Jim Gray认为,过去的发展经过了三个范式,其中第二范式——理论范式非常重要,就像牛顿、爱因斯坦提出的理论。而第三范式——科学范式的出现,使我们可以用计算机对理论进行大量推演。最终在未来将进入第四范式阶段,更多的理论将由计算机的数据而非科学家去产生。目前我们可能认为数学、物理是一门科学,但各个行业的业务场景则被看作经验主义。我们希望在未来的各行各业中能出现更多科学家,这些科学家可能不是人类而是机器,通过这些机器发现的规律可能带来人类科学的大爆炸,到了那个时候,科学将不仅仅局限于物理、化学、生物这样的学科,而是每个行业都会成为科学。

其实计算机在做科学研究的时候与人类相比还是有一些不一样的,有它自身的优势,也有劣势。人类在宏观层面更强,而计算机则更擅于微观层面。比如同样一件事情,牛顿在提炼三大定律的时候必然会看到很多物理现象,最终总结出三条定律来对这些物理现象进行概括。如果将这交给计算机来做,方法上则会有所不同,因为计算机拥有无穷的精力,可以做非常细致的事情,可能会将所有物理现象数据化并分割,按照不同数据的区间进行规律总结,每个数据区间总结出三条规律,最后可能总结出三千条定律。将三千条定律叫个人来处理很难,但如果交给计算机,不到一秒钟就可以处理好。计算机与人类做事的方式有所不同。

基于这样的方法论,我们可以把它应用到各行各业,比如人工智能如何做医疗。其实医生也是科学家,会基于他的经验去总结行业规律,比如一个人满足什么样的条件则证明他确实病了,而计算机可以抓住很多医生没有发现的规律。我们去年和瑞金医院合作,帮助他们判断一名患者是否会在三年内患糖尿病。在此之前,医生总结出的规律大概在几十条左右,而通过计算机总结出了50万条规律,这是一个很明显的对比。最终结果是机器判断的准确率比最好的人类专家提升了2-3倍。

在金融反欺诈领域,我们与一家业内领先的银行进行合作。过去他们基于业务数量及案件总结的欺诈规律为一千条左右,是由几十名专家共同合作完成的。在使用计算机之后,根据他们的数据总结出了25亿条规律,比之前专家判断的准确率提升了一倍到五倍多。同样像现在较火的互联网个性化内容的分发,每个APP都需要个性化的内容分发,如何做到个性化?只要把业务规律数总结得比人数还多,每个人分配到不同的业务规律,那就会让每个人看到不一样的内容。其实这背后的原理就是,让计算机总结出更多规律,这些规律很可能每一条单独拿出来人类都可以理解,但由于人的精力有限,不可能总结出二十几亿条规律。人类需要做的是抓大,而不是在这些小的层面投入无尽的经历。

当然今天我们似乎感觉AI(Artificial Intelligence,人工智能)能在很多方面改变一家企业,但落地的时候仍会遇到很多困难。现在大家经常讨论人工智能是否有泡沫,其实我们把它在各行各业的价值发挥出来,就绝对不可能有泡沫出现,甚至可以说我们当前给人工智能的投资都低估了整个技术的威力。泡沫是在落地侧,因为做不到导致泡沫产生。那原因是什么?很重要的一点是人才的分布。

AI人才主要集中在大城市和大公司,薪酬分布在1-5万之间,说明了人才稀缺、价格高。而实际情况可能更差。人工智能的领军人物可能只有它的1%,但是领军人物的薪水可能是普通从业者的50倍,甚至50倍的投入都请不到一个领军人物,这是很糟糕情况。所以仅仅把各行各业在AI方面的领军人物请出来是不够的,数量很少,甚至投入大量的教育资源也未必能培养出多少领军人物。我们需要的不是让那些我们所崇拜的科学家去做AI,而是让更多的科学家们都去做AI,我们需要让这个世界上有几十万,甚至上百万的人工智能从业者。我们并不需要几十万个领军人物,而需要让所有人都能够拥有产生人工智能的能力——这是可以实现的。

我们再设想一下,很多人都养过宠物,比如狗或者猫。我们会教狗做一些事情,但为什么我们不能教机器做一些事情?因为交互方式不一样。我们教狗的方式就是巴甫洛夫的条件反射方式,不断让狗看见鸡腿和铃铛,从而产生联系,最后它听到铃铛就知道要吃东西。但现实中机器并不是这样,机器们是通过矩阵运算、牛顿法的方式来进行学习的,因此我们应该去改变机器的学习方式,让机器也通过巴甫洛夫实验的方式去学习,让更多的人去接触到人工智能。

在这样的情况下,我们开始做一些不一样的事情。由于机器是基于过去的知识与经验,经过无数次思考与进步,最终输出一个最优策略,因此,需要构建用以机器“学习—思考—行为”的外部环境,总结为“BRAIN”:在机器的“学习”过程中,需要为它创造学习环境,业内称之为过程数据(Big-data)、反馈数据(Response);其次,机器的“思考”过程需要匹配合适的算法(Algorithm)以及能够满足数据量的计算资源(Infrastructure);最后,要将AI的决策应用到具体的生产环境中(Needs),在最终的“行为”空间里去创造价值。

但当前行业内全链路的建设还非常不完善,有碍AI价值的最大化。这也是为什么第四范式专注于为企业建设AI核心系统,打通企业产生AI能力的最重要的原因。只有把AI全链路的基础夯实,将良好的学习环境、优秀的大脑和广泛的落地实践相结合,企业的数据资源和算法能力才能真正转化为商业环境中决胜的产业革命动能。

从数据、人才到场景应用,AI天然的跨越工业化的红线门槛过高,导致了目前只有少部分能够合纵连横的大企业受益于此。更多企业想参与进来,往往是选用AI公司提供的特定场景的技术、来解决单一的业务问题,这不仅局限了各行业对于AI应用场景的想象空间,也使企业自身不具备AI能力,在AI推动的技术革命中处于被动局面。

为此,在过去的三年业界都在追捧效果更好的算法时,我们在扎扎实实地研发低门槛的领先算法,去找到技术要进入人类生活必须达到的最优解。发展至今,第四范式已经将AI落地的条件“BRAIN”,封装到了机器学习平台“第四范式先知”企业AI核心系统中。“第四范式先知”企业AI核心系统集合了数据核心、算法核心和生产核心三大模块,囊括了AI“学习—思考—行为”过程的基础要素,并以容易使用的AI系统的形式,让所有普通人成为AI的建立者与使用者,在自己的行业快速、低成本、大规模地落地AI。

人工智能行业已经打响技术落地行业的最关键的战役,厮杀场地也从实验室转战到金融、医疗、教育、制作业等各个工业领域,几十年前,前两轮的人工智能都退潮于此,当下AI又到达了跨越产业应用鸿沟之际。对于人工智能从业者来说,不要一味地追逐算法与炫技,一切阻碍AI落地的困难才是要征服的目标。对于企业家而言,要更加警惕没有场景落地和平台支持的AI“空中楼阁”。



















关闭