创新靠“反馈”推动
过去三年,我经常一有时间就整天待在家里看书。我的看书心得总结成一句话,就叫“增长的动力”。增长从哪里来?听起来它有点像经济学研究,但我作为企业家,对它的理解还是有所不同。
作为改革开放的亲历者和受益者,我见证了过去40多年中国GDP的高速增长,从过去的几千亿元,到2022年增长已经超过了120万亿元。从1960年代以来,美国的人均GDP增速其实也挺陡的。从全世界范围内过去2000年的更大范畴来看,人均GDP增长曲线很有意思。
前1700多年,人均GDP基本没有变化,这意味着什么?第一,它意味着人的生产效率没有变化;第二,人的生活质量和经济增长也不快。但为什么从18世纪末期开始,人均GDP出现了这么陡的增长?因为世界人口也在这200多年的过程中,出现了高速增长。这两个因素叠加起来,就是一种指数型的增长。Industry revolution其实是这200年里经济高速增长的原因,Industry revolution在中文里经常被翻译成“工业革命”,但这个“工业”翻译得不是特别贴切。就像今天没人会说百度是一个工业公司一样,但在英文语境里的百度是Industry,我们代表的是Industry。如果我们认真追究这个叫法,其实应该叫“科技革命”。换句话说,第一次科技革命的代表是蒸汽机,第二次科技革命的代表是电气,第三次科技革命的代表是信息。
有没有第四次科技革命?我认为是有的。这种增长还会持续,而增长是由创新驱动的。“创新从哪里来”是我们应该要认真思考的一件事。我自己的体会是:创新是靠“反馈”激发、推动出来的。无论你做什么,一定要有市场,或者说,一定要有人来告诉你,这个东西是“对”还是“不对”,是“好”还是“不好”,有了这样的反馈就会出现快速的迭代,从而出现好的创新。第四次科技革命主要是以深度学习、算法为代表的人工智能革命带来的,而这种创新愈发明显地是靠“反馈”获得的。
“文心一言”是一个新一代的大语言模型、生成式的AI产品。它是一个非常典型的、要靠“反馈”才能不断提升的模型。这也是我为什么希望及早地把它发布出来的原因。
“文心一言”背后的技术总体上叫做“自然语言理解”,就是电脑具备对人的自然语言的理解能力,具备清晰表达人的意思的能力,具备很好的逻辑推理能力。
当一个机器具备理解能力、表达能力、推理能力时,它非常像“人”,但机器的记忆力、计算能力远比人强。机器有了这样的能力之后,确实会改变每一个行业,它可以拉近每一家企业与客户之间的距离。举个例子,可口可乐在全球有几十亿的客户,你有没有可能对于这几十亿人的每一个人、7乘24小时给他配个专属的客户服务人员?人为上肯定不可能,经济学上算不过账来,但当机器具有这样的能力时,自然就变得可能了。增长就是从这里来的。过去不可能的事儿其实很多时候不是不可能,只是因为太贵了。现在因为技术的进步使得成本迅速下降,效率迅速提高,很多“不可能”都变得“可能”了,因此产生了“增长”。
大模型带来三个方面的增长机会:
一是所谓的新型云计算。过去的云计算,主流的商业模式叫做IaaS(Infrastructure as a Service)是基础的算力、存储等,以后的云计算,主流的商业模式会变成MaaS,(Model as a Service),就是很多的应用是基于现成的模型来进行开发的,所以云计算的游戏规则会因此而改变。
二是行业模型带来的机会。2022年,我们和哈尔滨有一个联合发布的城市行业模型——“冰城文心”,这种大模型面向某个行业进行精调,它不仅能懂比较通用的一般人懂的知识,也会懂得某个行业的知识,能够更好地去解决各行业的问题。这种公司一旦对每个行业吃得比较透,就可以服务这个行业内的很多企业或组织。
第三个机会是应用开发。这个应用开发就是基于现有的文字生成、图片生成、语音视频生成和数字人等能力,开发出来我们今天完全无法想象的应用。倒回到2007年,大家不会想象到今天会有抖音、微信、淘宝等,在AI时代,在大模型时代,也会出现这样量级、现象级的应用出来,只不过它是基于大模型来开发的。
智能交通也能明显提升效率,而提升效率其实就是创新带来的。在智能交通领域,我们在很多城市都有落地项目,基本验证了当初的理论。通过人工智能技术,可以使城市的交通效率提升15%—30%,对应的GDP增长是每年2.4%—4.8%,在北京亦庄、广州黄埔、河北保定、湖南长沙、株洲等城市都有证明。
我再举两个反馈驱动创新的例子:
一是昆仑芯片。昆仑芯片现在特别适合大模型做推理,将来也会适合做训练,这件事百度也做了有十年以上。而之所以它能够用在今天的大模型的推理上,就是因为“有反馈、有应用”。当初我们做搜索的时候,买别人的芯片太贵了,1万美元一片,我们自己做,2万人民币就做下来了,所以就逼着自己做,今天的昆仑芯片每天可以响应1万亿次的深度语义匹配和逻辑。
二是萝卜快跑。它是我们自动驾驶运营服务的品牌,今天已经超过了200万单,在武汉等城市可以进行全无人的商业化运营。所谓的“全无人”就是,不仅没有司机,也没有安全员。今天在一些城市已经可以不用配备安全员了,你要打一辆车,打开车门,里面是没有人的,你只要付费之后,它就能把你带到想去的位置。
我们拼命做大无人驾驶的规模,其实是为了获得“反馈”。只有单量足够多时,才能遇到别人遇不到的技术问题,才能够去解决这些问题,在这个过程中才会产生创新。
最后,我想从技术的角度讲讲人工智能时代发生了哪些根本性的变化。IT的技术栈在之前基本可以分成三层,即底层的芯片层、中间的操作系统层、上面的软件层或应用层。在PC时代, Windows就是中间的操作系统,Intel是芯片层,上层则是大家各显神通去开发各种各样的软件。
在手机移动时代,仍然分为芯片层、操作系统层,只不过操作系统换成了IOS、安卓,上层的软件改了一个名字叫做“应用”。但在人工智能时代,这个IT的技术栈会变成四层。底层还是芯片,但芯片会变成以GPU为主的人工智能加速器,百度的昆仑芯片就是这个层面的芯片。框架层是人工智能的框架,Facebook或MATA都是这个框架,而国内比较领先的是百度的飞桨。框架上面才是模型,“文心一言”就属于大模型。模型可以有语言模型、视觉模型及听觉模型,按照行业分也可以有交通大模型、能源大模型、金融大模型、医疗大模型,等等。
在大模型之上,才是人工智能时代的应用,百度的搜索、智能的信控或者能源、电力等,就是智能的调度系统。这些都是比较典型的人工智能时代的应用。这几层之间相互反馈,使得应用效率不断提升。ChatGPT的调用价格,每一个Token(计算机术语,有“令牌”的意思),调用的价格在一两个月就降低了一个数量级,这说明它的创新速度非常快。这种现象在人工智能时代会比较普遍。人工智能技术快速演进,会带给我们一个非常不一样的世界。所以百度真正相信的就是,用科技的方式让复杂的世界更简单。
(李彦宏 百度创始人、董事长兼首席执行官)