陈宁认为,大模型是一种全新的方法论,通过这种方法论让AI涌现出来人类的智慧。
在他看来,这个方法实际上是把跨领域的多行业的人类的全体的指示体系,通过超大规模算力的集群,输入到了一个超大规模的类人脑的神经网络的数学模型里面,然后通过transformer等等的一系列的计算范式,让这个大模型涌现出来很多领域只有人类才拥有的内容生产逻辑推理的一些能力。
“这个能力是在去年当大模型整个神经网络规模的参数突破了千亿级,大概类比一下,相当于是我们人类复杂度的1‰-1%,这个时候它随着人类的指示体系的输入,随着模型参数的扩大,它开始用一些概率预测的方法,能够预测下一个字节的输出,并且这个预测度达到了我们人类逻辑推理、大脑思考的准确率,跟我们的知识、跟我们的语言高度匹配。所以,涌现出来非常多的很神奇的一个功能。”他说。
但他也指出,大模型未来核心问题还是应用和成本的问题,因为现在芯片的成本,尤其是训练和推理的成本比较高昂,尤其是大模型。
“我们在过去半年追逐的过程中,我们越来越会回归理性地去思考,大模型今天可能相当于是一个本科的全科毕业生,但是它到底在不同的行业怎么去应用,还是需要跟行业的知识去结合,通过行业大模型去真正推动它的落地。”