张予彤:如今,人工智能肯定是一个非常火热的话题。我大约是从2012年开始关注人工智能,那时人工智能在人脸识别的单向任务上超过人类,之后就不断涌现出新的能力,像AlphaGo在2016年赢了韩国棋手李世石,AlphaFold解构了蛋白质的结构,以及后来谷歌TensorFlow模式将人工智能直接带到了一个并行计算加预训练的时代。今年ChatGPT又把人工智能推向了一个让公众充满了想象力的阶段。
那么,请大家谈谈在整个人工智能发展历程中,有哪些演进是突破你们认知的?
刘劼:ChatGPT对我来说很震撼,我个人觉得有一个类比很神似:ChatGPT在人工智能领域出现,相当于互联网时代浏览器的出现。在浏览器出现之前,互联网是一个科研工具,是垂直行业的应用,浏览器出现之后,互联网变成了一个公众的工具。ChatGPT出现之后,人工智能技术开始平民化、公众化,大家有了一个相对通用的AI界面。当ChatGPT这个飞轮转起,能不断产生更多的数据,从而得到更好的模型,而且,它一旦转起来,很难被阻挡。其实,ChatGPT的核心算法早在2019年就被写在论文里了,但它周围这些完整的工业化体系才是它的核心。
周宇翔:对于ChatGPT而言,我也没有太想明白它在工业里面会孵化出怎样的创新。有人说它可能会自动生成产品的图纸,也有人说它可能会把制造里面的专家知识体系赋能于工人,但这些并不一定需要用ChatGPT,以前的推荐系统、专家系统已经有这样的应用,所以这个部分生成的属性,我没有想得特别明白。
但有另外一点我是非常确定的——我们都在一个软件的生意里。过去的二三十年,软件都是反人性的,一个软件发展壮大之后会有很多页面,它的用户指南会变成厚厚一本,但ChatGPT第一次让软件从业者看到了一个机会,它可能将有效地颠覆未来所有软件公司的形态。比如,过去的软件多页码,需要不断点击跳转按钮,是逆人性操作,而ChatGPT可以将其变成很自然的语言交流。早期我们为什么能打败一些大厂,进入到智能制造领域?就是因为我们的产品采用的是APP端、手机端、穿戴式、IOP交互,让传统在PC上的多页面使用变得更简单,但我们在今天仍然做得不够。自然的语言交流,这个远景也是我们在追求以及需要进行自我颠覆的部分。所以就像刘院长所说,对于软件从业者来讲,可能ChatGPT就是类似于互联网浏览器一样的存在。
韩璧丞:ChatGPT最令我感到惊讶的是它的进化速度,其实它在2018年就发布了第一版,当时用起来还不是那么完美,但到了GPT3.5后开始突飞猛进。无论是对于人工智能,还是其他技术,进化都是非常重要的一步,达尔文在写出《物种起源》之后的160年左右,诺贝尔奖又颁给一个关于定向进化的研究。
AI算法的进化所面临的环境是什么?它的自然选择又是什么?我觉得这是需要我们去关注和思考的问题。现在很多机器学习都来自于人为的标注,这些标注是否会成为限制算法和这套逻辑进化的制约因素?或者,究竟是什么会引导ChatGPT下一个方向的进化?这是我现在非常关注和好奇的,也想就此请教下刘老师。
刘劼:飞轮效应也是进化快的一个重要因素,就是用得越多,产生的数据就越多,而优质数据越多就会得到更加优化的模型。ChatGPT就是为了对话而进行的人机交互设置,那么收集起来的数据就非常有针对性,无论是软件交互,还是文本图形交互,定向数据的生成对内容的优化很有帮助。而迭代速度与它周围的工程环境密切相关,工程环境的迭代速度,实际是检验一个企业或者一个工具有没有核心竞争力的最核心因素。从这个角度上讲,在交互领域,将来很可能会出现赢者通吃的情况。
张予彤:现在机器学习的发展有点类似于当年的集成电路,集成电路每过18—24个月性能翻一倍,价格便宜一半,现在人工智能大模型也是随着模型参数不断地上升,随着数据质量的不断提高,它的性能也变得越来越好,而且涌现出新的智能能力。
张大磊:生成式AI相对应的是分析式AI,我举两个案例帮助大家更好地理解这两个概念。我们曾邀请大量的医生交叉标注了很多糖尿病人视网膜的照片,然后让算法去训练,最终获得了全世界第一个人工智能三类自动出诊断的NMPA(国家药监局)注册证。这是分析式AI。
生成式AI方面,我们从眼底观察了39万人的血管和神经发展变化,让生成式AI自己学,自己判断这个人接下来会有什么发展变化,患心脑血管疾病的风险有多高,等等。最终这个工作做到了96%以上的敏感性和特异性。很多信息存在于我们人类五官的感知之外,但足够丰富的数据就有可能让算法找到一些规律,这些规律再在现实生活被验证。验证改进本质上就是GPT里面的“P”(Pre-training),就是一个做information的生成式AI。
张黎刚:我认为在医疗领域里,AI或终将彻底改变医疗服务模式,且我国可能较其他国家更早实现。究其原因是我国高质量医生和优质医疗资源比例较少,且主要集中在三甲医院,AI可以复制专家经验,辅助医生诊断,帮助基层医院、县级医院、市级医院提升水平。举个例子,目前,在爱康旗下体检中心做心电图、影像筛查等项目,将首先通过AI智能算法辅助诊断和读片。以在爱康体检中心接受心电图检查的客户为例,体检过程中有 3‰可能发现疑似房颤,基本几分钟,体检客户的小程序就会收到疑似房颤提醒,爱康会立即安排医师提供咨询与会诊。
此外,爱康集团已在全国成立了十几个影像阅片中心,用户拍过的每一张CT、X光都将实时传输到云端,交由AI阅读后进行初筛和分类,再精准推送给相应水平的医师进一步诊断。
大家来做体检,最关心自己的身体有什么问题、会不会有癌症、将来会发生什么状况,甚至还能活多少年。爱康是行业里第一家开始做健康预测的公司,我们会从三年前开始,根据血糖血压各种指标,预测体检者未来五年的身体状况。我相信ChatGPT有可能会比我们做得更好。
谢欣:飞书有一个产品叫多维表格,它一直没有一个好的英文名字。于是,我们就用 ChatGPT给它起名,得到的结果是“ZenTable”,Zen就是“禅”。这个名字令我眼前一亮,同时,ZenTable也是所有名字里数据反馈最好的一个,但我们很纠结,因为有些同学在主观上认为这个名字不好,因为“Zen”有很强的东方地域属性,不利于在西方推广。随后,我们又带着这个顾虑去问ChatGPT,得到的回复是“没错,ZenTable令人容易想到东方,但它很时尚,会带来平和、宁静、安详的印象。”最后,基于和飞书传达的高效创新的理念不协调,我们还是放弃了这个排名第一的名字。
这个名字是ChatGPT取的,数据分析也排在第一,但最后因为它自己的解释,我们又将这个名字否定了。通过这个有意思的小故事,让我意识到,ChatGPT一定是一个新时代的开始。
张予彤:有件事让我非常意外,我们最开始接触AI的时候,觉得AI会最先冲击到一部分体力劳动,但这我们看到它对认知劳动的冲击其实比体力劳动更高。人的智力系统是基于碳基生物而生长出来的智力系统,但硅基生物是一种全新的生物,它的智力系统是在大规模的GPU集成上训练出来的一种新形态,可能跟人的智力系统也会完全不同。
接下来的一个问题是,随着人口老龄化,医疗机构服务的压力也会越来越大,医疗机构应该如何拥抱人工智能?
张黎刚:专家在每个垂直的领域里都是top(顶尖),但让他理解所有的医疗知识不太可能,在这方面,单一的专家一定会输给机器。多年来我们一直想定义一个健康指数,但很难做到,因为身体健康指标太多,还需要知道每个指标的权重。如今ChatGPT的出现,或许会让这个指标的实现迈进一步,因为从单一指标的对比到综合指标的对比,最关键在于海量医学信息、医学数据的收集、对比和分析。我觉得,在分析健康状况进行健康预测方面,ChatGPT一定会比人做得更好!
张大磊:Geoffrey Hinton是AI领域里一个很厉害的老师,他把GPT4比作化茧成蝶,我特别感同身受。对人类而言,大到历史上几千年里发生的事无法被全部传承,小到每个人在死去前还有未被传递出的信息,都是属于人类的“茧”,而GPT则有机会去掉这层茧。尤其对于医疗行业来说,绝大多数医生知道的信息都应该被收集起来,且可以被任何一个普通人随时访问,这是一个最基础的健康基础设施。我们这代人则有责任把散落在各地的知识给储存下来,把它变成一个公共服务。
韩璧丞:中国现在大约有一亿多人患有抑郁症,除了吃药,其余主要靠语音交互沟通,但现在中国的精神病医生大约只有七万人,远远满足不了目前抑郁症患者的需求。人工智能是否能在脑科学方面有所作用呢?多年来我看了很多对于大脑干预方面的研究和文章, MIT(美国麻省理工学院)发的一篇文章让我深受震撼。他们研究的东西非常简单,研究猴子为什么看到香蕉就会流口水?它到底是看到香蕉上的什么东西流口水?对此科学家做了一个试验,让猴子看YouTube里的视频,看了大约一百多万张图片和视频,然后把电极放到猴子大脑里。如此反复实验,最后科学家可以准确地用一些图片去特定地激活猴子大脑里的某片区域。换句话说,我们现在给猴子看一张白纸,它都有可能口水直流。
在大参数模型下,学习参考的数据如果放大到一百万以上,它对大脑的干预将非常庞大。当大模型出现的时候,可能会让神经科学方面出现最突出、最快速的变化。例如,传统的助眠方式包含吃药和声光磁电,但这种方式无法获得大脑数据的反馈,于是我们在所做的睡眠产品中加了大量传感器,用于实时检测大脑不同的状态,然后给予不同的干预。在这个闭环下,每个人都有一个专属的睡眠模型和方案。所以我认为,在神经科学方向,人工智能会是一个很好的应用。
张予彤:最近协同软件领域也非常热闹,微软也发布了Copilot。请嘉宾谈一下对接下来智能产品的思考。
谢欣: Copilot的创新非常厉害,也非常值得学习,它对各行各业的影响,尤其是对纯信息类的影响,确实非常非常值得重视。很多时候,一些产品并没有想针对某个领域做优化,但结果往往是它比那个领域的专业产品做得还要好。
例如,对大多数人而言,谷歌软件都是做得很好的翻译软件,但很少有人能意识到,ChatGPT的翻译品质至少在中译英方面来讲,比谷歌翻译做得好,这就很可怕了。其实ChatGPT完全没有做翻译,它是做生成,结果它的翻译效果比谷歌翻译做得好。还有一些领域,也属于它没有想针对这个领域做优化,但是它的结果比那个领域的专业产品还要好。所以,我认为有一点很确定,就是Copilot的未来潜力,以及对各行各业的影响,真的很值得认真学习。你想不到的是,它好像从来没有针对你,但它一不小心可能就超过了你。这是很厉害的。
周宇翔:今天,我们习惯仰望星空,但是对于中国制造业而言,还得脚踏实地。ChatGPT之所以产生这么令人惊艳的效果,是历史积累的高质量数据训练出的结果。相比之下,中国制造业的高质量数据积累还不够,接下来,如何把数据积累这一步完成,是一个非常值得思考的问题。
另外,在工业领域我们一度讲究精准、精确,不能出丝毫差错。传统算法在工业的应用,就是运筹学优化,跟解方程一样,输入产出都非常精准。但在现实情况中,灵活性让一些企业脱颖而出。我们的一个客户基于消费端、营销侧的大数据洞察,每个月甚至每周都在推陈出新,迭代不同的产品,甚至还是动态定价。这样的情况下,想尝试建立过去那种标准模式,去做优化,有可能是个死胡同。
张予彤:现在我们看到GPT–4,它还会有GPT–5、6、7,可能会到GPT–10,如果GPT–10问世了,它会是什么样的?对于未来通用人工智能研究方向,大家有什么样的期待?作为中国创新企业从业者,大家又将如何应对这场由人工智能带来的产业变革?
刘劼:大家已经提到分析式人工智能和生成式人工智能,我想再简单总结下两者的区别。英文讲Know knows,你知道你知道什么,这是分析式的东西,我们把人的知识教给它,这是第一步。第二步,I don't know knows,你不知道你知道这件事,生成式人工智能在给我们做这件事。你不知道你现在所有的知识,能够引发出更新的知识来。为什么ChatGPT让人惊艳?因为它回答出来的内容,是我们认为自己应该知道,但实际不知道的内容,所谓“未知的已知”。未来可能还会产生所谓探索式的人工智能,即“已知的未知”。人类的探索就是永无止境的。
有一种很简单的生物叫海鞘,它小时候在游泳时,有大脑帮它判断环境,可一旦找到着床的石头后,它就把自己的大脑消化了。这个例子说明,大脑产生的最初原因就是探索。我们现在所做的人工智能,终究还是对已知知识的整理和在已知知识基础上去衍生出新知识。在未来,人工智能可能会自己探索知识,自己生成对这个世界的认识,这可能就是硅机智能跟碳机智能进行并跑,那时硅机智能会有探索能力,并带来更大的变更。
谢欣:从目前来看,大模型语言、垂直行业的模型,成本还是很高。在这种情况下,能做的公司不是很多,更多公司应该是基于它做一些应用。同样的事,一年前做和一年后做差别很大。我认为,预测未来应该怎么做,会做成什么样子比较难,但是保持拥抱的心态很重要。其实绝大多数创新产品的结构都是一样的,理解起来并不复杂,只要大家坚持探索,市场前景还是非常广阔的。
张黎刚:其实美国有过一些垂直医疗搜索引擎,但做得不是很成功。ChatGPT出现以后,我期盼着医疗领域也能诞生这样一家人工智能的公司。爱康也跟一些人工智能在谈合作,但我们没法把千万级客户信息,给到ChatGPT,我不愿意做。因为这些都是隐私信息,出去之后不知道会怎么样,我们不敢冒这个险。下一步,爱康还是期待能拥抱更多人工智能领域优质企业,在保证客户数据隐私的前提下,一方面获取可精准、系统评估人群健康指数的模型与方法,帮助客户清楚了解自己的健康到底能打多少分、处在全人群中的什么水平;另一方面,帮助客户实现全生命周期个体健康趋势的精准预测,让健康管理和有效干预更加有的放矢。
张大磊:每个人刚生下来的时候,大多数功能都差不多,然后以人种区分,未来的大模型就是这样,相当于人种。人长大以后。会上不同的大学,学不同的东西,未来在大模型上的应用相当于上不同的大学。过去很多年,计算机是人脑自行车,我相信在未来,大模型是人脑的助教。这是我的理解。
韩璧丞:在脑机接口这个垂类里,大模型人工智能最大的一个未来应用,在于下一代交互。就像马斯克所说,ChatGPT最令人惊艳的并不是它的底层AI,而是它开发了一个让每个人都可以用,都可以快速体验的交互场景。Facebook在脑机接口领域收购了一家叫Control lap的公司。这家公司主要生产臂环,采集人的动作意图。我们控制手需要调动34块肌肉,还有神经牵引,我们说话需要100块肌肉,facebook想做的事情就是在未来可以用意志去进行外界交互。对于我们而言,给残疾人做假肢也是一样的原理。我们的第一代假肢,使用者在佩戴半年后才可以弹钢琴,而现在的产品可以让使用者佩戴几周后就学会弹钢琴。
技术在快速演进,当大模型人工智能结合人体体征数据和神经信号,在未来几年内,我们一定会看到下一代交互场景的出现。我们现在之所以感到ChatGPT非常伟大,是因为它的神奇性,是因为我们输入一段文字,发现它可以像人一样出现很多反馈。那么意识交互,远程控制,还有直接读大脑,这个神不神奇?这个可能会更加神奇。在七八年前,除了Open AI这家公司以外,还有另一家公司Neuralink,也是马斯克成立的,可能再过几年,另一个惊艳的产品就会出现在脑机接口领域里。
周宇翔:我前段时间读了哈佛医学院一篇关于GPT的论文,它输入两套数据,其中,第二套数据是人的大脑在核磁共振,以及脑电波几种不同的仪器下产生的信号,然后去训练这个模型。后来它就只给这个模型输入脑电波的信号,ChatGPT基于前面学习的关联性,输出当时这个人可能会看到的场景,差别已经变得非常小。它是不是一个大脑?本质上不是,但从实际感知上已经是了。
我在思考,在工业场景里,随着中国老龄化,以及愿意当工人的人逐年减少,以前积累的工业领域知识,能否用大模型承接?我觉得它不能100%取代,工人还会存在,但是以前的老师傅会减少。我们未来所畅想的是,如何沉淀工业知识。如果能把高质量数据积累起来,中国在制造业的认知和判断上将比任何国家都高效。我很期待那一天的到来。
刘劼:现在对很多行业来说,至关重要的是改变“人”,不是“人”去改变“模型”。怎么去改变我们的工作方式,我们的思维方式,都是需要深思的问题。大家讲到prompt learning,怎么理解和评判它给出的结果,这个可能是未来劳动力很重要的能力,也许从中小学开始培养都不晚。另外,由此产生的一系列社会问题,如伦理问题、劳动力问题,一家独大之后的利益分配问题,等等,需要我们认真思考和对待。
张予彤:目前 ChatGPT做的各种事情,都是人和工具互相配合,因为工具只是生成,无法判别产生结果的好坏,也无法判断是否每个维度都已经考虑到。在这样的框架下,我们看到的是生产力大幅度提升,但每一次生产力的大幅度提升,确实伴随着新工种的产生。挑战与机遇并存,虽然还不知道人工智能的这一次变革会带来什么样的机会,但是我们能够看到的是,未来十年,我们一定会迎接一个大规模的应用爆发,希望我们都能够抓住这个时代给予的机遇。
谢欣 飞书CEO
周宇翔 黑湖科技联合创始人兼CEO
张黎刚 爱康集团创始人、董事长兼CEO
刘劼 哈尔滨工业大学人工智能研究院院长、哈尔滨工业大学人工智能研究院有限公司总经理
张大磊 鹰瞳Airdoc创始人
张予彤 金沙江创投主管合伙人
韩璧丞 强脑科技创始人、CEO