人工智能在中国

2017/08/31

百度:迎接智能革命


       Q:百度在人工智能领域布局很早,深度学习甚至比美国很多大公司还要领先,你在两年前的“两会”上还提交了“中国大脑”提案这个建议,这对人工智能在中国的发展是非常重要的。你能不能从百度角度谈谈对人工智能发展的看法,以及百度为何那么早就进行了布局?


       李彦宏:从百度的基因来说,从成立到现在的主营业务就是搜索服务,而搜索的本质就是机器试图理解人想要的东西,我们一开始就用各种各样计算机方法试图理解人的意图。因为深度学习在图像检索应用的效果不错,让我发现深度学习其实是代表了一种趋势,它不仅对图像搜索有用,对很多其他计算机科学要解决的问题都非常有用。原因就是,随着互联网的发展,数据越来越多,越来越丰富,计算资源越来越便宜,越来越强大,市场环境变了,条件变了,曾经几十年都不被看好的人工智能现在却代表着未来。


       意识到这种趋势之后,2013年1月,百度成立了深度学习研究院,这可能是全球工业界第一个用深度学习来命名的研究院。虽然在此之前我曾多次说过百度是一个商业公司,研究应该同产品部门、业务部门紧紧结合在一起,而不是单独成立一个研究院,但是深度学习让我觉得它是完全不同的,需要在理论上、在算法上等很多方面有长远的布局和突破。相较于2013年,如今的人工智能已经成为了一个更大的产业。互联网其实只是一道开胃菜,真正的主菜是人工智能,所以人工智能不是互联网的一部分,不是互联网的第三个阶段,它是堪比工业革命的一个新的技术革命。


       Q:在这场由人工智能带来的新技术革命浪潮下,中国和美国是发力最大的两个国家。人们习惯于把百度和谷歌放在一起比较,这也可以看作中美比较的一个缩影。对此你怎么看?在人工智能发展上,中国具有怎样的优势?


       李彦宏:我觉得两家公司有很多类似的地方,因为起源都一样,公司层文化有很多类似的地方,百度在中国的优势跟谷歌在美国的优势类似。也有不同的地方,百度的创新空间和在某些领域的创新速度可能比谷歌更大、更快,这源于两国不同的国情。移动互联网在中国的创新程度在很多层面已经超过了美国。比如手机百度在信息流方面的创新,用人工智能核心技术可以把信息找人做得非常精致。在移动互联网上做这个事情,百度创新的机会比谷歌在美国要多,因为两国IT工业的格局不一样。还有金融业,百度金融可以依托中国市场和数据的优势,用人工智能技术对金融业做一个革命性的提升,但美国金融业相对“壁垒森严”,谷歌要切入金融领域就很难。再比如,在无人驾驶汽车方面,谷歌、百度都是世界第一梯队,谷歌在无人驾驶汽车领域现在稍稍领先于百度,但未来不一定。因为中国的汽车制造厂家很多,拥有更开放的合作环境,与百度这样的人工智能企业联合起来,创新的机会就非常多,创新的速度也就会更快。总之,无论是无人驾驶汽车、金融还是整体制造业,中美都面临智能升级的节点,但中国的宏观环境给百度这样的智能企业的机会和空间要比谷歌在美国获得的更大一些。


       从国情来看,中国发展人工智能有着更强烈的内在驱动,这种驱动来自民间。在移动互联网领域的应用上,中国比美国更普及。中国网民早已习惯于诉诸互联网寻求服务,比如网上订票、网上订餐等等。中国之大,之特殊,要高效实现中国网民的服务需求,人工智能创新就是一条必由之路。驱动的另一个源头则是产业焦虑。中国制造业成本上升很快。放眼全球,工业越来越自动化和智能化,高端制造业可能会回到欧美,而低端制造业已开始流向越南等国。如果不再短时间内完成产业转型,中国制造业将面临“空心化”的困境——高端制造业和低端制造业都将流出中国。这个转型需要依赖人工智能技术,中国政府的支持力度更是转型的强力后援。


       如果说网民的需求是“天时”,企业与政府的合作是“人和”,数据则是中国大脑发展必不可少的“地利”。在这个领域,中国更是得天独厚。庞大的人口规模、复杂的社会环境和面向不同应用场景的互联网企业,汇合收集这个数据全集意义非凡。


       Q:我注意到百度的深度学习有一个开放平台,这个是挺有意义的。但是你决定这么做的时候,不怕平台开放后会培养你的竞争对手吗?


       李彦宏:人工智能是一个非常大的产业,未来20-50年都会是一个快速发展的人工智能时期。在这种时代大潮下,显然不是一个公司能够把所有的事情都做下来的。我们向社会免费开源人工智能深度学习平台PaddlePaddle为开发者提供算法编程环境,为应用开发者、数据工程师、数据科学家开放百度大脑开放平台ai.baidu.com,提供现成的百度人工智能成果接口,希望与所有相关企业一起推动整个人工智能技术的发展。其实,我们把平台开放出来,对我们自己也有益,我们可以在平台上看到人工智能往哪些方向发展会更快一些,哪些领域更适用于现在已经解决的技术。


       虽然我认为人工智能永远不可能超过人类的能力,但是当它逐步逼近人类能力的时候,其实已经是可以颠覆一个又一个行业的。比如说人脸识别,等到技术成熟和数据库之间互相联网时,我们出门乘坐飞机、火车就无须出示身份证以供检验,因为当我们进入任意的交通枢纽,被摄像头拍摄到面部信息时,系统就能通过人脸识别确认我们的身份和购票信息。这相当于普通人都能获得一条绿色通道,出行效率和公共秩序都将大幅改善。在百度人脸识别技术落地的产品中,最为“高大上”的就是乌镇的“刷脸”门禁系统。有出入资质的人将面部信息事先录入系统,今后出入任何安装有“人脸闸机”的地方,只需“刷脸”即可。不光是人脸识别,语音的识别、自然语言的理解等等,都是可以一步步实现的。现在是人发明了工具,通过操作手册告诉你工具应该如何使用,但未来应该是机器、工具学习人的意图,我要这个工具干什么,它就能够明白,这就是我希望用人工智能方法解决理解人的自然语言,以后人和机器的对话、人和物的对话就变成一种自然语言的对话,这可能是未来几十年代表人工智能发展最大的方向。


       Q:百度接下来会如何在人工智能上进行布局?


       李彦宏:战略上,我们以“赋能”来定位。百度首先是中国的,百度大脑要做探路者和奠基者。作为国内人工智能的先行者,百度已经在多个维度上创新开拓,同时逐步形成自身智能生态的雏形。比如,医疗和教育是人工智能应用潜力非常大的领域,因为其本质都是数据问题,高级老师和老医生一样,能力来自经验(数据)积累,未来我们可以让机器自动分析数据,辅助医生对症下药,辅助教师个性化施教。医疗或者保健能让人的生活更健康,教育能给人更多的知识,因此,人工智能在这两个领域的社会应用价值巨大。


       另外还有无人驾驶领域。无人驾驶也是通过感知、认知、知识获取来实现。目前,无人驾驶汽车真正商用还需要一点时间,但是一旦商用普及成功,对于整个社会的改造会非常大。因为这不光是汽车和交通问题,一旦有了无人驾驶机器,它可以自己行动,自己联网,就会带来很多行业的改变。人工智能的实践范围非常广,人类很少有这样一个机会,可以彻底改变、改造当下的一切。当然,战略落实要一步一步走,方向要坚定,步伐要稳健。


腾讯:在云端用人工智能处理大数据


       Q:腾讯有一个成立了一年多的人工智能团队,聚集了一批人工智能领域很厉害的专家。能不能跟大家分享一下腾讯为什么如此重视人工智能以及您对人工智能领域的看法?


       马化腾:在人工智能领域,相比百度,腾讯已经落后不少,我们在去年才成立了腾讯AI Lab(腾讯人工智能实验室)。腾讯内部AI分为好几部分,除了AI Lab之外,各个事业部门里面都有AI的团队。其实过去几年腾讯已经将人工智能技术运用到一些产品中了。比如优图团队,每天有高达上十亿张人脸照片上传,使我们具备了非常强的人脸识别技术;再比如微信里面丰富的语音数据,语音识别也是AI技术的应用。这些应用因为在后端,所以大家感受不到。


       在前端,我们也希望做出一些产品。去年,谷歌Alpha Go的围棋人机大战让全世界对人工智能认知到了一个新的高潮。我们团队本着练兵的心态也做了尝试,开发出了围棋AI“绝艺”,在“电圣战”中夺冠。但也不能过于欣喜,毕竟我们是站在了前人的肩膀上。这件事最大的意义在于,我们发现围棋AI能够在计算机的后台运用云计算、大数据方式进行高速的自主学习,能够自己跟自己对奕。所以AlphaGo的下一代Master,经历了数十亿盘自我对弈之后自己寻找规律,找到的规律已经远远超过人类过去在围棋领域认知的范围,这是极大的扩展。


       在围棋以外的其他领域,如果也能用计算机后台做出一个模拟器,定义出很多参数,自己学习,寻找规律,它能找到的规律可能远超我们现在想象的。这是人工智能带给我们的最大启示。


       Q:微信加上QQ,可以说是世界最大的社交网络,拥有大量的数据,大数据是人工智能非常重要的方面。在大数据上的优势是否为腾讯发展人工智能的提供了更多的机会?腾讯是否会将这些数据进行分享?


       马化腾:发展人工智能,不光需要大数据,场景、大数据、计算能力和人才四个要素缺一不可。场景就是你想把这个技术应用在什么场景下,是否能够实现用户价值,这是很重要的一点。所以无论是研究院还是内部研发团队,如果没有场景落地,没有平台支持,基本上就是空中楼阁,研究一半很难往下走。第二是大数据,腾讯是拥有大量的数据,但是里面很多都是垃圾数据,因为没有标签,没人做规划定义,用多好的算法也学不出来。数据清洗、标签化难度非常高,我们甚至要招聘很多员工先用人脑将数据清洗干净,再让AI学习,这是一个混合结合的过程。第三是计算能力,就是拥有云的资源,依靠几十万个核的力量提高计算能力,这也是我们的优势。第四就是人才。过去一年我们招聘了很多人,在西雅图微软总部还设置了实验室。所以说,只有这四个方面结合起来才有办法真正在某一个领域看到人工智能技术的成效。


       在数据分享上,我们现在还处在如何在内部进行数据分享的阶段,因为这其中还涉及了用户的个人隐私。信息安全个人隐私是很敏感的,我们要先确定如何对数据进行处理、如何标签,然后才能确定如何分享给其他部门、外部合作伙伴。其实业界很多其他的公司,还有我们的合作伙伴,也会遇到同样的问题,所以业界还要制定一个标准,大家对大数据可以互惠互利的交换。这是一个发展的大方向,但是还有很长的路要走。


       现在大家都在讨论未来的趋势是云,还是人工智能,还是大数据,我认为未来就是在云端用人工智能处理大数据。对于腾讯来说,有所为,有所不为,我们的定位就是坚持做好连接器,定位在底层,希望提供很多基础的零配件和连接能力,连接各方的优势,支持传统行业支持企业走向数字经济。


       Q:腾讯未来在人工智能方面的战略规划是什么?


       马化腾:AI对腾讯以及整个中国互联网来讲都非常重要,并且是中国互联网公司赶超美国一个非常的机会。腾讯在AI上面的考虑主要基于四个垂直领域:专注机器学习、自然语言处理、语音识别和计算机视觉四个方向的基础研究。具体来说,在计算机视觉领域,除了传统的图像处理,腾讯还会引入AR(Augmented Reality,增强现实技术),也会引入空间定位技术;语音识别会引入自动翻译方面的一些技术;自然语言处理,除了人的认知行为的一些研究,还会对聊天机器人这类的应用做一些研究。未来腾讯的人工智能服务将紧密围绕内容、社交、游戏三个核心应用场景展开,并将人工智能工具以API形式开放出去,推动行业健康发展。


微软:更重“情商”的对话机器人


       Q:沈向洋先生作为微软人工智能及微软研究事业部的负责人,你认为人工智能为何这几年能有突破性发展?可否预测一下AI最可能在哪些领域产生具有颠覆性的应用?


       沈向洋:今天人工智能之所以有这样的发展机会,主要有三个方面的原因。首先是因为互联网的出现,互联网+物联网提供了更多的数据。其次是强大的运算能力。信息时代的科技原力是摩尔定律,AI时代的科技原力是“算法”。第三是深度学习的突然突破,令到大家看到过去很多不能解决的问题被解决了。


       我们讲人工智能,最初对人工智能的定义就是跟人类智能相比较,包括人类智能的感知和认知两个方面。感知方面,计算机语音和计算机视觉发展在接下来的5-10年会非常快,这方面AI会超过人类。很多人会同意我这个说法。人工智能的认知方面,包括自然语言、知识获取、对事情的思考、情感表达等等,还有许多方面是目前AI技术无法达到或无法解决的,需要AI科学家的进一步研究。但我们现在处在一个非常好的时代,为人工智能的发展提供了更好的研发环境。


       关于人工智能创造的机会,从微软公司来讲,我们认为短期之内是有非常大的商机的。如果你看到底有哪些行业已经拥有相当量的数据,而从事这个行业的工作人员却是不高兴的,那你就有商机了,几乎所有的商业应用,从市场销售到HR部门招聘再到客户支持,都会被人工智能颠覆掉。所以,我觉得未来五年会产生最多的AI应用的商机。这并不是说无人驾驶技术不重要、围棋不应该被研究,只是从我们来讲最大的商机就是每一个商业应用都会被人工智能所颠覆。


       Q:微软对人工智能的布局似乎与其他企业不同,请问微软未来在人工智能领域的战略是什么?


       沈向洋:借助马云讲的,弯道超车十超九翻,要换道超车才有希望,在任何竞争的过程中总是要找到自己的出发点。目前对于人类与人工智能关系的讨论,集中于“替代论”和“辅助论”两种说法,微软的理念倾向于后者,提出“AI for everyone”的口号。比起人类的对手,微软更热衷于开发人类的助手。我认为谷歌的AlphaGo十分了不起,但微软在人工智能未来的研发重点将是更重“情商”的对话机器人(conversational AI)。实际上,到最后人工智能就是人和机器可以一起来做了不起的事情,而不是说做了一个人工智能把人类打败了,我们就不用下围棋了。


       在对话机器人方面,微软主要走了两条产品线,一条是Cortana(小娜),另一条是小冰这样真正的聊天机器人。像小娜这样的智能助理机器人,很多公司都在做类似的产品,它可以在最短时间内帮人类完成任务,体现功能性价值,比如可以快速查询天气、可以回答今天PM2.5有多少,还可以帮忙订餐,这些对人类每天的生活是很重要,但是聊天才是更重要的,因为聊天是刚需。人类每天会讲很多的话,男人一天大概讲几千句话,女士一天可能讲超过一万句话,绝大多数其实都是废话和闲话,但我们还是在不停地讲。正是出于对“废话”和“闲话”的需求,才有了微软的纯聊天机器人小冰。小冰从情感的角度出发,以同伴的身份通过聊天理解人类,向人类学习。很多人会觉得,小冰看上去没有什么实际用途。但AI应该是IQ再加上EQ,很多公司还没有意识到对话机器人不断跟人类对话的价值。现在人工智能已经能在很多的特定问题上接近、甚至超过人类,但是在解决通用问题上,人工智能目前还远远比不上一个人类儿童。这里面涉及的重点之一就是情感问题。除了在对话方面,微软也正在视觉识别、语音识别、机器翻译等加速布局。而这一些部署也都是围绕人工智能的“情商”展开的。


       我们作为与人工智能共同生活的第一代人类,比起让人类理解计算机,让计算机理解人类更重要。通过加强计算机在视觉识别、语音识别、语言翻译、阅读理解、与人对话方面的能力,兼顾EQ与IQ的机器人才能称得上真正的“人工智能”。在这个基础上,才能谈人工智能对人类的帮助,让人类生活变得更好。


神州数码:开启云转型


       Q:神州数码在智慧城市方面有很大的布局,请谈谈你对人工智能的看法。


       郭为:智慧城市的建造运用更多的是大数据。一个传统企业想要转型,唯一能做的就是采集到更多的数据。由于我们以前在很多行业的积累,使我们能够接触大量的数据。用互联网方式采集数据,用深网挖掘数据,在三网(电信网、广播电视网、互联网)环境下采集数据都是我们的核心竞争力。做智慧城市就是要能够快速形成一个城市数据,然后进行分析和应用。我们花了6、7年时间去实践研究,经历过很多波折,但是人工智能技术在大数据分析上的应用给我们提供了很多帮助。


       每个企业在布局人工智能时,都会有自身的优劣势,需要通过收购、合作或是自主研发去弥补、去解决。比如,今年发生的一个比较大的并购案,英特尔收购Mobileye。


       Mobileye是以色列一家做汽车驾驶辅助的公司,Mobileye在1000万辆传统汽车上装载了数据采集的仪器,每天收集的数据量差不多相当于现在3000亿个个人生成的数据量,这些数据将会支撑英特尔未来在超级计算上,在大数据领域的发展。神州数码在农业、医疗、制造业给工商总局做广告登记的服务,也就是说我们掌握了全中国所有的商标注册的公司,这里面蕴藏了大量的商业价值。我们要做的就是发挥我们深网挖掘数据的优势,与在人工智能领域走在前面的公司共同合作。


       Q:神州数码未来发展战略是否还是聚焦在大数据上?


       郭为:基于神州数码在大数据上的优势,神州数码将开启面向云和大数据时代的全新战略转型,联合包括厂商、分销商、集成商、云服务提供商在内的各类合作伙伴资源,构建起从云到端的企业信息化融合服务平台和生态。我们将建设中国最大的企业信息化融合服务平台——神州商桥,让企业信息化建设零门槛。


       第一个科技春天在80年代,诞生了以联想为代表的众多中关村企业。如今,中国民营科技企业正在进入第二个春天,未来二十年又是一个以科技创新为本的新的春天。创新本就需要付出代价,我们肯定也存在一个试错的过程。但我们比别人醒得早一点,动作快一点,最终把已有的企业大数据转型为云服务。今天在云服务领域,既取得收入又取得利润的企业确实不多,有云服务处在起步阶段的客观现实,也有大家普遍认为云服务需要靠规模取胜的因素。云服务所架构的基础设施投入巨大,所以业界通常的方式是依靠规模和成本控制两方面实现盈利。一是更多客户来使用云服务,从而分摊固定开支,二是我们通过不断优化降低运行成本。就像建设高铁路线,必须客满运行一段时间,才可以收回成本,并且创造更多的现金流。


       而神州数码的逻辑则更贴近客户的应用场景,并且侧重生态化的方式和路径。华为云、阿里云,或者中国电信这些已经在云基础设施资源上有了大量布局和规模化资源的企业,都是神州数码未来重要的合作伙伴。基于神州数码一贯的能力积累,我们将收集同时也创造更多的云资源、云应用和专业化云服务,为企业客户提供一种基于混合云、或者说是N种云组合的融合服务。


       我相信十年以后云服务一定是主流方向,大家所有的消费方式都会变成一种云服务,大多数企业所接受的服务肯定也是一种云服务。云就是融合服务。这种融合服务交付和提供的过程,一定会产生一个大的平台。但是目前云服务的确还处于起步的阶段,我们逐步融合云的服务内容。极端一点说,如果这个趋势做得对、做下去,我们的传统业务可能就变成了新的业务。(本文部分内容摘选自2017中国(深圳)IT领袖峰会“人工智能”主题对话)

关闭