汕头市智能制造产业协会-汕头市智能制造产业协会

李彦宏：人工智能刚刚走到石器时代，但未来它会像电流一样普遍

2017-09-22

题图：百度公司董事长兼首席执行官李彦宏先生

在过去的一两年里，或许人工智能的消息刷遍了投投朋友们的朋友圈，AI不知何时开始占据了我们的手机、汽车以至于家庭。或许你很少能听到李彦宏讲历史、讲产业，实际上每个互联网一线的企业家都是一名通晓古今的人，时髦的人工智能和历史变迁怎么结合？也许你值得看一看。在百度all in人工智能、全力以赴下，隐藏着什么？未来我们的生活将驶向何方？

素材来源：李彦宏公开资料

编辑：投资人说(ID:touzirenshuo)

1、历史了解越详细，未来就看得越透彻

全世界都在为即将到来的人工智能革命感到振奋。这种情绪就仿佛二十多年前我在硅谷亲历互联网大潮初起时所感受到的。

2012年，我注意到深度学习在学术界和应用方面都有了突破。比如，用深度学习的方法来识别图像，突然就比以前的任何算法都有明显提升。这个时候我马上意识到，新的时代来临了，搜索将被革新。过去我们用文字搜索，现在可以用语音和图像进行搜索。比如我看到一株不认识的植物，拍一张照片上传搜索，就可以立刻识别出来它叫福禄桐。过去用文字搜索是没法描述这样的植物的。不仅是搜索，很多过去不可能的事情现在都可能了。

语音识别能力、图像识别能力、自然语言理解能力，包括为用户画像的能力，这些都是人的最本质的智慧能力。当计算机拥有了人的这些能力时，一场新的革命就会到来。以后速记员和同声传译人员可能会被机器代替，计算机可以做得更好。以后也许不需要司机了，车自己就可以开起来，更安全，更有效率。在企业里面，金牌客服可能人人都可以做了，因为有了智能客服助手。人工智能对人的这种赋能，超过了以往任何一个时代。工业革命解放了人的体力，过去一些像搬石头之类的粗活需要人类自己来干，现在机器可以替你把更巨大的石头搬起来。智能革命到来之后，原本很多需要费脑子的事情，机器也可以帮你做。未来20~50年，我们会不断看到各种各样的变化，收获各种各样的惊喜。

让我们把时光推至工业革命以前。

在当时的英国，由于纺织机械带来低成本产品，传统的手工纺织业被挤垮，遭到工业主和工人的反对，掀起所谓的「卢德运动」。珍妮机发明者哈格里夫斯多次遭到同行和邻居的驱逐。但珍妮机最终还是推广开来，助力英国统治全球纺纱业。而蒸汽火车一开始甚至速度还不如马车，从而被马车夫嘲笑。

到了电气革命时代，历史再次重复，比如马可尼在1895年研制出最早的无线电装置，并且利用这一装置成功进行了远距离摩斯电码通信实验。他成立无线电报与信号公司，推动无线电商用。但由于与海底电缆公司的利益相冲突，他想在纽芬兰设立无线电报局的事遭到反对。不过当时美国的现代市场体系和技术偏好已经初步建立，所以无线电还是很快发展起来。

电气革命与今天的智能革命有一些「基础质料」意义上的类似。与蒸汽动力无法远距离传输和统一布局不同，电力是一种无限流动的普适能源，正如今天的互联网是一种流动的，让用户可以随时接入的基础资源。「电+产业」正如今天的「互联网+产业」，颠覆了无数的传统产业。

当然，电流和智能流只是在比喻意义上可以类比，前者是电子的流动，后者是比特编码的流动，不是同类事物，但这种类比有助于我们感受问题的关键所在。我们不妨对比一下两个时代的企业升级。

当电气流向千万企业，很多企业主动寻求升级，虽不是像蒸汽时代那样抗拒，但同样困难重重。一百多年前的电力系统十分复杂。需要在直流电、交流电，不同的电压、不同水平的可靠性、不同的电力接口以及价格之间做出合理的选择。直到今天，各国的电压和接口规格（插座口）也都没有统一。和不同电力公司打交道也是个技术活，否则很可能吃亏，正如今天企业找互联网技术外包公司时，如果不专业，就会落入陷阱，从编程语言到系统架构，都有各种令人眼花缭乱的选择。

如今，尤其是这两年，人工智能再度呈现技惊世人的技术，这是机器学习技术的升华版——基于多层计算机芯片神经网络的「深度学习」方法。通过多层芯片联结，模仿人脑大量神经元的网状联结方式，辅以精妙的奖惩算法设计和大数据，可以训练计算机自己从数据中高效地寻找模型和规律，从而开启了一个机器智能的新时代。

科学家们觉得人工智能经过这么多年的发展，到了「终于可以用了」的阶段，而它的实力在我看来，才刚刚开始施展拳脚。

2、在人工智能时代下，你我都需要做出改变

我无意过分夸大人工智能的作用。

从纵向发展来说，业界通常把人工智能分为三个阶段：第一阶段，弱人工智能；第二阶段，强人工智能；第三阶段，超人工智能。实际上，目前所有的人工智能技术，不管多先进，都属于弱人工智能，只能在某一个领域做得跟人差不多，而不能超越人类。

对此，我可能比大多数人都更保守一些。在我看来，人工智能永远不会到那一步，很可能连强人工智能都到不了。未来，机器可以无限接近人的能力，但是永远无法超越人的能力。

当然，仅仅是无限接近人的能力，就已经可以产生足够大的颠覆性。因为计算机在有些方面实在比人强太多了。比如它的记忆能力，百度搜索可以记忆上千亿的网页，其中的每一个字它都记得住，没有一个人能够做得到。再比如它的运算能力，哪怕是写诗——打个小广告，把你的名字输入手机百度的「为你写诗」，敲回车键，没等你反应过来，诗就出来了。再厉害的七步神童，也很难达到这种速度。但是，在情感、创造性等很多领域，机器是无法超越人类的。

跟我不一样，技术界还是很乐观的。

智能领域的权威人士都认为，在不久的未来，智能流会像今天的电流一样平静地环绕、支持着我们，在一切环节提供养料，彻底改变人类经济、政治、社会、生活的形态。陆奇称智能时代的核心本质是「knowledge in every system, intelligence in every interaction」（知识无处不在，任何交互都是智能的）。未来世界的人们将像穿衣吃饭一样享用着人工智能而无所察觉。

有人为人工智能的到来感到焦虑，其实我觉得大可不必。

在20世纪初，美国有50%的农业人口，但随着农业机械化，现在的农业人口降到4%，而城市化吸收了多余的农民。但眼前发生的事情是不同的，当人工智能大规模进入社会后，人类能做的工作它们大部分都可以做，城市不会再有更多的就业岗位留给人类。通行的美好说法是，人们在常规工作中被人工智能取代后，可以去从事创造性的工作。问题是创造性的工作不是人人都可以从事的，也不需要那么多的人，如果社会分配制度不改变，一个全部由科学家和艺术家构成的人类世界几乎是一场噩梦，这上百亿科学家和艺术家中的绝大部分注定一生碌碌无为，对社会和自己都毫无用处，且沦入「创造性」的穷困潦倒中。

但这种思维方式总有些不对的地方。人类自古以来为生存而劳作，实在是迫不得已，工作着是美丽的，但谁都知道，不需要工作的生活更美丽。现在终于能够制造出把自己从工作重负中解放出来的机器，这是人类文明最伟大的成就，无论如何不应该被看作一场灾难，相反，这可能是人类所面对的前所未有的伟大机遇，只是，我们需要改变。

3、跳棋、国际象棋、围棋后，AI还将进击

AlphaGO和深蓝的逻辑并不一样，同样是下棋，但背后的人工智能已经实现再次飞跃。

蒙特卡洛方法就体现了概率学的精妙。假设，在某个棋局局面下，深度学习网络给出了三个候选落子办法A、B、C，以这三个点为根节点，分别往下走子，可以想象成三棵树，每棵树还有无数分支。蒙特卡洛搜索不去穷尽所有分支（穷尽所有是深蓝的做法），而是派出300万只蚂蚁分别从A、B、C出发，每个点100万只，飞速向树梢爬（也就是往下黑白棋交替走子直到决出胜负，基本上走200步就会分出胜负），总有部分蚂蚁走到最高点（也就是决出胜负，假设蚂蚁走到终点的情况代表黑子胜，没走到终点的情况代表白子胜）。

假设从A点出发的100万只蚂蚁有30万只到达终点，从B点出发的有50万只到达终点，从C点出发的有40万只到达终点，系统就认为黑子走B点胜率更高，就会选择B点。这就是概率学的取样算法，相比逐项穷举法，极大地缩减了计算量。

为什么派100万只蚂蚁而不是10万只或者1000万只？这是根据计算机的计算能力和对竞争对手的大致估计来确定的。如果派10万只蚂蚁就可以得到较高胜率，那么派10万只也可以。在相同时间内派出越多蚂蚁，对计算能力要求越高。

除了下棋，人工智能还进击了金融、翻译、资讯分发领域。

金融信息可能是最复杂、最枯燥的信息，一份股转书有两百多页，还有大量的年报、半年报、研究报告、公告、反馈意见、尽职调查结果……我们不知道，有多少行业分析师是完全看完这些信息，再做出决策的。也许，不是他们不够勤勉，而是读完这些信息已经非人力所及。

20世纪90年代，一个基金经理要把市场当天产生的研报、舆情、新闻、交易数据等看完，大概需要10个小时，也就是两天的工作量。2010年，移动数据爆发之后，这个基金经理要把每天市场上产生的信息吸收掉，大概需要10个月的时间。2016年，还是这个基金经理，假如把当天市场上所有的信息看完，大概需要20年的时间，相当于整个职业生涯。所以基金经理迫切需要利用先进的智能技术，比如百度的自然语言处理技术。

机器可以瞬间完成上市公司的公告、财务报表、官方发布、社交平台、证券行情、实时新闻、行业分析报告等海量异构数据的阅读，对于文本中的图片和表格需要OCR（光学字符识别）等技术解析。紧接着，进行关键实体信息的提取，发现埋藏在实体信息之间，如行业上下游关系、供应链关系、股权变更历史、定增与重大资产重组的关系、多张财务报表之间的数据交叉验证等数据关系，形成并呈现这些复杂关系的「知识图谱」。

再说翻译。在机器翻译的模式中，人类要做的不是亲自寻找浩繁的语言规则，而是设定数学方法，调试参数，帮助计算机网络自己寻找规则。人类只要输入一种语言，就会输出另一种语言，不用考虑中间经过了怎样的处理，这就叫作端到端的翻译。这种方法听起来挺神奇，其实概率论里的贝叶斯方法、隐马尔科夫模型等都可以用来解决这个问题。

技术是神奇的。以资讯分发当中的贝叶斯方法为例，可以构建一个用概率来描述的人格特征模型。比如男性读者模型的特征之一是在阅读新闻时点击军事新闻的概率是40%，而女性读者模型是4%。一旦一个读者点击了军事新闻，根据贝叶斯公式就可以逆推这个读者的性别概率，加上这个读者的其他行为数据，综合计算，就能比较准确地判断读者的性别以及其他特征。这就是数学的「神奇」。当然，计算机神经网络使用的数学方法远不止这些。

人类的行为一旦被互联网以数据的形式记录下来，就成为滋养人工智能在各行各业齐头并进，进而帮助人类自己的无穷无尽的燃料。机器翻译、语音识别、图像识别都是基于互联网提供的大量数据，用户点击行为也是如此。为什么百度搜索引擎的准确性是国内其他搜索引擎难以比拟的？因为数据量最大、算法最先进、积累最雄厚。用户的每一次点击其实都在训练搜索引擎背后的百度大脑，告诉它哪一条资讯才是用户最想要的。

实际上，脸书也拥有自己的人工智能实验室以及类似谷歌大脑的团队——应用机器学习事业群。这些机构的使命是在各种脸书产品中推广人工智能技术。用该公司首席技术官麦克·斯克洛普夫（Mike Schroepfer）的话说：「脸书约有1/5的工程师现在都在使用机器学习技术。」

AlphaGo的主人谷歌当然也不会只满足于下棋，其人工智能投入多年来不断膨胀。2012年，谷歌只有两个深度学习项目，2016年底这个数字突破了1000。目前谷歌从搜索、安卓系统、Gmail（免费网络邮件服务）、翻译、地图、YouTube（视频网站）甚至到无人车，都有深度学习的影子。

4、人工智能进步背后的原理

中国拥有庞大的业务应用场景、用户和数据以及基数最庞大的人才群体，进步很快。除了BAT（百度、阿里巴巴、腾讯三大互联网公司首字母缩写）、华为等巨头大力开发人工智能，还有很多垂直领域的人工智能公司涌现。在去年的各种互联网论坛上，不论是电商、社交媒体，还是搜索引擎，各家互联网企业的掌门人都在将话题引向人工智能，汇报着或大或小的成绩。

决定现代数字计算系统主要结构的是资源的组织形式。而人工智能计算的本质，简单来说，非常不同于冯·诺依曼的控制流结构，后者采用线性的记忆体和布尔函数作为基线计算操作。而新的范式是神经网络计算，其特征在于分布式的表示和激活模式。在这里，变量由叠加在共享物理资源（如神经元）上的向量表示，并且通过神经元的激活来进行计算。网络的拓扑架构和激活模式提供了巨大的计算空间，可以有效并且自然地捕获丰富的知识（通过拓扑的超参数、权重、激活函数）。相对于冯·诺依曼架构中的本地化表示（其中变量由诸如寄存器的专用或局部化物理资源表示）和符号计算，神经网络计算在学习和表示物理世界以及社会的丰富的语义知识方面更加自然和强大。

通过神经网络计算的力量，下一波的人工智能技术可以在以下两个维度提升目前的计算系统：

一是自动分层特征/表示学习。这是机器学习容量的实质性提升，因为当今机器学习工作的很大一部分关键在于特征工程。如百度大脑已经拥有万亿级的参数、千亿级的样本和千亿级的特征训练。

二是高级认知，特别是感知能力。这是下一代设备（如无人驾驶汽车）和下一代平台（如自然语言会话）产生的巨大催化剂。

人工智能计算的强大能力将有助于产生许多新品种的智能系统，如机器律师、机器分析师、医疗机器人、智能客服人员等。