AI预言的七宗死罪

理想自动化 2018-07-05 09:04:41

:这是一篇译文,原文是The Seven Deadly Sins of AI Predictions,尝试着翻译了一下,里面有些东西的翻译不是特别明白,中英文的表达差异在一些专业领域里面很难获得统一。比如第四节的直译手提箱词汇,我就一直没明白suitcase word到底是什么意思。

****************************************

错误的推断,狭隘的想象力以及其他一些通常的误会,干扰了我们关于未来更加富有成效的思考。

我们对于人工智能和机器人的未来充满了狂热,狂热的认为未来他们会变得多么的强大,多么的高速以及他们将会如何对待我们的工作。

最近我在Market Watch上看到一个报道说,机器人将会在未来10-20年内取代我们今天一半的工作!它甚至还画了个图来说明。

这种说法真的是太滑稽了。(我尽量保持使用专业说法,但是有时候。。。)举个例子,该报道似乎是说我们有100万个理由相信美国,因为机器人会取代他们的工作。现在有多少机器人在从事这些工作?答案是零。有多少机器人工作的实际案例应用在这个领域?答案是零。类似的故事也同样存在于其他行业,我们会看到说那些被表明目前在某些特定领域需要实际的人的超过90%的工作会被终结掉。

错误的预测导致对未来不可能发生的事情产生恐惧,无论是不是大规模的现有工作消亡,奇点或者说AI的到来,由于不同的价值观可能会试图毁灭我们。我们需要回推这些错误的产生原因,为什么人们犯这些错误?我认为通常有7个原因。

 

1. Overestimating and underestimating

2. Imagining magic

3. Performance versus competence

4. Suitcase words

5. Exponentials

6. Hollywood scenarios

7. Speed of deployment

 

1. 高估和低估

2. 想象力魔法

3. 性能VS能力

4. 手提箱

5. 指数

6. 好莱坞剧本

7. 部署的速度

 

1. 高估和低估

Roy Amara曾是未来学院的联合创始人,在Palo Alto, 硅谷的智能心脏位置。他最出名的是他的一句格言,现在已经被称为Amara定律:

人们总是高估一项科技所带来的短期效益,却又低估它的长期效益。

20多个字包含了相当多的信息。乐观的人和悲观的人可以从不同的角度进行解读。Amara定律两面性的一个绝好例子是GPS系统。自1978年起,24颗卫星(包括备用星目前有31颗)被放到了轨道上。GPS的目标是帮助美国军方精确定位军需品的运输,但是这个项目在几乎在整个80年代一次又一次的被取消。其第一次作战用途是在1991年针对伊拉克的沙漠风暴行动期间;经过几次成功的应用,军方逐步接受了GPS

如今GPS的应用可以说是Amara定律所说的长期影响了,首先其应用范围就已经大大的拓展了。当我外出跑步的时候,我的二代Apple Watch使用GPS精确记录我的位置,甚至可以识别出我是沿着街道的哪一边在跑。对于早期GPS工程师来说,如今GPS接收器做得如此小而且价格那么便宜简直就是无法想象的。GPS技术可以在全球范围内同步物理试验,在美国电网的同步性能中扮演了关键角色。GPS技术甚至可以让那些股票高频交易者能实实在在的控制股票市场来避免因时机错误引起的灾难。GPS技术现在应用在所有飞机的导航系统上,无论大飞机还是小飞机,还可以用来追踪那些获得假释的罪犯。GPS可以从全球范围内考虑适合的种子应该种在哪一块田地里面。GPS可以追踪卡车车队并且报告司机是否称职。

GPS开始从单一目标应用出发,但后来的运用方式和其初期预期的目标已经大大不同。现在GPS应用在我们生活的方方面面,如果没有GPS,我们可能不会迷路,但是我们可能会受冻挨饿,甚至可能会面对死亡。

我们可以看到过去30年中其他类似的技术路线。起初是个大梦想,后面渐渐失望,然后又是缓慢的发展最终超越最初设定的目标。这在计算机技术、基因排序、光伏、风电以及甚至送货上门的杂货店等领域,都是类似的。

AI已经一次又一次的被高估了,在60年代,接着又在80年代,而且我相信现在它再一次被高估了,但是从长远来看其前景肯定是极有可能被低估的。问题在于:长远到底需要多远呢?接下来的6个错误帮助我们解释为什么AI未来的时间轴被大大低估了。

 

2. 想象的魔力

当我年少的时候,ArthurC. Clarke就已经是三大科幻小说作家之一了,还有两位是Robert HeinleinIsaac Asimov。但是Clarke同时还是一个发明家、一个科学作家以及未来主义者。从1962年到1973年间,他整理了现在被称为Clarke三法则的三条格言。

1)当一名德高望重的科学家声明某个事情是可能的,那么他几乎肯定是对的。如果他声明某个事情是不可能的,那么他非常有可能是错误的。

2)发现可能性界限的唯一路径就是往不可能性方向多冒一点险,往不可能的方向多想一步就变成了可能。

3)任何足够高端的技术和魔法几乎没什么区别。

从个人来讲,我应该当心他第一条法则中的第二句话,因为我比其他认为AI的发展有多迅速的人更加保守。但是现在我想解释Clarke的第三条法则。

假设我们现在有一架时光机器,我们可以把牛顿从17世纪晚期请到今天来,让他到一个他熟悉的地方:剑桥大学的三一学院的小教堂里面。

现在给牛顿看一个苹果,当然不是真正的苹果而是从你口袋里面掏出iPhone, 打开后屏幕被点亮并且布满了各种按钮,你把手机递给他。大家都知道,牛顿揭示了白光是由通过棱镜的不同颜色的太阳光线合成的,但是他依然会十分惊奇在黑暗的小教堂里面这么个小东西会发出如此生动美丽的色彩。现在你给牛顿放一段英国乡村风景的影片,再加点他可能听过的教堂音乐,你再打开一个网站,里面是牛顿500多页的巨作《原理》,并且教他如何通过手势来放大画面来查看细节。

牛顿能解释为什么这个小设备能做这些事情吗?虽然他发明了微积分,并且能解释光学和重力,但是他无法分别化学和炼金术的区别。因此我认为牛顿就混乱了,根本无法理解这个设备是如何工作的,没有任何头绪。对于他来说,这和魔法没有任何区别。但是你要知道牛顿可是个真正聪明的家伙啊。

如果某样东西或者某件事情是魔法,那么就很难知道它的局限性在哪里。假设我们再给牛顿展示这个设备是如何照亮黑暗的,如何拍照片、视频,如何记录声音,如何用来当放大镜和镜子。然后我们再展示iPhone是如何以不可思议的速度来进行数学计算的,甚至是带小数的计算。展示iPhone是如何计步的,展示他在这个教堂里面是如何可以和世界上任何地方的人立刻进行通话的,等等等等。

牛顿还能揣测到iPhone其他的功能吗?因为棱镜是可以永久性使用的,他会不会认为iPhone也是可以像棱镜一样永久工作呢?能不能理解是需要充电的?回想起我们是从法拉第出生前100年的时间点和牛顿相遇的,他缺乏对电的最基本的科学理解。牛顿可能会想:如果这个设备可以不用火就可以成为光源,那么它也是否可以用来冶炼黄金呢?

这就是一个我们面对未来技术都存在的一个问题,如果这项技术以我们今天的理解力根本无法理解,那么我们就不知道可能性的局限在哪里了。如果它和魔法没什么区别,那么任何和这项技术相关的东西都无法验证。

当我和人们争论我们是否应该对通用人工智能感到恐惧的时候经常性会碰到这个问题。人们认为通用人工智能会建立一个像世界上人类那样运转的自主主体。我通常被告知我根本不了解通用人工智能是多么的强大。这根本就不是个争论,我们甚至无法确认其是否可能存在。我其实宁愿其存在的,当我研究机器人和AI的时候这也是我的自我激励。但是当代的AGI研究明显还不够好,无论是在通用智能还是在支撑独立实体方面。看起来似乎卡在一些已经存在了至少50年的关于推理和常识方面的问题上了。我能看到的所有证据都表明:我们根本无法建立一个人工智能世界。它的属性完全未知,所以可以夸张的认为它很快会变成没有强有力界限的魔法。

宇宙中的一切都有局限性。

提防关于未来技术的争论陷入魔法化,这样的争论根本无法反驳。这是一场基于信心的争论,而不是科学争论。

 

3. 性能VS能力

我们都采用提示法来看人们如何完成一些特定任务来评估他们是否可以很好的完成其他一些不同的任务。;例如在某个国外的城市,我们在街上向一个陌生人问路,她回答的很有信心而且方向看起来也是正确的,因此我们认为我们可以继续问她其他问题,比如当我要坐当地公车的时候该如何付费。

现在假设,某个人告诉我们一张特定的照片上显示人们正在公园里面玩飞盘。我们自然会认为这个玩飞盘的人能够回答一些问题:比如飞盘是什么形状的?通常一个人可以把飞盘扔多远?人可以吃飞盘吗?通常多少人同时一起玩飞盘?一个三个月大的婴儿能玩飞盘吗?今天的天气是否适合玩飞盘?

但能够识别“人们在公园里面玩飞盘”图片的计算机却根本无法回答这些问题。除了它能够识别更多的飞盘照片以外,它根本无法回答问题,它不知道什么是人,公园通常是露天的,人们是有老有少的,天气不仅仅只是照片上显示出来的那样的。

但这并不意味着这些系统是无用的;他们作为搜索引擎是有非常巨大的价值的。但是这里当人们听到一些机器人或者AI系统已经完成了一些任务时就开始往错误方向走了。他们把性能归结为人们完成相同任务所需要的能力。而且他们还把这种普遍性推到所有机器人和AI系统上去了。

今天的机器人和AI系统应用范围其实是十分狭窄的。通用型的类人机器人根本无法获得应用。

 

4. 手提箱词语

Marvin Minsky把含有多重意思的词语称为“手提箱词语”。“学习”就是一个强大的手提箱词语。它适用于多种不同体验,比如学习使用筷子和学习一首新歌的旋律就是两种非常不同的体验。再比如学习写代码和学会在城市里闲逛也是两种完全不同的体验。

当人们听到机器学习在某些领域里面取得了巨大成就的时候,他们倾向于采用人类学习一个新领域的心理模型。然而,机器学习是很脆弱的,它要求很多人类研究者或工程师的准备,特定目的编码,训练数据特定目的的设定,以及新问题领域内的定制化学习结构。如今的机器学习根本不像人类点点滴滴的海绵式学习,可以在新领域里快速取得进步而不需要脱胎换骨或为特定目标建造。

同样,当人们听说计算机能够击败世界象棋冠军(1997年)或者世界上最好的围棋选手(2016年)时,他们通常都认为计算机都是按照人类的行为来运行的。当然,事实情况是那些程序根本不知道这是个什么游戏,甚至不清楚他们正在玩什么。他们的适应性也很差,当人类玩游戏的时候,稍微改变一下游戏规则无关紧要,但是对于AlphaGoDeep Blue来说就没办法再玩了,必须得改程序。

手提箱词汇误导了人们关于对于人类能做的事情来说,机器表现究竟有多好的问题。部分原因是因为AI的研究者,或者说他们的机构新闻发言官,总是渴望宣称手提箱概念在某个例子中的进步。这里重要的词汇是“某个例子”,细节很快就丢失了。头条经常吹嘘手提箱词汇,搞混对于AI的一般性理解。

 

5. 指数

很多人都深受“指数主义”之苦。

几乎每个人对摩尔定律都有所耳闻,摩尔定律说明计算机性能会按照几乎时钟般准确的计划变得越来越高。Gordon Moore实际上认为微处理器的元器件数量每一年就会翻一番。50年来一直如此,虽然每年翻一翻逐步从每年变成了每两年,但是这种模型逐步走向终结。

元器件数量的翻番使得计算机的速度也跟着翻番,这导致内存芯片的容量每两年扩大4倍,也使得数码相机能够拥有越来越高的分辨率,LCD镜头的像素以指数级增长。

摩尔定律见效的原因在于它适用于真/假的数字化抽象。在任何给定的电路中,存在电荷或者电压吗?随着芯片组越来越小,答案依然清晰,直到一个物理限制的介入,当非常少的电荷时,量子效应就开始发挥主导作用。而我们的硅晶芯片技术现在就走到这个关键节点上。

当人们受到指数论影响时,他们可能会认为他们用来证明自己论点的指数性还会继续。摩尔定律,以及像摩尔定律这样的指数定律可能会失效,因为它们不是真正的把指数放在第一位。

回到本世纪初时我正在管理着MIT一家很大的实验室(CSAIL),需要给超过90家研究小组筹集研究经费,我试图向赞助商表明iPod的内存增长有多快。以下是关于400美元可以给iPod提供多大存储的数据:

Year     gigabytes

2002         10

2003         20

2004         40

2006         80

2007         160

然后依据此数据,我再向外推几年询问兜里这些内存都可以用来做什么。

如果外推到现在,预计400美元的iPod应该有160000GB(或者160TB)的内存。但是今天最高配的iPhone(售价超过400美元)也只有256GB的内存,还不到2007年的iPod2倍。当内存容量大到可以容纳任何理性之人的音乐库、应用程序、照片和视频时,这个特别的指数性就会突然之间崩塌。当达到物理极限时,指数性也会崩塌,或者当没有更多的经济理由让它继续存在时。

同样的,由于深度学习的成功,我们已经目睹了AI系统突然有了很好的表现。很多人似乎认为这意味着AI相当于乘数效应的性能提升会继续常态化进行下去。但其实深度学习的成功是30年不懈努力的结果,没人能够预测到这一点。这只是个孤立事件。这并不意味着不会有更多的孤立事件,也就是一潭死水似的AI研究,突然会给许多AI应用插上翅膀。但是这种情况的发生频率,并没有“定律”可循。

 

6、好莱坞剧本

很多好莱坞科幻电影的情节是这样的:世界跟今天的还是一样,除非有一个转变。

  在《机器管家》这部电影里面,有一幕是Sam Neill扮演的Richard Martin坐下来由Robin Williams扮演的人性机器人服侍吃早餐。他一边吃早餐,一边拿起一份报纸来看。报纸!印刷的报纸。而不是平板电脑,或者类似Amazon Echo这样的设备播放播客,这种设定跟互联网并没有直接的神经连接。

结果证明,很多AI研究人员和AI权威,尤其是那些沉溺于预测AI会失控和杀人的悲观主义者,其想象力也类似地受到挑战。他们忽视了这样一个事实,那就是如果我们最终能够制造出这样的智能设备的话,到那时,世界将会发生巨大的变化。我们不会突然被此类超级智能的出现给吓到。随着时间的推移,它们会在技术上逐渐演进,我们的世界会变得不一样,会充斥着许多其他的智能,而且我们早已经有了很多体验。早在邪恶的超级智能想要除掉我们之前,就会有一些不那么聪明和更好战的机器出现。在此之前,会有很暴躁的机器出现。再往前,则会有相当烦人的机器出现。而在它们之前则是自大讨厌的机器。这一路上我们会改变我们的世界,既要为了新技术调整环境,也要对新技术本身进行调整。我不是说可能不会有挑战,而是说未必会像很多人以为的那样,是突然的、意料之外的。

 

7. 部署的速度

在某些工业领域,软件的部署更新是非常频繁的。像Facebook这样的平台,几乎是每小时都有新的软件功能部署上去。对于很多新功能来说,只要他们通过了兼容测试,就算在某些方面出现了问题而需要软件回退,也不会产生多大的经济上的损失。这是硅谷和Web软件开发人员通常习惯使用的方式,因为部署新代码而产生的边际成本是非常非常低的。

从另一方面来说,部署新的硬件,边际成本是非常明显的,这从我们的日常生活经验中就可以得知。今天我们购买的许多汽车都是不能自动驾驶而且绝大多数不是软件驱动的,而且到2040年这些车很有可能还在服役。这就限制了我们发展自动驾驶汽车的速度。比如今天我们要建造一个房屋,我们总是期望能住上100年,我所居住的房屋就是1904年建造的,这在我的邻居中还不是最老的房子。

资金的压力导致硬件会使用相当长的时间,即便有了高科技的出现,它还有存在主义使命要履行。

美国空军现在依然还在使用B-52的变种B-52H轰炸机,B-52H最早在1961年出现,现在已经56年之久了。最后一架B-52H建造于1962年,也已经是55年前的事了。如今这些飞机期望至少服役到2040年,甚至更长时间,有言论说可以延长它们的寿命到100年。

我经常性在全世界的工厂里看到数十年的老旧设备。我甚至见过还在运行WIN3.0的计算机,要知道WIN3.0是在1990发布的。他们说“只要不出问题,就不要去动它”。这些计算机和软件已经可靠运行同一套程序和相同的任务超过20年了。

欧美中日韩的工厂,包括全新的工厂,其主要的控制机制都是基于可编程逻辑控制器(PLC)的。这是在1968年引入来取代继电器的。“线圈”仍然是目前使用的主要抽象单元,PLC的编程方式也像是存在一个24V继电器网络一样。尽管如此,一些直连线已经被以太网取代。而以太网并不是开放网络的一部分,相反,一根根独立的电缆都是点对点连接的,体现的是这些崭新的古老控制器的控制流。当你想要改变信息流或者控制流时,全球大多数工厂都需要找来顾问用数周的时间弄清楚上面有什么,设计新的并重新配置,然后一群商人再进行重新布线,对硬件进行重新配置。这种设备的一家主要制造商最近告诉我说,他们的节奏是每20年更新3次软件。

原则上来说,这事儿可以换种做法。但在实践上不可行。就在这个时候我还在看着职位需求列表,就在今天,特斯拉汽车公司在美国加州费利蒙市的工厂还试图招聘全职的PLC技术人员。通过继电器仿真来对当今最先进的AI软件驱动的汽车生产进行自动化。

  很多的AI研究人员和权威想象这个世界已经是数字化了,只需要把新的AI系统引进来就能马上给现场、供应链、车间、产品设计带来运营方面的改变。这跟事实完全是南辕北辙。几乎所有机器人和AI方面的创新都需要很长很长的时间才能广泛部署,所需要的时间之长要超出圈内外的人的想象。




友情链接