您的位置 : 首页 >> 电子书推荐分享

人类帝国的覆灭:一个机器人的回忆录

下载方式

本书作者:常博逸 (作者), 弗朗索瓦·罗什 (作者), 蔡愫颖 (译者)

本书读后感及个人笔记分享· · · · · ·

推理,人工智能的核心
人类会进行推理。他们甚至将一生都用于推理。推理有好也有坏,所以才有俗语“道理讲得漏洞百出”(raisonner comme un tambour)。推理是个逻辑过程。它包括积累和分拣信息,将这些信息与已经包含在记忆中的信息进行比较,将它们组织成逻辑系统,赋予它们意义,构建问题的答案,并以可理解的方式明确表达出来,最终阶段是做出决定。信息数量越多,条理性就越差;推理的机制越复杂,其结果的潜在不可靠性也越大——提出这样的定理不是在侮辱人类的智慧。然而,在我们所生活的这个不稳定、不确定、复杂而模糊的世界里,要考虑的信息数量有变得越来越难以处理的趋势。因此,计算机科学的专家们致力于开发自动推理机制就完全是自然而然的事了。


点赞、分享、投币,素质三连哦

2016年有一个被媒体广为报道的标志性事件:由谷歌子公司“深度思维”(DeepMind)开发的一台人工智能机器成为了围棋领域的世界冠军。该公司的创始人,现年40岁的戴密斯·哈萨比斯(Demis Hassabis)是人工智能领域一个活的传奇。他13岁就成了国际象棋天才,在编程技术方面也是无可争议的大师,还是神经科学家,毕业于剑桥大学计算机科学专业,其父有塞浦路斯—希腊血统,其母是新加坡华裔。他首次亮相是在电子游戏领域,那时还是青少年的他参与开发了最著名的电子游戏之一《主题公园》(Theme Park)。21岁时,他创立了自己的游戏公司“仙丹工作室”(Elixir Games),但他在其他领域有更大的计划:他希望在人工智能领域里发起一个相当于阿波罗计划的项目,将人类带到一个新的星球上——智能机器的星球。数学家和神经科学家的双重身份让他能够考虑这样一个问题:何时人类大脑的功能对电脑来说将不再是秘密。2010年,他建立了DeepMind——这个名字清楚地显示出了他的雄心。哈萨比斯对人工智能持激进观点,他甚至对他在剑桥大学的老师们提出过反对意见,认为他们已经过时了。对他来说,智能机器必须能够处理各种各样的信息,并且独立于人类使用的所有方法之外来做出决策和预测。他喜欢游戏,国际象棋,但尤其喜欢扑克,他说过,因为在这种游戏中,打牌的人可能做出了正确的决定却依然输了牌……而对于围棋,他很欣赏它的“美”。因此,DeepMind围绕着围棋这个传奇性游戏推出了这个宏大的研究项目。围棋是在公元前几个世纪、被称为“春秋”的时期由中国发明的,它在全世界拥有超过4000万从业者和爱好者,其中包括谷歌的联合创始人拉里·佩奇。

人类帝国的覆灭:一个机器人的回忆录围棋跟国际象棋及跳棋一样,属于所谓的抽象组合策略类游戏,一般来说,双方相互对峙交替下棋,所有规则都众所周知,且不存在偶然性——这与西洋双陆棋有所不同。围棋对弈是在一个平板上进行,对弈双方将黑白二色棋子放置于被称为“棋盘”的方格板上,棋盘上纵横各有19条直线,一共组成361个交叉点。对弈双方使用相同数量的棋子,将棋子置于交叉点上,构筑边界线并将“俘虏”隔离开来,以此建立自己的领地并捉取俘虏。领地大、俘虏多者为胜。这是一个将计算和战略视角相结合的复杂游戏。可研究的组合数量是10的170次方(10后面跟着170个0),而国际象棋的组合数量是10的120次方。对于人工智能专家来说,围棋是一种“边界”,他们认为机器在2025年之前无法攻克这种“边界”。

 

然而,2016年3月,DeepMind的人工智能机器“阿尔法围棋”(AlphaGo)在首尔与韩国的世界冠军李世石对弈时,赢得了五局比赛中的四局。几个月前,AlphaGo就已经在与欧洲最好的棋手、定居法国的中国职业棋手樊麾的比赛中,取得了五局全胜的成绩。正如升级深蓝对战卡斯帕罗夫的胜利标志着智能机器发展的一个转折点,DeepMind也在人工智能领域引起了近乎地震般的动荡,同时也使广大公众深受震动。但是科学家们认为,AlphaGo取得的让其设计者惊叹的胜利并不是大获全胜,因为它输掉了第四局。李世石走了出人意料的一步棋,人类走出这步棋的概率仅为万分之一,它让机器产生了不稳定,迫使机器在紧急情况下试图重新编程,因此,机器由于其神经网络中的不良连接而犯了错误。

AlphaGo的优势在于它的竞赛智能还是计算机的算力?事实上,DeepMind团队能够取得这样的成就,是因为他们已经在很大程度上推进了人工智能的两项基本技术:结合数千变量的神经网络,和强大的学习能力。AlphaGo首先与自己对弈,并建立自己的专业知识,而设计它的工程师和数学家都不是围棋手。事实上,AlphaGo是按照两个逻辑来下棋的:它根据观察过的数十万个落子位置,不断分析和评估双方棋手落子的不同位置,从而确定棋盘上的实力状况;在研究了超过15万局比赛之后,它的神经网络会选择人类棋手在特定位置上实现过的、最可能取胜的棋步走法。与人们所想正好相反的是,机器不会对特定位置上每个可能的棋步都进行检测,这会花费太多时间,而是根据其自身经验来选择最可能获胜的棋步。在每个位置上,AlphaGo都会根据它在见过的棋局中观察到的情况来思考最佳棋步,而且它只考虑这些棋步。在数以万计的棋步中,它知道如何确定能够获胜的棋步。

对于外行来说,花这么多钱来开发一款游戏似乎毫无意义。事实上,AlphaGo完美描绘了人工智能的本质,即推理和决策能力。机器并没有创造一种更好的下棋方式。它(从大多可以在互联网上获得的、全世界最好的棋手所下过的数十万棋局中)提取数据,在每走一步棋之前,它没有竭尽全力详细检测10的170次方种可能存在的棋步,但它选择了取胜几率最大的棋步。因此,它的“大脑”在运作时有一部分是基于随机计算和概率,它根据学过的教程、自己的对弈实践及研究过的人类专业棋手的棋局,来适应它的人类对手的走法。当然,也应充分考虑计算机的计算能力,正是这种计算能力使AlphaGo在走每一步棋时,都能在其大数据库中搜索数以万计的数据,从而与人类专业棋手保持相同的速度。在赛后的一次新闻发布会上,AlphaGo的一位主创人员很好地总结了人工智能带来的问题:“把围棋的基础知识教给AlphaGo并为它编写不同算法的,正是人类自己。当然,它已经发展了自己对围棋的认知,可以自己选择走法,甚至走出令人惊讶的棋步,准确地说,我们往往不明白他为什么以这种或那种方式走棋。是否可以想象,未来的机器在人类不提供帮助的情况下能够自行学习?这是一个我们如今还无法明确回答的问题。”

与此同时,另一台由IBM公司研发的“推理机”沃森(Watson)也广受关注,它在2011年参加游戏《危险边缘》(Jeopardy),并击败两位美国冠军,由此闻名全球。《危险边缘》是相当于法国《百万富翁》(《Qui veut gagner des millions》)的一类电视智力竞赛游戏节目,因而它是知识问答游戏,但不会直接提出像“马里尼亚诺战役(la bataille de Marignan)发生的日期是哪一天”这类问题。问题会以迂回的方式提出,如“我是巴黎的一条街,我的年纪是15岁,那么我是谁?”所以,沃森至少要表现出三种才能:理解以自然语言提出的问题(问题以文本形式传输给它),发现提问方式的表述中隐藏的陷阱,并在几秒钟之内找出最可能的正确答案。它是如何做到的?它首先阅读并存储大量信息,这些信息来自字典、百科全书、维基百科和其他结构化数据库或非结构化数据,涉及历史、文学、政治、电影、歌曲、体育等众多领域。它必须学会理解自然语言,选择最有可能的答案,对它觉得最恰当的答案进行评估并用自然语言回答。这与认知过程非常相似,但它事实上是由高功率计算机(每秒至少80万亿[tera-]次浮点运算)所驱动的。因而,沃森的行为就像人类一样:它对提出的问题进行分析,确定可能存在的陷阱,利用自己的知识库来提出假设并验证它们。因此,这是基于知觉、记忆、判断、知识积累和推理,从而真正涉足对人类心理过程的模仿。深蓝被设计为一个有限环境(即国际象棋)下的高性能计算系统。沃森则可以涉及所有领域,能以简单流畅的方式摄取各种数据、各种形式的文本、图像,也能理解人类的语言。在参加《危险边缘》游戏时,它能解读相当迂回的问题。在2.5秒的时间里,它分析并理解请求,在其资料中进行搜索,按照证据提出一些可能的答案并对它们进行分析,计算可信度指数,然后用自然语言回答。随着对问题的深入钻研,它的学习曲线也不断增长。因此,沃森最先关注的领域之一是健康领域,也是意料之中的事了。医学文献的数量每五年翻一番。根据美国PubMed网站的统计,自1966年以来,仅在生物医学领域就已发表了近2500万篇可以免费获取的文章,每年新增文章数量为50万篇。数量如此庞大的数据,任何一个医生都无法将其全部掌握。沃森也一样。这就是它选择肿瘤领域的原因,它从中选定三四种最常见的癌症形式,阅读了关于其中每一种癌症的所有可用文献:文章、报告、出版物、临床试验报告、新疗法的实验等。沃森能够摄取非结构化的数据(即这类数据不是由计算机的格式化数据库产生的,但它们包含于任何类型的文本中),这使它能够存储非常广泛的知识,而一个人终其一生也无法积累、记忆这么多知识。有了丰富的知识储备,沃森就可以将患者的资料集中归纳:患者的癌症种类、病史、采用过的治疗方法及治疗的结果。因此,它能回答主治医生在做新决定时面临的问题,向医生推荐治疗方法,根据患者的具体情况,指出患者可以在美国或其他地方的何处进行哪些临床试验,这使医生能够明确而迅速地做出决定。我们清楚地认识到了能让沃森在其中游刃有余的领域是什么样的:需要大量知识储备的主题;答案隐藏在明确或暗含的非结构化数据中的问题;一个问题有几个可能的答案,但有一个是比其他几个都好的最佳答案。在医学领域中,诊断或治疗方面的人为错误仍然很多,让机器从中进行干预可以避免这些人为错误。

所有的技术革命都是以特定的能源为基础的:蒸汽、电力、石油、原子。现如今则是数据。数据就是我的氧气。得益于互联网和各种传感器,很快我们就将产生出跟宇宙的体积大小相当的数据量。2005年,互连网的使用人数超过32亿。每天的每一分钟,都有超过100万的视频被观看,34.7万条推文被发布,脸书上会发布400万个帖子,为此必须添加由数亿个连接对象(connected object)所生成的信息和全球移动运营商所获取的数据,谷歌上也会有数十亿次查询……每天有2.5艾字节/E字节(exa-octet/byte,10的18次方字节)的数据被发布,那么每年发布的数据就有915E字节。2015年所产生的数据超过了整个人类历史过程中产生的数据总合。从此以后,我们就用尧字节Y(yottabytes)来计算,1Y即10的24次方。举一个直观的例子作为比较:已知宇宙的直径是880Y字节。这是人类在其历史上首次面临这样的挑战:必须掌握海量信息才能做出更好的决定,但由于这些数据过于庞大,人类无论是在生理上还是心理上都无法承受。因此,人类问题的答案也许是存在于这海量数据之中,但是人类无法将答案找出来。在19世纪,像歌德这样的“正人君子”可以既是作家又是诗人,同时还是萨克森——魏玛大公国的行政官员,以及植物学家、图书管理员和采矿工程师。即便他的智力高于平均水平,但他之所以能够掌握各种各样的数据和知识,是因为这些数据和知识的数量是人脑可以接受的。在21世纪,即便是一个学科最顶尖的专家(如医生),通过自身的智力手段也只能处理现有信息和知识的极小一部分。搜索这些信息甚至也不是问题,它们就存储在“云”里,隐藏于大量其他数据之中。由此产生了这个令所有必须做出决定的人苦恼的问题:我错失了哪个关键信息,如何识别它,从这海量信息中可以提炼出什么样的含义?从理论上来说,人工智能使机器有能力提取这些关于基础知识的数据,从而明确快速地给出问题的答案。这当然是一项巨大的工程,因为它需要非凡的信息处理能力及足够高效的算法,使它在提供一个或多个准确率高的答案之前,能将信息进行相互比较,找出其中的关联性,构建相关的数据结构。这涉及一个以数学为基础的随机过程。机器的“智能”在于它处理海量信息的能力,提取问题含义的能力,迅速提供相关答案的能力(人类的智能无法做到这一点),还有在相对精确的参考范围内处理提交给它的问题时深化自身知识的能力。

很难将这种形式人工智能的应用领域编列成表,因为它们数量繁多且各不相同。机器可以在人尚未找出问题的答案时就快速回答这些问题,强化分析的全面性和彻底性,将人从枯燥重复的工作中解放出来,例如搜索信息并尝试快速提取信息的含义。对于必须处理大量数据并从中提取数据含义的公司(互联网巨头,美国或中国的数据新冠军,健康、保险、银行、金融服务和法律咨询等部门,以及所有在非常复杂的领域内运营的、其投资或收购决定必须考虑多重变量的公司)来说,无须成为先知就能理解这种人工智能的好处。诸如桥水基金(Bridgewater)、贝莱德集团(BlackRock)、双西投资(Two Sigma)、德意志银行等许多大型投资基金公司和银行,都花重金从IBM、谷歌或其他公司争夺最好的人工智能专家来研发自主量化管理的算法,这些算法能够在浩瀚的金融大数据中搜索信息结构,这些信息结构是使投资战略立于不败之地的基础。同样,有赖于沃森的技术,IBM开发了一种人工智能软件:M&A Pro,其目的是消除并购过程中的人为错误风险。机器参照数百次已经完成的收购,对有关目标公司数以千计的信息进行分析,并计算即将进行的收购能够产生预期结果的概率。我们正在进入一个新世界,一个由机器强化决策的世界,对此我们可以增加一个新的缩写:MRDP,即“机器强化决策过程”(Machine Reinforced Decision Process)——例如,Sentient公司从2007年成立以来就募集了超过1亿美元的资金,开发了一套用于交易的人工智能系统,这套系统管理着超过2500万美元的资金,每年交易量达50亿次。

出版商可以让机器阅读最受欢迎的小说,并在角色和情节方面引入适当的算法,从而使机器在在创纪录的时间内自己创作出畅销书:在日本,一部由函馆大学人工智能系创作的这一类型的小说,已经被列入一个文学奖的候选名单,参与竞争这个文学奖的都是人工智能。将科学文章的撰写交由机器来完成的情况开始变得越来越常见。总之,作为癌症专家的沃森能够很好地提出自己的分析。网飞公司(Netflix)对观众最喜爱的剧集、情节、角色和演员进行分析并处理由此得出的信息,用这样的方式播出了《纸牌屋》(House of Cards)。谷歌开发了一种能够创作音乐的人工智能。我们给它三个音符,它就能按照我们指示的风格作曲:古典、摇滚、爵士、手风琴曲……另外一个人工智能写了一个以“未来的大规模失业导致年轻人被迫卖血为生”为出发点的9分钟电影剧本。机器在对热门电影进行分析的基础上写出了剧本大纲,据此人们还会注意到机器承袭了低下的创作能力。机器甚至在故事中引入了三角恋和自杀未遂的情节,以此来丰富剧情……

本文版权归原作者所有,请支持正版。此处仅提供个人读书笔记 https://yigefanyi.com/renleidiguodefumieyigejiqirendehuiyilu/
返回顶部