您的位置 : 首页 >> 计算机与互联网电子书

错觉:AI如何通过数据挖掘误导我们

copyright

☞温馨提示:想直接推送电子书到手上的kindle吗~ 点击此处购买本书正版即可☜ 限时折扣,先到先得
错觉AI如何通过数据挖掘误导我们The AI Delusion
本书作者: [美]加里·史密斯

本书读后感· · · · · ·

关于人工智能累积的困惑得到了解答。人工智能对比人类智能目前最大的区别就是没有通用智能,不能在多种情景下灵活运用它已知的东西。了解过很多提高人工智能的方法都是在经验学习的基础上提高,但始终不具备思考的能力,对事物没有常识性的感知,没有对数据来源好坏的判断。如果不是质的突破,人工智能的过度热捧不定会是下一个泡沫。任何用人工智能去取代人类思考能力的工作都要特别谨慎,尤其是研究人员,经常看到日新月异的研究结果只是单一依赖于数据的相关性,有的还是一流的研究杂志。格雷厄姆曾经说过,股市就是投票机,不对统计模型的合理性加以思考,依赖用AI来判断,只会制造效率更高的投票机。

我的学习笔记

八年后,希拉里·克林顿再次参加总统大选,决意运用大数据为自己加持。 P5

希拉里竞选团队对“阿达”的运用守口如瓶,这可能是因为他们不想让希拉里的对手有所察觉,也可能是因为不想加深团队机械行事、谨小慎微和照本宣科的刻板印象,他们毫无伯尼·桑德斯和唐纳德·特朗普竞选团队那样的豪情壮志。 P6

错觉:AI如何通过数据挖掘误导我们 计算机与互联网电子书 第1张

沃森在1914年接手IBM时,IBM还只是一家仅有1 300名员工、年收入不足500万美元的小公司,到了1956年他去世的时候,IBM已经发展成为一家有7.25万名员工、年收入9亿美元的公司。 P12

2008年,“沃森”做好了参加《危险边缘》的准备,但还有些问题需要协商。 P13

具有讽刺意味的是,尽管人类可以运用逻辑找出最佳策略,但人类编写的计算机软件程序还是有可能击败人类的,因为计算机无须考虑自己的走法。 P20

廷斯利去世后,奇努克与世界排名第二的国际跳棋选手唐·拉弗蒂进行了32场比赛,并以1胜31平取胜。 P29

在一场国际象棋比赛中,AlphaZero将“后”移到棋盘的边角格,这与人类想法相矛盾,因为国际象棋中最厉害的“后”在棋盘中间位置会更加强大。 P30

错觉:AI如何通过数据挖掘误导我们 计算机与互联网电子书 第2张我们根据经验得知,带轮子的箱子通常用于搬运物品,所以,这个箱子可能是空心的,有空间可以存放或搬运东西。 P38

我们可以筛选出几十个(甚至是数百个)想法——留住一些,忘记一些,结合一些——再由一些想法联想到其他想法,它们通常与我们最初的想法仅有一点儿模糊联系。 P39

我们可能还希望推车的主人没有走远。 P40

将同样的问题抛给任何一个普通人,他都要算很久,而且答案不一定可靠。 P41

其他预测则是基于对原始计算机能力发展历史简单推断——计算机容易产生的那种不严谨的推断。 P43

不幸的是,不严谨的推断并不总是幽默的——至少不是有意为之。 P44

将时间考虑在内有一件事情,人类能做得非常好,但计算机做得很差或无法做到,那就是将时间考虑在内。 P45

如果计算机不能处理一连串的事件,它就无法像人类一样做出假设和概括。 P46

他看到阿森纳战绩的感觉,肯定和埃弗顿足球俱乐部的支持者或不关心足球的人不一样。 P47

我是在洗澡的时候有了写本书的灵感的。 P48

人类大脑平均有近1 000亿个神经元,这个数量远远超过了最强计算机的复制能力。 P49

计算机怎么会知道澳大利亚的温度与美国股票价格之间的统计相关性是合理的还是巧合?生活不是多项选择题,也不是记忆事实的反刍。 P50

图灵建议采用更简单的方法,而不是就思维的具体定义达成一致,然后看看计算机能否满足这些条件。 P51

实际上,聊天机器人在被问倒时,会使用预编程的脚本来提供非信息性的答案,例如“你在乱说”、“你就没别的事情做了吗”或者“这是你的问题,跟我没关系”等通用回答。 P52

假设一台计算机在封闭的房间里接受图灵测试,该计算机接收用汉语写成的指令,并以汉语编写回应,完成得非常自然流畅,以至于把汉语作为母语的人都相信是人而非计算机在回应。 P57

我们使用情绪和逻辑来构建有助于理解所见所闻的概念。 P59

20世纪50年代,乔治敦大学和IBM的合作小组展示了机器翻译——利用250个词汇和6项语法规则把60个句子从俄语翻译成英语。 P60

很多机器翻译程序,包括谷歌翻译,目前都采用深度神经网络(deep neural networks)。 P61

霍夫施塔特认为:谷歌翻译的开发者无意让谷歌翻译理解语言,而是在想方设法地避开理解需求。 P65

老实说,我认为是遥遥无期的。 P66

在2016年的挑战赛中,最高准确率为58%,最低为32%,概率变动更多为运气因素,而非计算程序能力的差异。 P67

例如,计算机可以搜索全文查找单词betray(背叛),但无法识别出没有使用betray一词来讲述背叛情节的故事。 P68

人类或许会对这首抗议歌曲有很多不同的解读(大多数伟大的文学作品都是如此),但是他们的解释肯定远不止停留在识别单个词语上。 P69

以下为克莱蒙高中狼群队对阵钻石吧高中梵天队的比赛总结示例:星期五,狼群一记全垒打,以6∶5击败钻石吧。 P70

如果我们见到熟悉的八边形指示牌,上面显示“STOP”(停)的字样,就能一眼识别出来。 P76

就算自行车的把手被系上丝带、车身被粘了闪电的图片,也骗不过人类。 P77

谷歌的一个研究团队表示,人类察觉不到的细微的像素改变都能忽悠最先进的视觉识别程序。 P78

巴贝奇发现他可以将复杂的公式转换为简单的加减算法,并使其自动进行计算,而且机械计算机每次都能准确无误地算出结果,消除人为错误。 P84

“种瓜得瓜,种豆得豆”的说法就简明地提示我们,即便计算机能力再强,输出内容的价值也取决于输入内容的质量。 P85

随机选择50株土豆苗(实验组),在土壤中加入咖啡渣,其余50株(控制组)的土壤中则不添加,然后观察土豆苗的生长状况和产量是否出现明显差异。 P86

人们并不是随机被归入受教育程度的某个类别,而是自己做出选择和被筛选的。 P87

为了亲自验证,我于1983年去了科德角度假,有个邻居给我看了《科德角时报》的一篇文章。 P88

有些学生还设计了一个叫作“让斯坦福再次安全”(Make Stanford Safe Again)的网页来取笑这一发现,网页上有与图4.1类似的配图。 P90

还有可能,上述两所大学的研究都是实验者“心有所想”的结果?为做出截然不同的职业生涯选择,我参加了波莫纳学院的教授及董事大会。 P91

还有可能是因为,在放假期间,除非遇到生死攸关的情况,否则人们都不愿意往急诊室跑。 P92

某州的一项研究对比了每小时限速为55英里、65英里和75英里的高速公路的交通死亡率(驾车每英里的死亡人数)。 P93

统计软件能找出此类相关系数,但是无法解释是第一个要素引起第二个要素,还是相反情况,又或是第三个要素引起前两个要素。 P94

即便4.3%这一数据没错(怎么就不能是编出来的?),也明显存在自我选择偏差和反向因果关系。 P95

有些学生还设计了一个叫作“让斯坦福再次安全”(Make Stanford Safe Again)的网页来取笑这一发现,网页上有与图4.1类似的配图。 P90

还有可能,上述两所大学的研究都是实验者“心有所想”的结果?为做出截然不同的职业生涯选择,我参加了波莫纳学院的教授及董事大会。 P91

还有可能是因为,在放假期间,除非遇到生死攸关的情况,否则人们都不愿意往急诊室跑。 P92

某州的一项研究对比了每小时限速为55英里、65英里和75英里的高速公路的交通死亡率(驾车每英里的死亡人数)。 P93

统计软件能找出此类相关系数,但是无法解释是第一个要素引起第二个要素,还是相反情况,又或是第三个要素引起前两个要素。 P94

即便4.3%这一数据没错(怎么就不能是编出来的?),也明显存在自我选择偏差和反向因果关系。 P95

第二次世界大战期间,轰炸德国后飞回英国的盟军飞机的机身留下了被子弹和弹片击中的弹孔,一项军事分析研究这些弹孔位置后发现,大多数弹孔位于机翼和机尾,很少出现在驾驶舱、引擎和油箱部位(如图4.3所示)。 P98

然而,当把布帽换成钢盔后,因头部受伤入院的士兵人数反而增加了。 P99

还有一点蹊跷之处是,斯塔佩尔常常在听到同事的研究兴趣点后,声称自己已经收集到了对方所需要的数据,他愿意以合作撰稿人的身份提供数据。 P100

没过多久斯塔佩尔就坦白了,承认自己的很多实验调查结果要么是经过挑选的,要么是捏造而来的。 P101

问题在于,任何人都知道在过去20年里营销技术已经发生了翻天覆地的变化。 P102

对软件程序来说,要想解决计算机缺少人类智能这一问题,可能需要报告统计学分析的具体细节,这样的话,人类就能评估数据的有效性和结果的合理性。 P103

错觉:AI如何通过数据挖掘误导我们


↓下载地址
本文版权归原作者所有,请支持正版。此处仅提供个人读书笔记 https://yigefanyi.com/cuojueairuhetongguoshujuwajuewudaowomen/