您的位置 : 首页 >> 经济管理电子书

智能机器如何思考 深度神经网络的秘密

下载方式

智能机器如何思考深度神经网络的秘密
本书作者:肖恩·格里什 (作者)

本书读后感· · · · · ·

所以人工智能还是处在第一阶段:分类;离第二阶段的简单推理与第三阶段的反推还差的很远。资本也逐渐意识到了真相了(或者圈钱结束),不断投喂的结果会造成我们总会想往第二阶段、第三阶段迈进,这应该也是为什么头条之类的公司为什么那么四处扩充版图的原因之一吧,路没有尽头,但是技术的发展缺无法满足人类不断的阶升需求。如果我们无法继续上升,熵的约束便会减少,因为缺乏持续的更高级的能量来源,于是,嘣,危机,萧条,混乱,停滞便会到来~~~

我的学习笔记

微软、亚马逊、谷歌、苹果、百度等许多公司都提供应用程序接口、工具包和云计算基础设施,将机器学习的开发工作交给全世界数以千万计的开发人员。 P35

我找到的最好的解释是卡内基–梅隆大学和斯坦福大学的一些研究人员撰写的学术论文。 P37

智能机器如何思考 深度神经网络的秘密 经济管理电子书 第1张最终,我意识到应该把自己在研究中学到的东西与他人分享,这样他们就无须为了理解相同的东西而跨越同样的障碍。 P38

通过移动嘴唇,调整吹气的力度,控制手指精确地在长笛孔上移动,塑像可以吹出一系列音符,组成一首完整的乐曲,“其吹奏过程就像人类乐手的演奏一样完美”[1]。 P39

长笛演奏者是如何工作的?它是黑魔法吗?在那10年以前,一位教会官员曾下令捣毁了沃康松的一个工作坊,因为他认为这是亵渎神灵,所以沃康松肯定不会再做任何看起来太像魔法的事情。 P40

虽然有些复杂,但它不过是一个巨大的音乐盒。 P41

我们用提供奖励的方法训练计算机程序玩雅达利游戏,最终使程序的游戏水平远远超过人类玩家,就像训练一只狗坐下或打滚儿一样。 P43

幸运的是,与沃康松向法国科学院提交论文的方式如出一辙,这些最新进展的创造者详细记录了构建智能计算机程序的方法。 P44

唯一的区别是,技术专家已经把工具升级为计算机和运行在计算机上的软件,它们是21世纪的杠杆、齿轮和发动机。 P45

自动机的创造者通常是钟表匠,其技术则源自钟表,因为钟表每到一个小时就尽职尽责地执行有趣的机械序列。 P46

电子从任意一个极端奔向目的地的中途,在移动到电路另一部分的过程中,保持动量不变。 P47

但我们将会看到组成自动机的中间构件,它们本质上是更高一级的“统计学的齿轮和风箱”。 P48

即使你熟悉人工智能或机器人技术,这本书的某些部分对你而言也仍然是新知识。 P49

我们将看到是什么让自动驾驶汽车能够在道路上行驶,并在拥挤的城市环境中穿行。 P50

[2]1英里≈1.6093千米。 P51

正确的做法是选择你喜欢的东西,用你所拥有的一切去追求它,这就是生活的意义所在。 P52

今天它发现自己被困在了洞穴附近,无论往哪个方向都寸步难行。 P53

当时是2004年,距离我们研究出如何训练神经网络可靠地“看到”物体还有将近10年的时间。 P57

对于开发自动驾驶汽车,我们也可以如法炮制。 P58

接下来的一系列杠杆让发动机的阀门关闭。 P59

一种常用的调节发动机功率的方法叫作比例控制,之所以叫比例控制,是因为我们对功率的调节等于目标速度和当前速度的差值乘以一个固定的系数。 P60

智能机器如何思考 深度神经网络的秘密 经济管理电子书 第2张

有时控制器会跟踪误差的变化速度,并主动调整发送给发动机的信号,预测未来的变化(这被称为微分控制)。 P61

这个规划组件是自动驾驶汽车最重要的部分,它决定了系统其余部分的优先级。 P62

接下来,在比赛开始前仅两个小时的时候,他们获得了路线的GPS坐标,14个人连忙在几十台计算机的帮助下手工标注沿途的地形。 P63

悍马从当前位置到达地图上的下一个目标点也需要做同样的事情,只是它需要避开的是沙漠中的危险地区,而不是熔岩。 P64

这很重要,因为这样我们就可以用计算机擅长的事情来描述这个问题了。 P65

随着边界不断扩张,程序把任意一点围进边界内所要付出的成本会慢慢增加。 P66

在任意时刻,GPS传感器都可以连接到其中几颗卫星,但并不总是相同的几颗。 P68

网格中的每个单元格代表1平方米,4种颜色代表4种地形。 P69

悍马利用1960年发现的一种数学模型——卡尔曼滤波器,将这些加速度计和GPS传感器的测量结果结合起来。 P70

在自动驾驶汽车成为主流媒体热门词汇之前的近10年里,他们就欣然接受了机器学习在自动驾驶汽车领域的角色,塞巴斯蒂安的车队在赛后这样描述其赛车。 P85

硬件层不会做任何智能的事情,它仅仅是从传感器(摄像机、激光扫描仪和GPS系统等)获取数据,并使用来自规划层的命令(如发动机转速和车轮角度)控制汽车的硬件。 P87

其中一些模型简单地总结了斯坦利需要遵循的高级路线,这是斯坦利在比赛开始时规划的路线。 P88

虽然运行在中间层的模块设计巧妙并使用复杂的机器学习算法,但它们并不是真正的智能。 P89

斯坦利使用激光扫描仪的数据估计网格中哪些单元格被物体占据(图3.2中,被占据的单元格用深灰色表示)。 P90

如果斯坦利的激光扫描仪倾斜了几分之一度,斯坦利就会认为前面有障碍物,这就会导致最右边那一层的规划算法命令斯坦利转向。 P91

对斯坦利而言,这还不足以让它安全地以每小时25英里以上的速度行驶,因为沙漠道路常有急转弯,就像第一次比赛中让悍马抛锚的那个急转弯一样。 P97

为了理解斯坦利是如何做到这一点的,请想象你是一个刚洗了一大堆袜子的吸血鬼。 P98

斯坦利能确定它选择了正确的像素来建立对道路颜色的估算吗?难道斯坦利不可能无意中选择了路边的像素来建立聚类,而没有选择道路上的像素?在确定哪些像素是道路时,算法当然可能会出错,就像任何算法都可能出错一样,但这个问题在一定程度上被缓解了。 P99

右边的规划层不需要看传感器的原始数据,它只是利用感知层的信息来做决定。 P100

只要斯坦利能够继续规划并执行这些路径,汽车就会成功地沿着路线继续前进,而不会撞上任何物体。 P101

然后,路径规划算法会考虑其中的许多路径,并选择它找到的最佳路径。 P102

是否应该有一个集中的“主进程”来指挥一切?它应该被组织成某种层次结构吗?车队选择了完全相反的做法:他们将这些不同的软件模块组合在一起,让它们并行运行。 P103

过多的对话可能导致参与者被锁定在对话中,这样的问题被称为死锁(deadlock)。 P104

它们无法面对迎面而来的车流,无法寻找停车位、换车道以及处理交通堵塞的问题。 P105

他也是卡内基–梅隆大学车队的全权负责人,车队现在改名为格子车队(Tartan Racing)。 P107

这一轮预选赛需要自动驾驶汽车绕圈行驶,在迎面而来的车流前左转弯,如图4.1所示。 P108

他们将这个中间层称为“感知和环境建模层”(如图4.2所示)。 P110

其最高层次的规划和推理层由三个模块组成:审议器(路线规划器模块)、定序器(大富翁棋盘模块)和控制器(运动规划器模块)。 P111

Boss会为这种关联计算一个质量测评。 P112

粒子过滤器实现了类似的目标,但所做的假设略有不同。 P113

DARPA在比赛前几天向参赛选手提供了场地路线图,并在比赛开始前仅仅5分钟的时候向参赛队伍提供了任务说明。 P114

另外两辆自动驾驶汽车之间发生了低速碰撞。 P115

如果你使用机器学习来构建分类器,就需要使用数据计算每个特征的权重,并且要选择阈值。 P153

网飞与众不同,其70%的租赁都来自不相关的或古老的“压箱底”电影。 P155

正如网飞首席执行官里德·黑斯廷斯(Reed Hastings)所指出的,对他们而言,支付巨额奖金并不算真正的风险,获得更好的电影推荐所带来的经济利益可能远远超过奖金的成本。 P156

它是一个易于理解的度量标准,具有很好的统计特性。 P157

这个矩阵非常庞大:它提供了17770部电影和480189个不同用户的评分。 P158

短时间内,空军要求所有的驾驶舱都要适合不同体型的飞行员,只要他们每个尺寸的测量值都在平均水平的5%~95%范围内。 P163

承认这个矩阵中存在冗余信息,这并不是一个疯狂的想法,毕竟,我们能够提供个性化推荐的前提就是假定人们的评分中存在可预测的模式。 P165

让我们试着预测一下导演史蒂芬·斯皮尔伯格是否喜欢《侏罗纪公园》(JurassicPark)。 P166

史蒂芬·斯皮尔伯格倾向于喜欢科幻片、喜剧片和冒险片等,而不喜欢恐怖片等,正如他对各类电影的喜爱程度所表明的那样。 P167

这就是所谓的矩阵分解,因为根据数学原理,它相当于将图5.2中原始的庞大评分矩阵近似为两个或更多小矩阵(即它的因子)的乘积,这些小矩阵恰好编码了我们用来描述电影和用户的数字。 P168

固定的类型对描述电影而言太粗糙了。 P169

如果我们在这两个步骤之间反复交替,也就是说,在保持用户对固定类型喜爱程度的同时学习电影类型,然后在保持类型固定的同时预判用户对这些类型的喜爱程度,那么我们的推荐会越来越好,直到类型最终停止变化。 P170

在新的空间中,每一部电影都可以用6~100个数字来描述,这些数字正是我们用上面的交替方法找到的数字。 P171

这并不足以让他们赢得大奖,但足以保证一些团队有资格获得5万美元的进步奖。 P173

解决“大人物拿破仑问题”的另一个诀窍是,你不仅要看用户对不同电影的评分,还要看他们给哪些电影评过分。 P181

如果你让观众给一部电影评分,然后一个月后再评价一次,观众的评分会平均变化0.4星。 P183

有时候,用户会一次给多部电影打分,如果用户打分时的心情特别好或特别坏,那些“爆发”就可能会发生。 P184

这并不是说他们的平均评分会变得更高或更低(尽管这种情况也发生过)。 P185

随着比赛的进行,各支队伍一点一点地挖掘出这些宝石。 P186

我们感兴趣的是设计一个智能体,当它在高尔夫球场的不同位置时,它能够学习应该朝哪个方向挥杆,应该瞄准东、南、西、北哪个方向,才能让球更接近球洞。 P213

如果你击球成功,球就会沿着你瞄准的方向移动一个小方格,如图7.3(b)所示,你希望用尽可能少的击球次数把球打进球洞。 P214

玩游戏的时候,你知道这些地雷的位置,而且每次玩的时候它们都是固定不动的,但是你必须不惜一切代价避免踩到它们。 P216

如果智能体踩到地雷,我们会用电击惩罚它,相当于减去半块巧克力(价值为–1/2)。 P217

如果立方体已经被填入了正确的数值,那么这个策略似乎是可行的,而且非常简单,我们甚至可以用物理设备对它进行编码,从而创建一台机械自动机。 P219

形式化的方法是将其定义为智能体可以期望得到的未来所有巧克力的总数,总数随着智能体得到这些巧克力所需要的时间而调整。 P220

这就把智能体面对的平坦布局变成了丘陵布局,而奖励就在一座丘陵的顶上。 P221

本文版权归原作者所有,请支持正版。此处仅提供个人读书笔记 https://yigefanyi.com/zhinengjiqiruhesikao-shendushenjingwangluodemimi/
返回顶部