智能时代 智能时代 8.5分

读《智能时代》

孙业飞
2018-02-26 15:40:58

作者吴军,是自然语言人工智能方面最著名的专家之一,是google最早一批员工,后在腾讯开发搜索相关的产品,然后又回到google开发自动问答项目。现在在硅谷创立投资公司,是约翰霍普金斯大学工学院董事会董事。其写作生涯始于2010年,为国内的google黑板报写IT专栏文章,受到业内人士和大学生的喜爱,随后整理出版了《数学之美》,之后又相继写了《浪潮之巅》、《文明之光》、《硅谷之谜》等科普著作。其最受读者喜爱的特点在于,能将深奥复杂的科学原理解释的非常通俗易懂,尤其是《数学之美》中深入浅出的解释统计概率、离散等数学知识与计算机科学的结合应用,在亚马逊上获得了一堆赞誉,被誉为破除“数学无用论”的大师。看完《智能时代》我迫不及待又买了《数学之美》,惊讶的发现吴军教授居然做过国家工信部的高级顾问,这让我对北京的那帮官老爷们的看法大为改观。

第一章 数据——人类建造文明的基石。讲述了从古代到现代,数据对人类文明发展的作用。数据中隐藏的信息和知识是客观存在的,但是只有具有相关领域专业知识的人才能将他们挖掘出来。比如埃及大金字塔墓室内的尺寸,是严格按照一定数学规则建造的;埃及人为农作物的收成更好,发展起了天

...
显示全文

作者吴军,是自然语言人工智能方面最著名的专家之一,是google最早一批员工,后在腾讯开发搜索相关的产品,然后又回到google开发自动问答项目。现在在硅谷创立投资公司,是约翰霍普金斯大学工学院董事会董事。其写作生涯始于2010年,为国内的google黑板报写IT专栏文章,受到业内人士和大学生的喜爱,随后整理出版了《数学之美》,之后又相继写了《浪潮之巅》、《文明之光》、《硅谷之谜》等科普著作。其最受读者喜爱的特点在于,能将深奥复杂的科学原理解释的非常通俗易懂,尤其是《数学之美》中深入浅出的解释统计概率、离散等数学知识与计算机科学的结合应用,在亚马逊上获得了一堆赞誉,被誉为破除“数学无用论”的大师。看完《智能时代》我迫不及待又买了《数学之美》,惊讶的发现吴军教授居然做过国家工信部的高级顾问,这让我对北京的那帮官老爷们的看法大为改观。

第一章 数据——人类建造文明的基石。讲述了从古代到现代,数据对人类文明发展的作用。数据中隐藏的信息和知识是客观存在的,但是只有具有相关领域专业知识的人才能将他们挖掘出来。比如埃及大金字塔墓室内的尺寸,是严格按照一定数学规则建造的;埃及人为农作物的收成更好,发展起了天文学,也就是对天体运动的数学规律的研究;天文学的发展带动了古代、近代物理的大发展。数据中包含信息,信息可以提炼出知识,而知识能够升华为智慧,这其实是信息论的基础。获得和利用数据的水平反映了文明的水平(美国从上个世纪开始发展大数据和开源运动,可见其发展水平还远不是我国能那么容易追上的)。本章从什么是数据入手,浅显的点到了数据驱动方法是大数据的基础,也是人工智能的核心,更重要的是一种思维方式,为下面几章埋下伏笔。

第二章 大数据和机器智能。主要解释了什么是人工智能。人工智能就是模拟人脑处理信息的方式,用计算机代码建立神经网络,先建立解决具体问题的简单模型,再用海量数据训练出模型的参数(多大上百万的参数),最后形成类似人甚至超越人的智能。人工智能本质上是算法+数据,其主要的算法其实在上个世纪50年代就已经研究出来了,只是那时候没有大量数据可以被拿来训练,直到21世纪互联网发展起来,才出现了海量数据的收集可能性。人工智能开始被高度关注,始于Google参加美国举办的世界机器翻译大赛(每年都有),从默默无名一下子变成第一名,而且领先第二名很多。我们对大数据的重要性认识不应该停留在统计、改进产品和销售,或者提供决策的支持上,而应该看到它和摩尔定律、数学模型一起导致了机器智能的产生。(昨天我跟一位好友聊起数据的价值,我们其实都还没有建立起数据思维模式,他的公司主营某行业软件系统,想拿来做行业发展的报告,我稍微好一点,建议他做一些更细致的决策分析和预测,但我们都无法联想到人工智能,因为我们都还没有领悟人工智能的应用范围)

第三章 思维的革命。这一章是本书的核心,是智能时代的“道”之所在。 要理解智能时代的数据思维,先要了解人类的几种思维方式的演变。农耕时代,人类的思维方式基本是原始的没有系统性,用神话、宗教等解释世界的因果关系;西方从文艺复兴时期开始出现自然科学的雏形架构,以牛顿的方法论为标志,产生了工业时代的思维方式——机械思维。所谓的机械思维,可以概括成三句话,一是世界的变化是确定的,二是规律不仅可以被认知,还可以用简单的公式或者语言表述,三是这些规律应该是放之四海而皆准的,可以应用到各种未知领域指导实践。相比于机械思维,农垦时代的原始思维的特点是,认为世界是不确定的,没有什么规律可以被总结和认识,但是人类的基因使人类的思考必须基于因果关系,所以才会产生神话和宗教。机械思维对时代的发展起到了至关重要的作用,马克思在《共产主义宣言》中写道:资产阶级在不到100年的阶级统治中所创造的生产力,比过去一切时代创造的全部生产力还要多,还要大。工业革命为人类带来了两样东西,财富和寿命。从统计中看到,人类社会的人均GDP发展水平在过去几千年里几乎没有质的变化,而从第一次工业革命开始至今200年里,翻了几十倍;人的平均寿命在工业革命之前一直在30-40岁之间,200年后已经70多岁了。

中国之于西方社会的特别之处在于两点,一是中国古代有比西方国家先进的多的科技水平,可是奇怪的是并没有发展出科学的方法论,也就不存在机械思维方式,始终在用一种超脱的、含糊不清的、追求艺术美感的思维方式,后来的洋务运动也只是提倡中学为体、西学为用的理念,仍然在做表面文章。二是改革开放以后,中国用了30年就走完了西方200年的工业化进程,从农业社会到工业社会,到后工业社会,再到信息社会,再到现在的后信息时代,在硬件上已经跟西方国家完全同步了。这种高速的社会变迁,给当代中国人的思维方式的更替带来了极大的挑战。后面的是我个人的体会:由此带来了一种现象,就是上一代人的知识经验对下一代人来说几乎没有什么用,潜心学习的人的财富增长速度根本比不上勇敢到市场上摸爬滚打的人,于是知识无用论,或者说读书无用论在老百姓的内心种下了种子,除了少数祖辈就是社会精英的人,绝大多数的普通老百姓都在急功近利的追逐财富、权利、名誉,于是整个社会变得非常浮躁。

说回书的内容。机械思维使人类开创了工业时代,进入社会经济发展曲线的拐点,但随着科技的飞速发展,人们渐渐发现机械思维已经不足以指导实践了。最经典的事件是爱因斯坦预测量子运动测量时的错误判断,再次提醒了人类不确定性是这个世界的基本规律。之后,随着计算机科学的发展,数据的计算和处理能力得到了巨大的提升,人类开始演化出数据思维。简单的说,数据思维和机械思维差别,在于模型的建立过程(关于什么叫模型,我查了一些资料,发现其实世界上对模型这个词的定义还没有一个固定的、通用的概念,但是现在的中学数学课本中已经讲到模型这个词而我们读书时课本中从来没提过模型,经过一番查阅,我给模型做了一个简单的定义,不一定准确:模型就是把解决某个问题的方法抽象成数学公式或者图形,模型的作用是提高解决问题的效率,一旦有了模型,在碰到此类问题是只要拿来用就行了而不必再从头摸索)。机械思维是依靠人类的逻辑思维能力,直接建立起高度精确的模型,有时候会用到少量样本数据;而数据思维则是只要几个初步的粗略模型,依靠大量数据不断验证完善模型——“训练”出最终的模型。数据思维的出现,始于克劳迪·香农提出的信息熵的概念,他将热力学的规律运用到信息学中,证明了事物运动时信息的变化可以体现出事物之间的规律,能够用数学方法量化出事物之间的相关性,再推导出所需的因果关系。

理解机械思维和数据思维的差异是掌握本书精髓的关键。机械思维强调的是“遵循因果关系”,数据思维则强调“寻找相关性”。比如一家超市想知道商品如何摆放可以增加销量,机械思维的行为结果是对顾客做调查,根据掌握的各种信息设计出一套摆放商品的规则,然后让所有门店都按照这个方式去摆放;但这种方法即使研究的再深入也无法保证在每家店每个时间段都有用,数据思维的行为则是收集所有商品和顾客的信息,从海量的数据中分析挖掘出规律,这种规律一旦被验证有效就立即使用,即使不明白其因果关系也并不影响效果,而且数据收集是永不停止的,从数据中挖掘出的规律也在不断的更新演化,不会像前一种方式那样过一段时间、换一个地方可能就无效了。

但是数据思维和机械思维并不是完全对立的,而是互补的关系。数据中所包含的信息可以帮助我们消除不确定性,而数据中间的相关性在某种程度上可以取代原来的因果关系,这便是大数据思维的核心。而机械思维的方法论依然是非常重要的,不仅在很多地方依然是非常高效的解决问题的方法,更是我们在做人做事时理清思路、求真务实的重要工具。因果关系是人类认知的源泉,多问几个问什么有助于锻炼我们的思维能力。其实很多时候我们的思维是混乱的,连机械思维都做不到,何谈更高一级的数据思维(我最常想到的例子就是幼儿教育,比如有的家长不给孩子买零食吃,说零食没营养不卫生不健康,孩子吵着硬要买,然后家长就说那你别吵了,乖一点我就给你买。这样混乱的逻辑教出来的孩子思维也肯定是混乱的。思维混乱还有一个最普遍的现象就是说一套做一套,嘴上说要求真务实开拓创新,整天做的工作就是喊口号玩概念拉关系;每天说身体健康最重要,可是一边每天吃着降压药,一边饭局不断;总是在督促孩子好好学习,每天要完成繁重的课业,可是自己已经很多年没有认真的读过一本书了;等等等等。思维混乱的例子实在太多,其实能做好机械思维就已经是超级优秀的人了。)

我对这一章的印象如此深刻,还有一个原因是体会到了神经科学和认知学科的一些概念。人工智能的算法中有一个是模仿人脑神经网络的结构,AlphaGo就是用的神经网络算法,而大数据的本质是用数据给这个类似于神经网络的算法喂食,训练出高度精确的模型,也就是具有不亚于人类智能的解决问题的能力。那么反过来说,人类大脑的运作模式其实跟人工智能是一样的,本质上也是一套计算系统而已,也是需要用数据不断的训练,才能发展出更高的学识能力的。这样一来很多问题就解释的通了,为什么培养出一种能力需要反复的训练,为什么人需要不断的阅读、学习、接受新的信息,为什么人与人之间的差别会如此之大。难怪李笑来把人的思维比作大脑的操作系统,实在是太贴切了,人与人的差距本质上就是思维这套大脑操作系统的差别,有些人是在不断更新不断升级操作系统的,而有些人则永远是那一个版本。

第四章 大数据与商业。这一章列举了几个大数据应用于商业的实例,并系统的解释了原理。超市比父亲更早知道女儿怀孕等等的事例,对关注大数据的人来说,已经耳熟能详了。我印象较深的是一个酒吧运营的例子。美国有一种职业就叫创业者,他们的工作就是开创公司,几年开创一个。戴维是一名创业者,在他做第三个公司时,他对上百所酒吧做了调查,发现了一个利用传感器收集酒的销量的实时数据,从而来管理酒吧的方法。于是公司就专门为酒吧提供这套物联网管理解决方案,后来又演变成了酒吧行业的咨询管理公司。这个例子之所以印象深,是因为不同于那些高大上的项目例子,这个例子更加贴近我们的生活,是大数据的工具应用于较小商业和生活消费领域的成功案例。在这一章中,作者又提出了一个精彩的理论:所谓的新兴产业,其实就是新技术加上旧产业。因为人们的需求并没有发生根本性的变化,技术的进步改变的是供求关系和需求的层次,从而改变了整个产业,催生出新的商业模式。工业革命以后,全世界从过去的物质生产供不应求,逐渐变成了供大于求,于是出现了一种新的商业手段——营销。广告、推销、展会本质上都是营销方式,都是在工业革命以后才出现的。如今大数据又会对商业世界造成怎样的影响呢?按照作者的推理,无论是工业生产领域还是居民消费领域,大数据会使供需对接更加精准和精细化,会在用户需求产生时甚至在产生前,商家就已经准备好或者预测到,并及时提供服务。我想,能否理解这一商业变革,是能不能尽早赶上数据时代(智能时代)的关键。书中很有趣的讲到了雷军和董明珠打的那个赌,说小米三年内会赶上格力,赌注是十亿RMB。作者认为这个赌体现了两代企业家对商业世界未来的判断分歧,无疑雷军洞察到了数据时代的巨大潜力,小米也是朝着家庭数字家电一体化解决方案的方向走的,而董明珠则仍然秉持着老一代企业家的观念,靠产业链的整合能力和营销渠道的掌控能力来提高企业竞争力,因此格力能否保持其巨大的体量和市场优势,还要看它能否从工业时代企业转型成数据时代企业。在这里,我希望正在阅读我的读书笔记的朋友,如果正好在经营企业的话,一定要关注一下数据分析、数据挖掘等技术的应用前景,或者干脆买这本书来看一下,也许你公司现在遇到的一些问题或者困境,用一些先进一点的工具就能够解决问题也说不定。

第五章 大数据是智能革命的技术挑战。实际上,大数据并不是新兴的学科,而是计算机、电机工程、通信、应用数学和认知科学的综合。大数据的使用场景和应用领域非常广泛,很快会深入到社会的方方面面。但是大数据也是有门槛的,并不是任何一个创业者都能轻易进入的。大数据的特点在于数据量大、维度复杂、数据完备性,所以对硬件和软件的要求都非常之高。本章从数据的采集,到存储,到分析运算、再到挖掘使用这几个角度,分析了大数据存在的尚未攻克的技术难点。数据采集的难点在于硬件一般都在格力这样的传统企业手里,他们不懂数据的价值,又不愿开放给数据公司,于是Google他们只有曲线救国,收购一些小的智能家电公司。存储的问题在于存储空间和存储格式上,既要减少数据冗余又要方便随机调用,还要考虑数据备份。数据处理上主要是分布式运算并非简单增加硬件就行,由于数据有并行比例的特性,所以处理器数量增加以后运行速度是有上限的,还有一个分布式计算实时性的问题,所以解决这方面的问题需要从根本上改变系统的设计和算法。数据挖掘则是产生机器智能的直接过程,是将数据过滤整理,去除与解决问题无关的维度数据(降噪),格式化以后成为训练机器智能的数据集,然后像食物一样喂给人工神经网络一类的机器智能,这一步的核心在于机器学习的算法优化。最后则是数据的安全性,如何保证大家的隐私和安全,这里提到一个很有意思的机制——双向知情,即数据的采集到使用,用户自身也是知情的。这对我们行政部门的反腐工作也是一种启示,要想杜绝腐败,最好的方法不是单方面的层层监管,而是双向的公开透明。

第六章 未来智能化产业。现有产业+机器智能=新产业,未来的农业、制造业、体育、医疗、律师,甚至编辑记者行业都将迎来崭新形态(其实很多大的媒体公司已经在用电脑程序直接编写简单的新闻报道了,我们看到的许多短篇网络新闻很可能就是机器写出来的),新产业将取代旧产业满足人类的个性化需求,大数据将导致我们整个社会的升级和变迁。书中讲了几个非常有趣的案例,一个是以色列的农业发展历程,另一个是NBA勇士队夺冠的故事,听起来都是非常科幻和励志的。于是就突然让人有一种“科技好伟大、世界在变化的feeling”。书中还提到了一个比较尖锐的社会问题,就是被机器智能取代的劳动力如何安排,但似乎并没有讲到任何这方面的解决方案,只是用特斯拉工厂坚决不用传统汽车工人而只用程序员的故事,直白的告诉读者你不进步就要被社会淘汰这样一个铁律,而且在下一章里更加强调了这一个铁律。

第七章 智能革命和未来社会。这一章其实是本书的一个卖点,作者提出了一个耸人听闻的论点——只有2%的人可以跟上这波智能浪潮,其他的98%都会被淘汰。就像任何具有主观色彩的论点一样,不同的人看到这句话都会有不同的想法。有些人会迫不及待的想跟上这2%,于是去看这本书,而有些人则无所谓,还有些人会对这句话嗤之以鼻,认为完全是无稽之谈。在这里我也加一点带有主观色彩的看法,除了上面的三种人,还会有一种人会认为这句话完全是为了书的销量而做的噱头。我不否认这个噱头的作用,但我想说的是这一类人的看法其实体现了我们对知识价值的不重视、不认可,在他们的心里知识这种无形又不能马上变现的东西,应该是免费的,哪怕一本书几十块钱,一个每天推送前沿信息的节目年费200元,也是远远比不上把这些钱花在看得见的东西上的。这种认知是一个坑,我们很想远离坑里的人,无奈我们自己也是刚从坑里爬上来的,还有好多亲人好友在坑里,不能就这么走开。我们能做的只有用时间、用关爱,甚至用金钱,耐心的浇灌到这个坑里,相信他们总有一天也能爬出来。说回书的内容,作者在本章变现出深厚的社会学功底,他得出这一论点当然是有根据的,因为历史上的每一次技术革命,都是这样淘汰绝大部分传统劳动力的。他讲到了一战的原因在于工业革命以后,德国无法像美国那样靠开发广袤土地消化过剩产能,于是导致了民粹主义泛滥,最终劳工阶层把纳粹推上了台。最后对淘汰产能问题的答案只有一个——靠时间。书中说道,我们必须承认一个并不愿意承认的事实,就是被淘汰的产业的从业人员能够进入新行业的其实非常少,消化这些劳动力主要靠的是等待他们逐渐退出劳务市场,而并非他们真正有了新的出路。

0
0

查看更多豆瓣高分好书

回应(0)

添加回应

智能时代的更多书评

推荐智能时代的豆列

了解更多图书信息

豆瓣正在热议

豆瓣
免费下载 iOS / Android 版客户端