智能时代 智能时代 8.5分

强力研读笔记 | 与《智能时代》相遇

不读书变浆糊
2018-02-27 22:20:58
第一章 数据——人类建造文明的基石
 【概览】本书内容从“数据”展开,明确了“数据”具有更宽泛的含义。对于数据的使用自古有之,然而由于受到数据量和相关性的制约,一直以来并未得到足够的重视。近年来随着信息时代的到来,数据量激增,计算机技术飞速进步,一种数据驱动方法得以广泛应用,并使得数据成为下一次技术革命和社会变革的核心动力。

        简单说来,人类对世界的认知过程从现象开始,然后积累数据,通过对数据的加工处理,挖掘出其中潜藏的信息,进而经过系统化、理论化地总结成为知识。举个栗子,我们观察到天体不断运动的现象,然后开始利用仪器测量星球的位置和时间,从而得到它的运行轨迹,进而总结出了开普勒三大定律,“姿势”就是这样慢慢涨起来滴。那么人类文明的进程也就是“获取数据→分析数据→建立模型→预测未知”这样一个习惯性套路。

        在方法论层面,从前的建模方式是先判断采用什么模型,再研究模型参数是多少;而当数据量足够的情况下,可以采用多个简单模型替代一个复杂的模型的方法来契合数据。比如在设计飞机、航天器




...
显示全文
第一章 数据——人类建造文明的基石
 【概览】本书内容从“数据”展开,明确了“数据”具有更宽泛的含义。对于数据的使用自古有之,然而由于受到数据量和相关性的制约,一直以来并未得到足够的重视。近年来随着信息时代的到来,数据量激增,计算机技术飞速进步,一种数据驱动方法得以广泛应用,并使得数据成为下一次技术革命和社会变革的核心动力。

        简单说来,人类对世界的认知过程从现象开始,然后积累数据,通过对数据的加工处理,挖掘出其中潜藏的信息,进而经过系统化、理论化地总结成为知识。举个栗子,我们观察到天体不断运动的现象,然后开始利用仪器测量星球的位置和时间,从而得到它的运行轨迹,进而总结出了开普勒三大定律,“姿势”就是这样慢慢涨起来滴。那么人类文明的进程也就是“获取数据→分析数据→建立模型→预测未知”这样一个习惯性套路。

        在方法论层面,从前的建模方式是先判断采用什么模型,再研究模型参数是多少;而当数据量足够的情况下,可以采用多个简单模型替代一个复杂的模型的方法来契合数据。比如在设计飞机、航天器等方面,苏联设计人员数学功底非常深厚(据说教科书里全是公式),科学家们偏爱寻找比较准确但复杂的数学模型;而美国设计人员则另辟蹊径,利用高性能计算机和大量数据来寻找若干简单模型。数据驱动方法可以最大程度地得益于计算机技术的进步,因而它是智能革命的核心。

第二章 大数据和机器智能
【概览】相比于“人工智能”,“机器智能”的提法更接近目前技术的本质,其核心是变智能问题为数据问题——在数据量激增的背景下,通过数据驱动方法并利用超级计算能力创造从量变到质变的奇迹。

        传统人工智能想要模拟人类的思维方式(仿生学),而机器智能则充分发挥数据优势,用数据驱动来解决图灵测试问题。大数据包含了数据量大、多维度、完备性等三个基本特征,其英文“big data”中的“big”意指相对的、抽象的,暗示着我们将要经历一种思维方式的转变。

第三章 思维的革命
【概览】回顾科学发展进程,我们曾一直被基于“确定性/可预测性”与“因果关系”的机械思维所主导,它建立起了近现代的科学文明并通过工业革命让人类享受着进步的成果。然而,世界的不确定性渐渐凸显,变量日趋增多,真正的因果关系错综复杂,必须转变思维寻求新的解决方法。大数据思维的核心是,数据中所包含的信息可以帮助消除不确定性,而数据之间的相关性在某种程度上可以取代原来的因果关系。

        让我们来膜拜几个科学史上的大神吧。欧几里得的《几何原本》大名鼎鼎,但他最牛的贡献是开山立派,创立了基于公理化体系的几何学。古希腊罗马时代最伟大的天文学家(此处作者特意不加“之一”)托勒密,这位仁兄认为行星运行轨迹应该是最完美的圆形,就自己硬是用40~60个互相嵌套的圆精确地计算出了行星运动轨迹,该模型精度之高领所有后来科学家惊叹,即使现在用计算机辅助也很难解出40个套在一起的圆的方程;他还发明了球坐标、定义了经纬线、提出了黄道、发明了弧度制等等;而且,他不仅能构建大系统,还能总结出方法论——通过观察获得数学模型的雏形,然后利用数据来细化模型。再后来,那个说出了“我思故我在”的笛卡尔进一步提出了“大胆假设,小心求证”的科学方法论,而最后形成一种完整的、全新的方法论并开创了科学的时代、理性的时代、开启西方近代社会的则是牛顿。后来将牛顿的方法论概括为机械思维,其核心思想是:1、世界变化的规律是确定的;2、由于确定性做保障,规律不仅可以被认识,还可以用简单的语言或公式描述清楚;3、这些规律是放之四海而皆准的,可以应用到各种未知领域指导实践。

        机械思维直接带来了轰轰烈烈的工业革命,并且从那时起一直渗透到社会的方方面面,而且作为一种准则指导着人们的行为。但是从假设来看,这种方法论的局限性也显而易见,其一是人类很难找到真正的因果关系,运气成分很大;其二是它否认了世界的不确定性和不可知性,而世界的不确定性正是我们如今所看到的。这时候,又一位大神来拯救我们啦,他就是提出了信息论的香农。他将信息与不确定性联系起来,提出“信息熵”,我们就可以用信息来消除不确定性!

        所以,当我们回过头来再看大数据的三个特点:数据量大,因而足以消除不确定性;多维度,因而可以利用互信息的“相关性”以及交叉验证;完备性,因而可以覆盖小概率事件。于是,信息时代的方法论是用不确定性的眼光看待世界,再用信息消除不确定性,我们从追求因果关系转为追求强相关关系,从大量数据中直接寻找答案,即使不知道原因,也往往能收获意想不到的发现。

——————————————————————————————————————————————————
        接下来的章节讲了大数据与商业、大数据和智能革命面临的技术挑战,畅想未来智能化产业、智能革命和未来社会,吴军博士会给我们描绘一幅怎样的图景,又会给我们提出哪些建议呢?


【前情提要】
       前文提到,自牛顿的科学理论光芒照亮了世间,我们已经习惯了基于确定性和因果关系的“机械思维”,并且以此建立起灿烂的现代科学文明,创造出物质极大丰富的时代,然而如今这种思维习惯却难以应对日新月异的变革了。面对这个充满了不可预测性的复杂世界,寻找绝对因果关系显得越发地费力而不讨好。借助于大数据的积累以及计算能力的大幅提升,科学家们巧妙地把智能问题转换为数据问题,从而在机器智能领域的发展突飞猛进。

       明确了机器智能的基本概念和技术方法,它将会对未来社会产生怎样的影响,我们又将如何应对呢?
——————————————————————————————————————————————————

第四章 大数据与商业
【概览】大数据思维教会我们通过数据寻找相关性来解决各种各样的问题。商业模式会发生改变,大数据使得交易的完成不再是结束而是用户长期关系的开始。在未来,大数据和机器智能这种资源工具将会由专门的公司提供给全社会使用。

       在侦察违法犯罪方面,我们只需从大量数据中找到一种正常模式,再圈定模式异常的个体,就可以快速锁定嫌疑人。

       在商业领域,最著名的故事大概要属“塔吉特比一个十几岁女孩儿的父亲更早得知他孩子怀孕”了。如今,不论是亚马逊、淘宝、京东等都会向你推荐相关的商品,听音乐时也会收到为你量身定制的歌单。下次你也可以与小伙伴约定,同时在搜索引擎中输入相同的关键词,看看得到的提示有何不同。可以说,大数据在某种程度上已经掀起了个性化的浪潮。

       在大数据的应用方面,数据流会完成从局部到整体的双向流动。从局部的大量数据中总结整体规律,再将规律应用于每个局部个体并指导其具体行为。因此,大数据可以保证商业行为在满足宏观规律的同时,也能够精确地把握每一个细节。

       在这种背景下,商业模式会发生两个变化:一是产业链会从一个产品扩展到整个IT行业;二是服务业的重要性愈加凸显。新产业的缔造源于原有产业与新技术的有机结合。不妨用“+大数据”的思维进军垂直领域,让交易不再是一锤子买卖,使得产品成为连接顾客和商家的纽带,从产品后续使用情况中挖掘信息,让每一个用户成为长期收益的来源。

第五章 大数据和智能革命的技术挑战
【概览】经过漫长的技术积累,大数据技术已经具备了可行条件,并已经在实际应用领域取得了令人瞩目的成就。然而,在数据收集、存储、计算以及数据挖掘、数据安全和人们隐私保护等方面仍面临着不小的挑战,尤其是隐私保护方面,必须通过技术解决而非仅仅停留在法律层面。

       科学技术的发展并不是匀速的,而是在漫长的相对停滞过程中逐渐积累,然后获得单点突破,进而引发技术大规模爆破性地迅猛发展,今天我们可能正处于机器智能将要超过人类的拐点上。

       近年来全球开始数字化、摩尔定律持续有效、第四代LTE技术长期演进以及wifi和蓝牙技术的成熟、并行计算和云计算逐渐应用,使得大数据技术在数据产生、存储、传输和处理等方面的条件逐渐形成。

       然而,人们在问卷中总是倾向于不完全按照自己的意愿作答,所以聪明的数据采集者们总是要费尽心思去搜集那些人们在轻松时做出而又与核心问题相关的决定,但是这种“曲线救国”的策略却常常受到数据完备性和不变性的挑战,所以,合格的数据收集工作说起来容易做起来难。

       如今数据量的增长速度远超存储设备的发展,使得存储方式和便于共享的标准化数据格式变得尤为重要。人们对于并行计算和实时处理的要求越来越高,但是并行计算受可并行比例和分任务计算量不同的限制,对于系统设计和算法也提出了更高的要求。

       数据的过滤、整理和机器学习是机器智能的关键。机器变智能的过程也是需要自己学习的,只不过它学得飞快,经过加工整理的数据就是名师教材、传世武林宝典,而机器学习的算法则是它的学习方法,“好方法+练得多”就是机器智能的修炼秘籍。

       最后一个方面就是安全性,数据的安全和我们的安全。数据的安全指数据不丢失、不损坏,并且不被偷走或盗用;我们的安全指的是保护隐私不被侵犯,而这一点常常被我们忽略,因为我们往往不由自主地在便捷性和隐私安全性中选择前者(想想你们手机app中搜附近的时候是不是直接定位而不是手动输入地址就知道了→_→)。因此,这将是大数据未来走向大规模应用所必须妥善解决的问题。

第六章 未来智能化产业
【概览】现有产业依托新技术形成新产业,其特征是智能化与精细化。我们看到,传统产业中的农业、制造业甚至体育界也会在大数据和机器智能的参与下产生新的变化,而像记者、编辑,乃至医生、律师这样的高端行业人群也同样面临着被取代的风险。

       古老而传统的农业,在传感器数据采集、滴灌系统自主学习改进灌溉量、精准机械给水控制等技术帮助下成功实现了超级节水灌溉。运动员通过动作比对、技术统计来改进训练计划,计算机甚至已经开始训练小棋手了。特斯拉颠覆了汽车行业,汽车成为承载用户数据的一个平台。制造业在未来的竞争要靠从设计到销售全过程的智能化水平。

       大数据与机器智能带来了战胜癌症与衰老的希望。通过寻找相应的错误基因,在医疗领域近乎天文数字的几百上千万种组合方式在IT领域实在是小case,找到每种异常对应的有效药物,即可控制病情。同理,也有可能为我们揭开长生不老的秘密。另外,医学影像分析软件和手术机器人就像是学习能力极强、经验丰富、情绪稳定的“老大夫2.0版”,随着学习数据样本的增长,它们极有可能在未来替代专科医生。同样受到行业威胁的还有律师、记者以及编辑们。

 第七章 智能革命和未来社会
【概览】历次技术革命中,可选择的路只有两条:要么加入浪潮,成为前2%的人;要么观望徘徊,被淘汰。

       在未来社会中,智能交通管理系统帮助我们合理规划路线,使出行更加便捷;产品和服务实现从标准化到个性化的转变,我们的社会向着智能化和精细化发展。

       大数据和机器智能让我们整体的生活环境乃至文明程度产生了质的飞跃,但也对未来社会带来巨大冲击。需要引起我们注意的是,未来将是一个没有隐私的世界,而且很大程度上是由于我们主动泄露,目前大家往往只注意保护诸如私密图片和账号密码等,而对于性格偏好、学历收入、消费习惯、健康状况等不够重视,而这些数据却很容易使我们陷入被动的局面。

       每一次产业革命,都要经过至少半个世纪来消化随之而来的负面影响,因为解决劳动力剩余只有一种途径:耗——等待旧产业的从业人员退出劳务市场,而并非是因为他们真正找到新的出路。这样一个令人失望的事实还远远不是结束,机器智能带来的革命将比以往的冲击更加全面而猛烈。

       我们需要承认,人类将在越来越多的事情上比不过机器,而唯一能让自己在智能革命中获益而不是被抛弃的方法只有一个——争当2%的人。从工业革命开始的前三次重大技术革命中,首先受益的是那些与产业相关的人、善于利用新技术的人。所以我们能够做的,就是接受这样一种思维方式,并努力利用好大数据和机器智能,而不至于在未来惊慌失措。
0
0

查看更多豆瓣高分好书

回应(0)

添加回应

智能时代的更多书评

推荐智能时代的豆列

了解更多图书信息

豆瓣正在热议

豆瓣
免费下载 iOS / Android 版客户端