人工智能 7.3分
读书笔记 十分钟浏览《人工智能》
过河石子

第一章 人工智能来了

2014 年3 月17 日清晨,仍在梦乡的洛杉矶市居民被轻微的地面晃动惊醒。这是一次震级不大的地震,但因为震源较浅,市民的感受比较明显。地震发生后不到三分钟,《洛杉矶时报》就在网上发布了一则有关这次地震的详细报道,报道不但提及了地震台网观测到的详细数据,还回顾了旧金山区域最近十天的地震观测情况。人们在新闻报道的网页上看到了《洛杉矶时报》记者的姓名,但该新闻之所以能够在如此快的时间里发出,完全要归功于可以不眠不休工作的人工智能新闻撰写程序。地震发生的瞬间,计算机就从地震台网的数据接口中获得了有关地震的所有数据,然后飞速生成英文报道全文。刚刚从睡梦中惊醒的记者一睁眼就看到了屏幕上的报道文稿,他快速审阅后用鼠标点击了“发布”按钮。一篇自动生成并由人工复核的新闻稿就这样在第一时间快速面世。

第二章 AI 复兴:深度学习+大数据=人工智能

Alpha Go 之前,人们至少喊过两次“人类要被机器毁灭了!”20 世纪60 年代前后算一次,20 世纪80 年代到90 年代前后也算一次。前两次人工智能热潮,每一次都释放过人类关于未来的瑰丽想象力,每一次都让许多人热血沸腾。但很不幸,两次热潮在分别经历了十数年的喧嚣后,无一例外地迅速跌入低谷,并在漫长的寒冬中蛰伏起来。

一种新科技的研发过程通常是这样的:初创公司接受第一轮风投,开发出第一代产品,虽然不成熟,但足以吸引一批早期接受者——粉丝。在早期阶段,产品的优点被粉丝放大,大众媒体跟风炒作,将该技术推向一个充满泡沫的膨胀期。随着盲目的追捧者激增,跟风研发、生产的初创公司越来越多,产品的不足被无限放大,负面报道开始出现,供过于求的市场竞争中,大批跟风入局的初创公司不是被兼并,就是走向倒闭,只有少数拥有核心竞争力的坚持了过来。跌入低谷后,第二轮、第三轮风投资金注入大浪淘沙后仅存的中坚企业,新一代技术和产品也随之问世,整个技术曲线步入稳步攀升的平台期和成熟期,潜在用户的接受程度也从5%以下逐渐提升到20%到30%,初创企业和风投资本开始迎来高额回报。

20 世纪50 年代到60 年代,伴随着通用电子计算机的诞生,人工智能悄然在大学实验室里崭露头角。以艾伦·图灵(Alan Turing)提出图灵测试为标志,数学证明系统、知识推理系统、专家系统等里程碑式的技术和应用一下子在研究者中掀起了第一拨人工智能热潮。但那个年代,无论是计算机的运算速度还是相关的程序设计与算法理论,都远不足以支撑人工智能的发展需要。例如,计算机科学和人工智能的先驱艾伦·图灵就曾在1951 年发表过一份写在纸上的象棋程序30,可惜当年的计算机难以实现这样复杂的运算。这就像探险家发现新大陆一样,第一次踏足新大陆和真正让新大陆蓬勃发展起来是根本不同的两件事。于是,从20 世纪60 年代末开始,无论是专业研究者还是普通公众,大家对人工智能的热情迅速消退。

20 世纪80 年代到90 年代,也就是我在卡内基-梅隆大学发明非特定人连续语音识别技术并将其用于苹果计算机系统的时代——那的确是人工智能研究者和产品开发者的一个黄金时代。传统的基于符号主义学派的技术被我和其他同时代研究者抛弃在一边,基于统计模型的技术悄然兴起,并在语音识别、机器翻译等领域取得了不俗的进展,人工神经网络也在模式识别等应用领域开始有所建树,再加上1997 年深蓝计算机战胜人类棋王卡斯帕罗夫,普通人的积极性一度高涨起来。但是,那个时代的技术进步还不够好,不足以超过人类对智能机器的心理预期。拿语音识别来说,统计模型虽然让语音识别技术前进了一大步,但还没有好 到可以让普通人接受的程度,测试环境稍稍变化就会造成识别效果大幅下降。那时,我在苹果公司开发的语音识别应用就更多被用于演示和宣传,实用价值十分有限。从整体上看,那一拨人工智能热潮仍然笼罩着浓厚的学术研究和科学实验色彩,虽然激发了大众的热情,但更像是跌入谷底前的泡沫期,远没有达到与商业模式、大众需求接轨并稳步发展的地步。

从2006 年开始,随着深度学习技术的成熟,加上计算机运算速度的大幅增长,当然,还有互联网时代积累起来的海量数据财富,人工智能开始了一段与以往大为不同的复兴之路。杰弗里·辛顿发表了《一种深度置信网络的快速学习算法》及其他几篇重要论文,其他深度学习领域的泰斗、大师们也在这一年前后贡献了一批重要的学术文章,在基本理论方面取得了若干重大突破。深度学习也由此进入了高速发展的全盛期。

深度学习能够大展身手的两个前提条件——强大的计算能力和高质量的大数据,都是在2010 年前后逐渐步入成熟的。深度学习、大规模计算、大数据三位一体,神兵出世,一下子就可以摧城拔寨、无坚不摧。其中,最有代表性的事件,就是谷歌大脑(Google Brain)的建立, 以及谷歌、Facebook、百度等一大批顶尖科技公司纷纷将“人工智能优先”设定为公司的科技发展战略。

第三章 人机大战:AI 真的会挑战人类?

今天的人工智能还不能做什么?

跨领域推理

人和今天的AI 相比,有一个明显的智慧优势,就是举一反三、触类旁通的能力。很多人从孩提时代起,就已经建立了一种强大的思维能力——跨领域联想和类比。三四岁的小孩就会说“太阳像火炉子一样热”“兔子跑得飞快”,更不用提东晋才女谢道韫看见白雪纷纷,随口说出“未若柳絮因风起”的千古佳话了。以今天的技术发展水平,如果不是程序开发 者专门用某种属性将不同领域关联起来,计算机自己是很难总结出“雪花”与“柳絮”,“跑”与 “飞”之间的相似性的。 这种从表象入手,推导并认识背后规律的能力,是计算机目前还远远不能及的。利用这种能力,人类可以在日常生活、工作中解决非常复杂的具体问题。

抽象能力。目前的深度学习技术,几乎都需要大量训练样本来让计算机完成学习过程。可人类,哪怕是小孩子要学习一个新知识时,通常只要两三个样本就可以了。这其中最重要的差别,也许就是抽象能力的不同。比如,一个小孩子看到第一辆汽车时,他的大脑中就会像《头脑特工队》的抽象工厂一样,将汽车抽象为一个盒子装在四个轮子上的组合,并将这个抽象后的构型印在脑子里。下次再看到外观差别很大的汽车时,小孩子仍可以毫不费力地认出那是一辆汽车。计算机就很难做到这一点,或者说,我们目前还不知道怎么教计算机做到这一点。人工智能界,少样本学习、无监督学习方向的科研工作,目前的进展还很有限。但是,不突破少样本、无监督的学习,我们也许就永远无法实现人类水平的人工智能。

知其然,也知其所以然。目前基于深度学习的人工智能技术,经验的成分比较多。输入大量数据后,机器自动调整参数,完成深度学习模型,在许多领域确实达到了非常不错的效果,但模型中的参数为什么如此设置,里面蕴含的更深层次的道理等,在很多情况下还较难解释。 拿谷歌的Alpha Go 来说,它在下围棋时,追求的是每下一步后,自己的胜率(赢面)超过 50%,这样就可以确保最终赢棋。但具体到每一步,为什么这样下胜率就更大,那样下胜率就较小,即便是开发Alpha Go 程序的人,也只能给大家端出一大堆数据,告诉大家,看,这些数据就是计算机训练得到的结果,在当前局面下,走这里比走那里的胜率高百分之多少。 几十年前,计算机就曾帮助人类证明过一些数学问题,比如著名的“地图四色着色问题”,今天的人工智能程序也在学习科学家如何进行量子力学实验。但这与根据实验现象发现物理学定律还不是一个层级的事情。至少,目前我们还看不出计算机有成为数学家、物理学家的可能。

自我意识。很难说清到底什么是自我意识,但我们又总是说,机器只有具备了自我意识,才叫真的智能。2015 年开始播出的科幻剧集《真实的人类》(Humans)中,机器人被截然分成了两大类:没有自我意识的和有自我意识的。 《真实的人类》中,没有自我意识的机器人按照人类设定的任务,帮助人类打理家务、修整花园、打扫街道、开采矿石、操作机器、建造房屋,工作之外的其他时间只会近乎发呆般坐在电源旁充电,或者跟其他机器人交换数据。这些没有自我意识的机器人与人类之间,基本属于工具和使用者之间的关系。 显然,今天的弱人工智能远未达到具备自我意识的地步.

审美。审美能力同样是人类独有的特征,很难用技术语言解释,也很难被赋予机器。审美能力并非与生俱来,但可以在大量阅读和欣赏的过程中,自然而然地形成。审美缺少量化的指标,比如我们很难说这首诗比另一首诗高明百分之多少,但只要具备一般的审美水平,我们就很容易将美的艺术和丑的艺术区分开来。审美是一件非常个性化的事情,每个人心中都有自己一套关于美的标准,但审美又可以被语言文字描述和解释,人与人之间可以很容易地交换和分享审美体验。这种神奇的能力,计算机目前几乎完全不具备。

情感。欢乐、忧伤、愤怒、讨厌、害怕……每个人都因为这些情感的存在,而变得独特和有存在感。我们常说,完全没有情感波澜的人,与山石草木又有什么分别。也就是说,情感是人类之所以为人类的感性基础。 2016 年3 月,谷歌Alpha Go 与李世石“人机大战”的第四盘,当李世石下出惊世骇俗的第78 手后,Alpha Go 自乱阵脚,连连下出毫无道理的招法,就像一个本来自以为是的武林高手, 一下子被对方点中了要害,急火攻心,竟干脆撒泼耍赖,场面煞是尴尬。那一刻,Alpha Go 真的是被某种“情绪化”的东西所控制了吗? 我想,一切恐怕都是巧合。Alpha Go 当时只不过陷入了一种程序缺陷。机器只是冷冰冰的机器,它们不懂赢棋的快乐,也不懂输棋的烦恼,它们不会看着对方棋手的脸色,猜测对方是不是已经准备投降。今天的机器完全无法理解人的喜怒哀乐、七情六欲、信任与尊重。不过,抛开机器自己的情感不谈,让机器学着理解、判断人类的情感,这倒是一个比较靠谱的研究方向。情感分析技术一直是人工智能领域里的一个热点方向。只要有足够的数据,机器就可以从人所说的话里,或者从人的面部表情、肢体动作中,推测出这个人是高兴还是悲伤,是轻松还是沉重。这件事基本属于弱人工智能力所能及的范畴,并不需要计算机自己具备七情六欲才能实现。

第四章 AI 时代:人类将如何变革?

人工智能的社会意义将超越个人电脑、互联网、移动互联 网等特定的信息技术,甚至有极大的可能,在人类发展史上,成为下一次工业革命的核心驱动力。

人工智能会让人类大量失业吗?

纵观人类发展史,我对这个问题的回答是:如果把这里的“失业”定义为工作转变的话,那么答案是“会的”。从短期看,这种转变会带来一定程度的阵痛,我们也许很难避免某些行业、 某些地区出现局部的失业现象。特别是在一个适应人工智能时代的社会保障和教育体系建立之前,这一阵痛在所难免。但从长远来看,这种工作转变绝不是一种以大规模失业为标志的灾难性事件,而是人类社会结构、经济秩序的重新调整,在调整基础上,人类工作会大量转变为新的工作类型,从而为生产力的进一步解放,人类生活的进一步提升,打下更好的基础。

哪种工作最容易被AI 取代?

那么,在人工智能快速发展的大背景下,哪种人类工作最容易被人工智能全部或部分取代呢?什么样的从业者应该尽早做好准备,以适应或转变到全新的工作岗位呢?

对此,我有一个“五秒钟准则”,这一准则在大多数情况下是适用的。一项本来由人从事的工作,如果人可以在5 秒钟以内对工作中需要思考和决策的问题做出相应的决定,那么,这项工作就有非常大的可能被人工智能技术全部或部分取代。 比方说,传统意义上,在股票交易市场工作的普通交易员只是起到一个信息录入员或中间人的作用,他们在嘈杂、纷乱的市场里,一边关注买方诉求,一边关注卖方诉求,他们所做的工作,只是根据买家或卖家的指令,完成实际的交易操作。对于一桩交易能否成交,他们只需要关注具体数字和市场行情就能做出判断。基本上,每个独立判断,花两三秒就能做出。 今天的自动化技术和人工智能技术足以完成这类简单的、中介性质的工作。这就是今天各大股票交易市场里传统意义上的交易员正大幅让位于计算机的原因所在。

基于“五秒钟准则”,我个人预测,从事翻译、新闻报道、助理、保安、销售、客服、交易、会计、司机、家政等工作的人,未来10 年将有约90%被人工智能全部或部分取代。如果就全人类的工作进行一个粗略的估计,我的预测是,约50%的人类工作会受到人工智能的影响。人工智能对人类工作的可能影响包括三种类型:

·人类某种工作被人工智能全部取代;

·人类某种工作被人工智能部分取代;

·人类某种工作转变为新的工作形式。

智慧金融:AI 目前最被看好的落地领域

根据高盛公司的评估,金融行业里,最有可能应用人工智能技术的领域主要包括:

·量化交易与智能投顾:一方面,人工智能技术可以对金融行业里的各项投资业务,包括股权投资、债券投资、期货投资、外汇投资、贵金属投资等,利用量化算法进行建模,并直接利用自动化算法参与实际交易,获取最高回报。另一方面,人工智能算法也可以为银行、保险公司、证券公司以及它们的客户提供投资策略方面的自动化建议,引导他们合理配置资产, 最大限度规避金融市场风险,最大限度提高金融资本的收益率。

·风险防控:银行、保险等金融机构对于业务开展中存在的信用风险、市场风险、运营风险等几个主要风险类型历来高度重视,投入了大量人力、物力、财力采集相关数据,制定风险模型或评分系统,采用各种方法降低风险,减少损失。而近年来新兴的互联网金融公司,由于其业务的特殊性,更加需要对客户的信用风险进行准确评估。相关的风险防控体系需要依赖高维度的大量数据进行深入分析,在这方面,基于深度学习的现代人工智能算法与人类分析员或传统机器学习算法相比,有着先天的优势,可以对更为复杂的风险规律进行建模和计算。

·安防与客户身份认证:基于新一代机器视觉技术的人工智能产品正在各大银行的客户端产品和网点承担起客户身份认证与安防的工作。今天我们使用支付宝或各大银行的手机银行时,已经有不少应用需要我们打开手机摄像头,计算机自动将摄像头采集的用户脸部图像与用户预存的照片进行比对,以确认用户的真实身份。银行各办公网点则可以利用新一代人脸识别技术,对往来人员进行身份甄别,确认没有坏人进入敏感或保密区域。

·智能客服:银行、保险、证券等行业为确保客户服务质量,一般都建立了大规模的呼叫中心或客服中心,雇用大量客服人员,利用电话、网站、聊天工具、手机应用等方式,解答客户问题,解决客户疑难。随着支持语音识别、自然语言理解和知识检索的人工智能客服技术逐渐成熟,金融行业的客服中心会慢慢引入机器人客服专员,由人工智能算法代替人类工作人员,并最终建立起全智能化的客服中心。

·精准营销:如何将金融产品通过传统媒体、网络媒体、手机应用广告等营销方式,传递给最有可能购买该金融产品的客户,这是提高金融行业获客效率,提升盈利能力的关键。基于深度学习的人工智能技术可以基于多来源、多维度的大数据,为银行潜在客户进行精准画像,自动在高维空间中,根据潜在客户曾经的购买行为、个人特征、社交习惯等,将潜在客户分为若干种类别,并为每一种类别的潜在客户匹配最适合他们的金融产品。

智慧医疗:AI 将成为医生的好帮手

人工智能对人类最有意义的帮助之一就是促进医疗科技的发展,让机器、算法和大数据为人类自身的健康服务,让智慧医疗成为未来地球人抵御疾病、延长寿命的核心科技。

2017 年2 月,发表在《自然》杂志上的一篇论文介绍了一次有关皮肤癌诊断的人与机器的“较量”。在该论文所揭示的研究中,科学家们让一个卷积神经网络分析了将近13 万张临床上的皮肤癌图片,这个数字比现在最大的研究用图片集高出了两个数量级。在大量学习资料的支持下,这个神经网络迅速成为一名皮肤癌方面的专家。研究者让这个计算机皮肤癌专家与21 名资深的皮肤科医生“同场竞技”。在第一场挑战中,这个神经网络与医生们一同区分两种不同的皮肤疾病——角质细胞癌与良性脂溢性角化病。前者是最为常见的皮肤癌。综合灵敏性和特异性来看,这个神经网络的表现比大部分参与研究的皮肤科医生都要好。不服气的人类做了第二项测试,这次他们比较的是恶性黑色素瘤与良性的痣。前者是最具杀伤力的皮肤癌。但在这场比试中,人类同样败下阵来。

用机器进行音乐创作,也是人工智能领域长期以来的研究方向。加州大学圣克鲁兹分校的戴 维·柯普(David Cope)就是这一方向最有名的研究者之一。早在1981 年,戴维·柯普就开始尝试计算机谱曲的研究。据说他花了7年时间,写了一个名叫EM(I 音乐智能实验,Experiments in Musical Intelligence)的人工智能程序,这个程序可以在一夜之间写出5000 多首巴赫风格的乐曲来。有一次,在圣克鲁兹音乐节上,戴维·柯普演奏了EMI 谱写的几首乐曲。当时,场内的观众大多以为听到的真是巴赫的某个曲目。戴维·柯普后来又对EMI 进行了许多次升级,使这个人工智能算法可以模仿贝多芬、肖邦、拉赫玛尼诺夫等音乐家的曲风。不过,根据戴维·柯普自己的描述,EMI 使用的大多还是基于音乐规则的,类似专家系统的人工智能算法。在许多情况下,计算机所做的只是将古典音乐大师惯用的小节根据预设的规律做重新的排列组合,或简单变换。今天,与计算机绘画使用的风格迁移技术类似,深度学习一样可以在音乐领域帮助计算机更好地模拟大师的作曲风格。

第五章 机遇来临:AI 先行的创新与创业

伟大的创业需要生逢其时

创业大潮里,有的创业者脱颖而出,有的创业者负重前行。我们虽不以成败论英雄,但如果一定要找一条诞生伟大公司的必要条件,我会选择“生逢其时”。 雷军创立小米的传奇让“风口论”深入人心——只要站在风口,猪也能飞起来。有人说,这是绝对的机会主义。但在创业的时代大潮中,是否符合科技大趋势的确是决定创业成败的第一要素。

人工智能时代刚刚到来,人工智能领域的各种创业机会还处在相对早期的发展阶段。未来四五年对于人工智能时代的意义,和20 世纪70 年代、80 年代对于PC 时代的意义相比,绝对毫不逊色。几乎可以预言,如果人工智能时代也会出现苹果、微软、谷歌、百度、阿里、腾讯等伟大公司的话,那么,这些伟大公司一定会有相当数量是在这四五年里创立的。

人工智能时代,程式化的、重复性的、仅靠记忆与练习就可以掌握的技能将是最没有价值的技能,几乎一定可以由机器来完成;反之,那些最能体现人的综合素质的技能,例如,人对于复杂系统的综合分析、决策能力,对于艺术和文化的审美能力和创造性思维,由生活经验及文化熏陶产生的直觉、常识,基于人自身的情感(爱、恨、热情、冷漠等)与他人互动的能力……这些是人工智能时代最有价值,最值得培养、学习的技能。

第六章 迎接未来:AI 时代的教育和个人发展

人工智能时代,程式化的、重复性的、仅靠记忆与练习就可以掌握的技能将是最没有价值的技能,几乎一定可以由机器来完成;反之,那些最能体现人的综合素质的技能,例如,人对于复杂系统的综合分析、决策能力,对于艺术和文化的审美能力和创造性思维,由生活经验及文化熏陶产生的直觉、常识,基于人自身的情感(爱、恨、热情、冷漠等)与他人互动的能力……这些是人工智能时代最有价值,最值得培养、学习的技能。而且,这些技能中,大多数都是因人而异,需要“定制化”教育或培养,不可能从传统的“批量”教育中获取。

比如,同样是学习计算机科学,今天许多人满足于学习一种编程语言(比如Java)并掌握一种特定编程技能(比如开发Android 应用),这样的积累在未来几乎一定会变得价值有限,因为未来大多数简单的、逻辑类似的代码一定可以由机器自己来编写。人类工程师只有去专注计算机、人工智能、程序设计的思想本质,学习如何创造性地设计下一代人工智能系统,或者指导人工智能系统编写更复杂、更有创造力的软件,才可以在未来成为人机协作模式里的“人类代表”。一个典型的例子是,在移动互联网刚刚兴起时,计算机科学专业的学生都去学移动开发,而人工智能时代到来后,大家都认识到机器学习特别是深度学习才是未来最有价值的知识。过去3 年内,斯坦福大学学习机器学习课程的学生就从80 人猛增到了1000 多人。

再比如,完全可以预见,未来机器翻译取得根本性突破后,绝大多数人类翻译,包括笔译、口译、同声传译等工作,还有绝大多数从事语言教学的人类老师,都会被机器全部或部分取代。但这绝不意味着人类大脑在语言方面就完全无用了。如果一个翻译专业的学生学习的知识既包括基本的语言学知识,也包括足够深度的文学艺术知识,那这个学生显然可以从事文学作品的翻译工作,而文学作品的翻译,因为其中涉及大量人类的情感、审美、创造力、历史文化积淀等,一定是机器翻译无法解决的一个难题。

未来的生产制造行业将是机器人、智能流水线的天下。人类再去学习基本的零件制造、产品组装等技能,显然不会有太大的用处。这个方面,人类的特长在于系统设计和质量管控,只有学习更高层次的知识,才能真正体现出人类的价值。这就像今天的建筑行业,最有价值的显然是决定建筑整体风格的建筑师以及管理整体施工方案的工程总监。他们所具备的这些能够体现人类独特的艺术创造力、决断力、系统分析能力的技能,是未来最不容易“过时”的知 识。

人工智能时代,自动化系统将大幅解放生产力,极大地丰富每个人可以享有的社会财富。而且,由于人工智能的参与,人类可以从繁重的工作中解放出来,拥有大量的休闲时间。这个时候,这个社会对文化、娱乐的追求就会达到一个更高的层次,而未来的文娱产业,总体规模将是今天的数十倍甚至上百倍。那么,学习文艺创作技巧,用人类独有的智慧、丰富的情感以及对艺术的创造性解读去创作文娱内容,显然是未来人类证明自己价值的最好方式之一。当绝大多数人每天花6 个小时或更多时间去体验最新的虚拟现实游戏、看最好的沉浸式虚拟现实电影、在虚拟音乐厅里听大师演奏最浪漫的乐曲、阅读最能感动人的诗歌和小说,作家、音乐家、电影导演和编剧、游戏设计师等,一定是人工智能时代的明星职业。

我们的时代,正进入这样一个前所未有的局面:随着科技的进步,AI 技术将在大量简单、重复性、不需要复杂思考就能完成决策的工作中取代人类。汽车将不需要人类来驾驶,人类翻译的工作将逐渐消失,人类交易员目前已开始被计算机取代,可能产生的失业问题必须有解决方案。人类社会如何接纳在AI 时代失去工作的人?人类历史从未像今天这样复杂、玄妙。AI 将创造更多的财富,也必然创造出大量新的工作岗位——更多的人可以转换到新的岗位,或与智能机器协同工作,大多数人可以因社会财富的丰富而选择更加自由的生活,还可以依赖于全新的社会福利体系。

“人工智能. 李开复, 王咏刚. 文化发展出版社. 2017”

0
《人工智能》的全部笔记 36篇
豆瓣
免费下载 iOS / Android 版客户端