大数据变革下的世界大同与大不同

song的此刻时光
2018-04-09 17:08:00

前言

《大数据时代》这本书的精髓在于大数据变革下的思维变革、商业变革和管理变革。从中,我们可以一一验证在大数据席卷了三四年之后,书中所提及的变革是否真的改变了我们的思维决策机制、商业模式、社会生活的安全和效率。

最早提出大数据时代到来的是全球知名咨询公司麦肯锡。这家公司在全球咨询中很早就察觉到:数据,已经渗透到每一个行业和业务职能领域,甚至已经成为重要的生产因素。2012年,大数据(big data)一词越来越多地被提及,它不断出现在《纽约时报》、《华尔街日报》等新闻专题中,越来越多的投资人、媒体人、创业者成为大数据的拥趸者。

人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。就是在这样的契机下,2013年维克托·迈尔-舍恩伯格和肯尼斯·库克耶共同著作的《大数据时代:生活、工作与思维的大变革》出版。

这本书的诞生,为当时还混沌未明,但热度却甚嚣尘上的新概念——大数据定下了一个地理锚。像当年哥伦布为了寻找遥远的东方,在美洲大路上插上了一面鲜明的旗帜,指引深居内陆的人类去探索海洋、寻找东方国度一样。

...
显示全文

前言

《大数据时代》这本书的精髓在于大数据变革下的思维变革、商业变革和管理变革。从中,我们可以一一验证在大数据席卷了三四年之后,书中所提及的变革是否真的改变了我们的思维决策机制、商业模式、社会生活的安全和效率。

最早提出大数据时代到来的是全球知名咨询公司麦肯锡。这家公司在全球咨询中很早就察觉到:数据,已经渗透到每一个行业和业务职能领域,甚至已经成为重要的生产因素。2012年,大数据(big data)一词越来越多地被提及,它不断出现在《纽约时报》、《华尔街日报》等新闻专题中,越来越多的投资人、媒体人、创业者成为大数据的拥趸者。

人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。就是在这样的契机下,2013年维克托·迈尔-舍恩伯格和肯尼斯·库克耶共同著作的《大数据时代:生活、工作与思维的大变革》出版。

这本书的诞生,为当时还混沌未明,但热度却甚嚣尘上的新概念——大数据定下了一个地理锚。像当年哥伦布为了寻找遥远的东方,在美洲大路上插上了一面鲜明的旗帜,指引深居内陆的人类去探索海洋、寻找东方国度一样。哥伦布误将美洲当作亚洲的印度,原住民自此被世界称为印第安人也源于这个美丽的误会。虽然,哥伦布没有实现原本的目标,但其在世界航海史、世界地理、世界大融合等方面的卓越贡献不可小窥。

《大数据时代》怀揣定义一个新时代的梦想,试图预测一个全新技术变革下的世界规则和变化。野心勃勃的意图之下,关于大数据这个课题的探索和研究力争做到完整全面,但也会因为某些局限性,有一些哥伦布式的主观臆断。

作者维克托·迈尔-舍恩伯格曾任职牛津大学教授、哈佛大学科研项目负责人,他也是欧盟互联网官方政策背后真正的制定者和参与者,先后担任新加坡、文莱、科威特、迪拜及中东政府高层及高层智囊。国际化的视野和互联网精深的专业沉淀,让其具备驾驭大问题的能力和丰富的知识。

值得一提的是该书的翻译者周涛先生,他被业界称为中国最年轻有为的大数据专家,年仅27岁就被聘任为电子科技大学特聘教授。作为翻译者,他在推荐序中直观坦言在这里拼命叫好,是为了书卖多,但不代表他赞同作者舍恩伯格的所有观点。这种坦率又客观的态度,反倒让人对这本书有种不可全信,但不可不读的迫切感。

全书的核心观点涉及三个领域,第一个思维领域,作者抛出了大数据时代处理数据思维上的三大转变:不再抽样,力求全体数据;不再绝对精确,接受混杂;不求因果,只需相关。第二个商业应用领域,作者从社会数据化和数据交叉复用的巨大价值两个方面,讲述数据在商业世界中的创新与延展。第三个数据管理领域,作者警示了大数据时代来临黎明前的躁动和不安,提出关于大数据产业生态环境、数据安全隐私、信息公正公开等未能成规的隐性问题。

1

我们先来看看第一个领域:思维领域。在这个领域里,作者提出了三个掷地有声,却备最受争议的三个观点。在这里我们反其道行之,从这本书出版后的3-4年大数据应用实际情况来验证作者提出的三个观点是否站得住脚。

恰巧最近商业地产大数据平台和媒体公司赢商网领导潘伟(化名)的来访和交流,一半验证,一半颠覆了《大数据时代:生活、工作与思维的大变革》的关于思想变革的核心观点。下面,我们以赢商网大数据在商业地产中应用中的成功和难点之处来反推一下《大数据时代》当年的预测和结论是否中肯。

观点一:不再抽样,力求全体数据

作者维舍恩伯格提出大数据的第一个思维转变,是利用所有的数据,而不再仅仅依靠一小部分数据。实际上,这个所有数据无论在哪个领域,获取这一关也不可能实现全覆盖。以赢商网为例,其数据平台截取的是全国5000个购物中心招商和运营数据。潘伟介绍,这5000个样本代表了全国良性运营的购物中心整体数据。即便不能覆盖全部购物中心,但它呈现出来的大数据依然可以成为行业权威。商业社会,生存下来就是王道。生存下来,并且良性运营,才能成为行业趋势、经验判断的基础。赢商网采样基数人为的摒弃掉被淘汰了掉的购物中心,正是遵循了商业的规律,也是市场需求所决定的。

观点二:不再绝对精确,接受信息的混杂

书中的第二个观点认为我们在大数据时代乐于接受数据的纷繁复杂,而不再追求精确性。这一点,赢商网最新的核心业务来源恰恰相悖于这个理论。潘伟介绍,最近高德地图正在布局它的室内地图,而赢商网针对5000个购物中心长达十余年的监测和人工校正,正是高德所需的精细数据。因此,高德地图成为赢商网的甲方。在信息全获取方面,百度地图走在高德之前。然而,数据精细化未必不是高德与百度错位竞争的一个战略布局。

观点三:不求因果,只需相关

作者舍恩伯格最骄傲,也最兴奋的是第三个观点。他在书中无不流露出这种欣喜之情。他甚至有些极端地认为,社会需要放弃它对因果关系的渴求,而仅需关注相关关系。换句话说,人们只需要知道是什么,而不需要知道为什么。这个观点尝试推翻了由来已久的人类惯性,颠覆了人们做决定和理解现实的最基本方式。

从哲学角度来讲,放弃对因果的探寻,可以说人类放弃了自由意志,是一种堕落行为。这是《大数据时代》翻译者周涛对于此书谨慎地提出的与作者不一样的观点。

从社会科学的角度,因果关系是一种普遍范式。大部分的社会科学研究都只是为了解答一个终极问题——为什么?它带领人们回到事物的本源。维克托·迈尔-舍恩伯格试图以大数据革命让人放弃对事物本源的探寻,而仅仅关注其关联,未免有些舍本逐末的嫌疑。

从逻辑的角度来说,大数据的全面性和关联性更多的是提供人类思考的信息基础,真正到决策层面,仅仅依靠数据化、信息交叉难以得到确切的判断。来自赢商网的潘伟在交流大数据应用其间,饶有兴味地问了一个问题:“1个商业品牌仅在全国5000个购物中心出现一次,这样的品牌占据总品牌数据库的比例是多少?”一般人意想不到,他自己都不无惊讶地回答:“已经达到25%了啊!这个数据是我们凭借直观判断,怎么都想象不到的。只有在大数据信息交叉模型分析下,才会有如此出人意料的结论。然而,为什么会是这样一个数据结论?我们团队分析了很久,这一个为什么也问出了很多大数据检测不了的社会变化。比如,这25%中有很多这半年至一年兴起的新兴品牌,这代表了消费升级带来的业态和品牌升级趋势。这种对大数据结论的反向验证就需要人们以”为什么“来反推看似异常的结论背后的原因。继而,购物中心后续运营才能依据这些原因进行适度调整,迎合消费升级的趋势变化,保障购物中心在商业的浪潮中常变常新,立于不败。

虽然语言表述方面有些绝对,但舍恩伯格提出大数据时代处理数据思维上的三大转变中关于采样全部数据的必要性、包容数据的混杂性、重视数据的相关性确实在数据挖掘和数据应用领域起到了很好的指导作用。

2

在商业变革中,舍恩伯格提出大数据被商业应用的前提是:一切皆可数据化。事实上,随着智能手机以及可穿带设备的普及,小到一个人每天的情绪变化,大到全球人类睡眠时长都沉淀成可被分析的数据。在信息时代,数据不再拘泥于反应当下行为和事件的一个表征,更多的潜在价值将被再度利用。换句话说,就是数据的价值从传统的基本用途转变为可在未来再次利用的潜在用途。这一转变意义重大,它影响了企业对其拥有的数据价值评估以及数据访问者的开放度,促使甚至是迫使公司改变商业模式,适应信息时代的游戏规则。

每一个个体行为的数据化是大数据时代来临的标志。大数据在商业领域的兴起归因与其对社会行为轨迹的动态捕捉,这是人类行为科学研究的一大技术进步。著名的啤酒与尿布的案例恰好说明了对个体行为轨迹的记录,为商业运营决策带来了参考依据:全球零售业巨头沃尔玛在对消费者购物行为分析时发现男士们在购买婴儿尿片时,不经意会顺带购买几瓶啤酒,于是尝试沃尔玛将啤酒和尿布摆在一起来互动促销。没想到这个举措大获成功,尿布和啤酒的销量都大幅增加。现在“啤酒+尿布”早已成了大数据技术在商业应用的经典案例,被人广为传播。以此为触发的兴奋点说明:数据作为一种资源,本来是一种非竞争性的资源,现在随着数据体系的完善,它的价值并不会因为被一次使用而减少,相反它会因为被不断地交叉、深挖、再利用而产生出更高的价值。

因此,我们以后去定义一个数据的价值,一定指所有能够产生的可被选择的价值总和。然而,具体我们如何利用数据,使它产生像魔方一样多变组合的价值呢?在这里,作者舍恩伯格提到了六种数据创新:

数据创新一:数据再利用。在商业领域,数据的运用者不仅仅是那些拥有大量数据的机构,更多的是可以用这些数据来支持其公司商业模式的机构。比如,乔布斯就曾为医疗大数据买单了好几十万美元。他是世界上第一个对自身所有DNA和肿瘤DNA进行排序的人。他支付费用得到的不是样本,而是包括整个基因的数据文档。医生按照所有基因按需下药,最终这种方式帮助乔布斯延长了好几年的生命。

书中提到的第二个数据创新指的是重组数据。以前处于休眠状态的数据价值未被发现,现在我们通过与另一个截然不同的数据集结合,用新的方式混合这些数据,做出来的事情非常有意思。微软纽约研究院的经济学家大卫罗斯柴尔德(David Rothschild)2012年就已经通过重组大数据成功预测24个奥斯卡奖项中的19个,成为人们津津乐道的话题。2014年罗斯柴尔德又成功预测第86届奥斯卡金像奖颁奖典礼24个奖项中的21个,向人们展示现代科技的神奇魔力。

作者维舍恩伯格提出的第三个数据创新指的是扩展数据。如果我们想要更好地利用数据,那么从一开始就需要设计好数据模型的可扩展性。虽然这不能完全做到,因为数据初次使用者不能预见性地了解到数据二次使用、三次使用的方式和潜在价值。但我们可以尝试鼓励相同数据集开发多种用途。购物中心或者百货大楼安装的摄像头,不仅能起到监控作用,也能跟踪经过商店的客户流和他们停留的位置,从中总结和推测数据背后的需求。明尼苏达州一家塔吉特门店被客户投诉,一位中年男子指控塔吉特将婴儿产品优惠券寄给他的女儿,但他的女儿还只是一个高中生。故事的转折是没多久他却来电道歉,因为女儿后来向他坦白说她真的怀孕了。塔吉特百货就是靠着分析用户所有的购物数据,通过相关关系判断得出事情的真实状况。

下面我们再来看看第四个数据创新——数据的折旧值。数据收集者和拥有者无法想像数据再利用的所有可能方式,随着时间的推移,大部分的数据都会失去一部分基本用途,但可供选择的价值却依然强大。从这个角度,舍恩伯格提出组织机构应收集尽可能多的使用数据,并保存尽可能长的时间,同时也应当与第三方分享数据。这样不仅使整个数据更趋完备,同时由数据再利用而产生的任何商业价值,原始数据拥有者都能从中获得一定的利益分配。例如,5年前一个消费者在亚马逊买了一本书,现在他可能对类似的主题书籍已经完全没有兴趣。如果亚马逊继续依据这个数据向他推荐书籍,他就不大可能购买。亚马逊推荐的依据,既有旧的过时的信息,又有近期有价值的信息,而旧数据的存在破坏了新数据的价值。这就需要不断地更新数据库并淘汰无用信息。然而,如何判断哪些数据不再有价值?亚马逊建立了复杂的模型来帮助自己辨别有用和无用的数据。例如,如果客户浏览或购买了一本基于以往购买记录而推荐的书,它就认为这项旧的购买记录仍然代表着客户的喜好;反之则不然。这样,他们就能够区分旧数据的有用性,并使数据的折旧率划分得更准确。

说到第五个数据创新,我们要认识一个新名词——数据废气。数据废气是指人们在网上留下的数字轨迹。它是人们在线行为记录,包括浏览了哪些页面、停留了多久、鼠标光标停留的位置、输入了什么信息等。比如,在拼写检查中,用户会有大量的错误拼写。这些数据看起来是废品,但它一边创造出很多流行的网络新词,一边成为有心企业的一座金矿。这就是行业巨头们,如阿里巴巴、腾讯、百度等不再惧怕兴起公司的原因,他们收集了来自客户交互的数据废气并纳入到他们的服务中,使得竞争优势迭代升级,不可超越。还有很多生动的行业案例:比如物流公司的数据原来只服务于运营需要,但数据一经再利用,数据挖掘师可以将传统的物流公司华丽丽地变身为金融公司,他们原本的基础数据用来评估他们曾经服务过的客户的信用,提供给客户无抵押贷款,或者拿运送途中的货品作为抵押提供贷款。不仅如此,信息足够全面和强大的物流公司甚至可以转变为金融信息服务公司来判断各个细分经济领域的运行和走势。有公司大数据的积累到足够程度时,数据反应的事实已经接近“上帝视角”。美国洛杉矶的一家企业宣称,他们将全球夜景的历史数据建立模型,在过滤掉波动之后,可以做出了投资房地产和消费的研究报告,秒杀现下的房地产咨询公司。

接下来,我们来看看第六个数据创新,即开放数据。目前,商业网站如百度、阿里是大数据的先驱者,虽然他们掌握了庞大的搜索和消费数据,从更宏观的角度看政府才是大规模信息的原始采集者。如作者维舍恩伯格一样,很多观点认为政府只是收集信息的托管人,除了少数可能会危害到国家安全或他人隐私权的情况除外,数据应当对全球开放。他们认为私营部门和社会对数据的利用会比政府更具有创新性。有一则新闻,算是大数据应用与政府决策完美结合的例子。《卫报》曾经利用维基解密的数据做了一篇“数据新闻”。将伊拉克战争中所有的人员伤亡情况均标注于地图之上。地图上一个红点便代表一次死伤事件,鼠标点击红点后弹出的窗口则有详细的说明:伤亡人数、时间,造成伤亡的具体原因。密布的红点多达39万,显得格外触目惊心。一经刊出立即引起朝野震动,推动英国最终做出撤出驻伊拉克军队的决定。

在大数据价值链上,会有三种不同的大数据公司。

第一种是基于数据本身的公司。这些公司拥有大量数据或者至少收集到大量数据,却不一定有从数据中提取价值或者用数据催生创新思想的技能。这一点阿里巴巴的马云早就预测:10年以后世界上最大的资源是数据。十年以后,谁拥有更多的数据,谁能够把数据处理得速度更快,能够把数据产生出价值,甚至可以成为一个国家的竞争力。马云在他人还看不懂他的战略意图时说:其实阿里巴巴是一家数据公司,我们做电商的目的不是为了做买卖。我们投资了两个中国社会的大问题,一个是健康,一个是安稳。十年以后,中国的老百姓身体可能会出现问题。我们希望用数据去解决、预测、预防整个治疗体系,并希望通过技术、数据,能够参与年轻人的变革。

除了阿里这样的拥有大数据本身的公司,第二种大数据公司是基于技能的公司。他们通常是咨询公司、技术供应商或者分析公司。他们掌握了专业技能但并不一定拥有数据或提出数据创新性用途的才能。奥美数据分析师王泽蕴就是抓住信息时代的脉搏,成功转型为拥有分析数据专业技能的一个成功案例。她放弃传统媒体6年驾轻就熟的传媒记者身份,加入到全球最大的广告公司之一——奥美从事数据分析的工作。她提出不做无效的营销之人群画像,就是大数据在品牌客户定位分析的应用。人群画像很重要,但更重要的是背后的数据化思维方式,其实就是运用数据的手段去了解现象背后的规律到底是什么。

在具备大数据应用的技能公司智商,还有第三种则是基于思维的公司。对于这些公司来说,数据和技能并不是成功的关键。让这些公司脱颖而出的是其创始人和员工的创新思维,他们有怎样挖掘数据的新价值的独特想法。这样的公司目前还没有暂露头角,如果兴起必定也是信息时代的独角兽。在大数据时代的早期,思维和技能是最有价值的,但舍恩伯格认为,最终大部分的价值还是必须从数据本身来挖掘,也就是说——拥有大数据这座金矿本身才是最值钱的。

3

大数据在改变传统的思维、商业和管理的同时,也会带来巨大的安全隐患。凯文·凯利曾预言,未来信息的获取是以信息透明为前提的,但是谁也不知道这些数据会不会被犯罪分子利用。当世界开始迈向大数据时代时,社会也将经历一定的震动。在改变人类基本的生活与思考方式的同时,大数据早已在推动人类信息管理准则的重新定位。

大数据带来的第一个信息管理改变是将个人隐私保护,从个人许可到让数据使用者承担责任。数据保护的主体由普通的个人,转向数据使用者是有理有据的。首先,从对数据的掌控力来讲,违法与否只有使用者知道,也只有使用者才能把握到这个边界。他们在使用过程中,需要一定的评估,避免商业机密的泄露。其次,数据使用者是数据的最大受益者,理应承担起这个责任。第三,只有在使用过程中,才能逐渐培养和发明新技术来促进隐私保护。有一种叫做“差别隐私”的技术,就是故意将数据模糊处理,使大数据的结果模糊化,不确切到个体的结果。这就使得挖出特定个人与特定数据点的联系变得难以实现并且耗费巨大。

大数据带来的第二个信息管理改变是它创造了一个新的工种。大数据将要求一个新的人群来扮演数据挖掘和利用者的角色,他们被称作“算法师”。他们有的是在机构外部工作的独立实体,有的是在机构内部的工作人员,就好像公司内部的会计人员和外部的审计师。他们将担任大数据分析和预测的评估专家,他们来保证信息的公正和保密,他们进行数据源的挑选,分析和预测。

大数据的信息管理还不得不提防一种历史式的重演——信息垄断。数据之于信息社会就如燃料之于工业革命,是人们进行创新的力量源泉。没有大量鲜活的数据和健全的服务市场,创新就实现不了。随着信息时代日趋成熟,势必会有一两只数据大亨崛起。回想19世纪垄断铁路、钢铁、电报网络的霸主们,我们不得不提防大鳄们再次卷土重来。反垄断的经验是,一旦确定了基本原则,就要付诸行动。以上提出的隐私保护从个人许可到数据使用者承担责任的转变,在使用预测分析时考虑个人动因,催生大数据审计员等措施都将是大数据时代对信息进行有效、公正管理的基础。

4

简单总结一下今天分享的内容:

首先,我们说到了信息获取的思维方式的转变。概括来讲,大数据是“更多、更杂、更好”,相对于“小数据”时代,大数据追求的是由信息样本趋向于信息总体;在信息采集前期先不执著于信息的精确性而容纳它的复杂性;不拘泥于信息的因果关系更重视它们的相关关系,即不再深究“为什么”,更多地是揭示“是什么”以及“会怎样”。

其次,我们说到了大数据在商业领域的应用来源于信息挖掘和创新。人们可以通过数据再利用、数据重组、数据扩展、数据折旧值、数据废弃、开放数据等形式进行大数据变现。这其中产生了三类公司和个人,他们分别扮演数据的拥有者、数据挖掘和再造的采集和加工者、数据艺术化的创新者。当我们的一切行为与生活都可以“数据化”的时候,掌握这些数据的公司便像是拥有了一座蕴藏丰富的金矿山。通过数据的分析可以预测消费趋势,可以了解公共疫情,甚至可以预知犯罪的时间、地点、嫌疑人。是的,大数据的核心即是预测。

最后,我们说到了大数据在信息时代管理的机遇和挑战。大数据将个人隐私保护,从个人许可到让数据使用者承担责任。同时,它催生了一个新的工种——算法师,他们担任大数据分析和预测的评估专家。随着大数据的普及,防止信息垄断也是人们在信息时代努力的管理方向。

当新的时代来临,我们只有敞开怀抱来拥抱它,顺应它,乘风破浪,才能站在时代的前沿享受它带来的红利。作者舍恩伯格也怀着不无开放的心态坦言道,大数据并没有给时代带来标准答案,它只是适当的给予提醒、启示,为人们带来便利,让人们自己寻找自己的最佳答案。

OVER!

你的关注是我分享的最大动力!

0
0

查看更多豆瓣高分好书

回应(0)

添加回应

大数据时代的更多书评

推荐大数据时代的豆列

了解更多图书信息

豆瓣正在热议

豆瓣
免费下载 iOS / Android 版客户端