重新认识大数据

寒江枫
2018-04-13 16:32:24

大数据时代,就是一个数据爆炸的时代,在很久以前人们就开始运用数据,并且运用数据取得了非常多了不起的成就。然而,如今的大数据又和以前的数据时代不太一样,以前的数据只是样本提取,而现在的数据是全面的数据,以前的数据是主动的采集,而现在的数据是被动的产生。数据一直是我们人类社会发展和进步的直接推动力,数据的存在和积累让我们有许多新的发现,不断的改变着我们的工作和生活、思维方式,现在它依然如此,并且更加深刻的影响着,也更加密切的影响着。当前的互联网时代,我们无时无刻不在产生着数据,数据也无时无刻不影响着我们。

通过读这本书,深刻认识到数据的重要性,也看到了数据的缺陷性。我们能够利用数据,但不能滥用数据,我们可以参考数据分析得出来的一些结论,但不能让数据去帮我们做决定,毕竟数据是冰冷的,而人是有感情的和自由的。

我们首先要了解的是,大数据时代的数据和以前的数据是不一样的,而我们使用数据,对数据的要求也是不一样的,以前我们更要求精确的数据和统计,而在大数据时代我们会容许数据的不精确,大量的不精确数据聚集在一起又会得出精确的结论。前数据时代,数据都来自于样本,因为人们没有能力去

...
显示全文

大数据时代,就是一个数据爆炸的时代,在很久以前人们就开始运用数据,并且运用数据取得了非常多了不起的成就。然而,如今的大数据又和以前的数据时代不太一样,以前的数据只是样本提取,而现在的数据是全面的数据,以前的数据是主动的采集,而现在的数据是被动的产生。数据一直是我们人类社会发展和进步的直接推动力,数据的存在和积累让我们有许多新的发现,不断的改变着我们的工作和生活、思维方式,现在它依然如此,并且更加深刻的影响着,也更加密切的影响着。当前的互联网时代,我们无时无刻不在产生着数据,数据也无时无刻不影响着我们。

通过读这本书,深刻认识到数据的重要性,也看到了数据的缺陷性。我们能够利用数据,但不能滥用数据,我们可以参考数据分析得出来的一些结论,但不能让数据去帮我们做决定,毕竟数据是冰冷的,而人是有感情的和自由的。

我们首先要了解的是,大数据时代的数据和以前的数据是不一样的,而我们使用数据,对数据的要求也是不一样的,以前我们更要求精确的数据和统计,而在大数据时代我们会容许数据的不精确,大量的不精确数据聚集在一起又会得出精确的结论。前数据时代,数据都来自于样本,因为人们没有能力去采集全部数据,而大数据时代数据来源于总体,即“样本=总体”,这是很重要的一个区别。

对大数据的使用,我们也要转变一些固有的观念,在社会生活中,以及历史发展中,我们作为人类,十分的喜欢因果关系,总是在看到结果后希望能够找到引发这个结果的原因是什么,但是在大数据时代,相关关系变得更加重要,大数据时代的分析主要依靠的就是相关关系,我们只知道结论和数据存在相关关系,而不需要知道为什么产生这样的分析结果,即我们只要弄清楚“是什么”而不需要知道“为什么”,大数据时代前者比后者更加重要。书中列举了很多例子来阐述大数据中的相关关系,因为建立在相关关系分析法基础上的预测是大数据的核心,大数据不尽能够让我们看到已经发生的和正在发生的,而且还能预测将要发生的,这就是相关关系分析法的神奇之处。

大数据使用的一些思想,其实就是我们在处理其他事情上的思想,只是恰当的运用到大数据分析上,我们就可以取得一些意想不到的发现。运用大数据预测就是如此,因为我们都知道一个东西如果要出故障,不会是瞬间的,而是慢慢的出问题的,这时候无时无刻不存在的数据就会给我们展示出这种趋势,我们根据趋势去判断而得出结论。这大概就是预测的思想,提前预防,而不是等待出问题了才去补救,这是大数据给我们带来的好处。

但同时,大数据时代也存在很多的问题。随着大数据不断的积累和应用,人们也越来越注意要规范的使用大数据,相关的法律也在逐步的完善。比如许可和告知的法律规定,虽然第一手收集数据的公司遵守了法律规定,但是等数据到了第二手公司,第二次开发利用的时候,这种告知和许可已经无法起到任何作用了,已经远离产生数据的人们了,人们对自己产生的数据已经无法决定。所以,在发展的过程中,社会逐渐的认识到,个人隐私的保护,责任应该逐渐转移到数据使用者,而不应该在个人身上。随着数据的使用,我们还没有很好的转变思想,很好的考虑法律的应对。我们现在很多人理解大数据,还只是认为是把数据聚集在一起,可与查询更多的内容,得到更多的因果关系应用,而实际上呢,看起来毫不相干的大数据,通过一些好的关联分析的点子和成功的数学模型,就可以得出一些出乎意料之外的结论。大数据的运作是在一个超出我们正常理解的范围之上的,所用的数学模型是不断测试,的出来的最准确的那个,而不仅仅是一个简单的模型就可以的。随之而来的还有数据垄断问题,政府拥有数据,同样一些公司也拥有这大量的数据,这些数据属于谁,谁可以应用,公众又如何保护自己的数据,都是一些需要思考和解决的问题。

最后,我们还是应该客观的看待大数据,大数据可以给我们带来便利,但同时我们应该时刻警惕大数据,我们要驾驭大数据,而不能让大数据牵制我们前行,大数据预测提供的结果对我们来说只能是参考答案,而不是标准答案。大数据分析是冰冷的数字,而我们做事情时需要人情和思想。通过《大数据时代》我们每一个人都应该重新认识大数据,首先改变自己的思想认知,认识到使用大数据时,弄清楚是什么比找寻为什么更加重要,在保护隐私方面,匿名化或者单纯的隐藏已无法完全保护个人隐私。我们如何合理的运用大数据的力量,如何用法律规范大数据的使用和存储,才是今后我们社会需要尽快解决的问题。

0
0

查看更多豆瓣高分好书

回应(0)

添加回应

大数据时代的更多书评

推荐大数据时代的豆列

了解更多图书信息

豆瓣正在热议

豆瓣
免费下载 iOS / Android 版客户端