简单统计学

lefei
2018-04-15 21:48:07

这本书真的是一本非常适合雪球阅读法的一本书,它在每一章节后面都附加了一个小节,并且在最后一章又将所有的重要观点结论进行了一个总结,因此,你如果花10几分钟将这些小结和结论看一遍也基本能了解这本书所讲的东西。书中包含了非常丰富的案例和研究过程,帮助你更加深刻的理解这些结论。书中主要讲了三件事:

一、出现统计结论错误的原因

1、 低估随机事件的发生概率。人类有解释世界的倾向,我们期望所有发生的事情都有一个因果关系,好让我们能更好的理解这个世界,低估了毫无道理的随机事件的发生概率。常见的幸运颜色、幸运数字,还是打麻将时是否带书,事实上对结果根本没有影响,但是人们就是热衷于此,要为所有的结果都找到一个原因。事实上很多个体事件的发生没有原因,上帝决定了偶然事件发生的概率。

2、 被数据欺骗。有些数据采集本身就具有误导性。比如书中一个案例,2011年,一群研究人员报告说,在澳大利亚,每天用6小时看电视的人比从不看电视的人平均早死5年,因此看电视影响寿命。这个结论问题就在于每天看电视的人或许本身就更加安静、更加抑郁,或者健康状况不是很理

...
显示全文

这本书真的是一本非常适合雪球阅读法的一本书,它在每一章节后面都附加了一个小节,并且在最后一章又将所有的重要观点结论进行了一个总结,因此,你如果花10几分钟将这些小结和结论看一遍也基本能了解这本书所讲的东西。书中包含了非常丰富的案例和研究过程,帮助你更加深刻的理解这些结论。书中主要讲了三件事:

一、出现统计结论错误的原因

1、 低估随机事件的发生概率。人类有解释世界的倾向,我们期望所有发生的事情都有一个因果关系,好让我们能更好的理解这个世界,低估了毫无道理的随机事件的发生概率。常见的幸运颜色、幸运数字,还是打麻将时是否带书,事实上对结果根本没有影响,但是人们就是热衷于此,要为所有的结果都找到一个原因。事实上很多个体事件的发生没有原因,上帝决定了偶然事件发生的概率。

2、 被数据欺骗。有些数据采集本身就具有误导性。比如书中一个案例,2011年,一群研究人员报告说,在澳大利亚,每天用6小时看电视的人比从不看电视的人平均早死5年,因此看电视影响寿命。这个结论问题就在于每天看电视的人或许本身就更加安静、更加抑郁,或者健康状况不是很理想,影响寿命的原因不一定与看电视相关。因此即便是真实的数据也可能得出错误的结论,这需要我们去分辨判断,思想永远比数据重要。

3、 我们有产出错误结论的动机。在学习工作中,有些人有发表论文的压力,有经济或名誉的诱惑,他们或许会主动的去美化一些数据或者是忽略某些数据,得出一个他们期望的结论。有时候,只要价格合适,一些人愿意寻找能够证明荒谬论点的证据。

二、常见的统计错误结论

1、自选择偏差。指的是在研究过程中因样本选择的非随机性而导致得到的结论存在偏差。如果我们在比较做出不同选择的人,同时不去考虑他们为什么做出这些选择的时候就会出现自选择偏差。比如参加体育活动的孩子比较自信,并不能说明体育运动能增强自信,也许有自信的孩子更愿意参加竞争性的活动;大学生的平均工资高于高中生,可能有一部分原因是他们更加聪明更加有抱负。

2、幸存者偏差。因为我们无法看到不复存在的事物。因此对老年人对研究不包含中年夭折的人;对于伟大公司共同特点的整理不包含拥有这些特点但是却已经破产的公司。我们通过观测到的现象得出结论,但是它是有风险的。

3、变形的图像。图像可能会扭曲和破坏数据。我记得教主曾经说过他认为股票的的走势图有时就会给你一种错觉,比如一支股票从1块涨到10块,另一个股票从10块涨到20块都是一条斜线,但是结果却是完全不一样的,因为前者翻了10倍,而后者才2倍。要特别当心数轴上零点忽略掉的图像,这种忽略可以将图像放大,放大数据的波动性,可能产生误导效果。

三、如何识辨和避免这些错误

1、保持怀疑。当某人向你展示某种模式时,不管这个人的履历多么令人震撼,你都应该保持怀疑,问一问“为什么”。不管遇到怎样的模式,你都应该思考:为什么会出现这种模式?特别是对于天马行空的反直觉的理论,应抱有极为谨慎的怀疑态度。另外如果两种事物之间没有合理的联系,那么即便他们数据上呈现相关性,也不能证明有因果关系。

2、注意数据的完整性和真实性。在研究中遗漏数据是一个危险信号,因为一些数据被丢弃或者“调整”,可能是因为他们对理想结果相矛盾。

3
0

查看更多豆瓣高分好书

回应(0)

添加回应

简单统计学的更多书评

推荐简单统计学的豆列

了解更多图书信息

豆瓣
免费下载 iOS / Android 版客户端