赤裸裸的统计学 8.1分
读书笔记 第1页
I♡SH

作者介绍

查尔斯·惠伦,芝加哥公共电台WBEZ节目的财经记者,于1997~2002年间担任《经济学人》杂志驻美国中西部地区的记者,曾为《芝加哥部报》、《纽约时报》和《华尔街日报》撰稿。

一句话讲书

脱去统计学枯燥的外衣,告诉你怎么利用统计学更好地生活。

本书重点知识

1.统计学的数学基础

(1)期望值:期望值的计算方法是某个事件所有不同结果的和。它是管理决策中,尤其是金融领域中最实用的统计工具。

(2)大数定律:相同条件下,随着实验次数的增多,结果的平均值会越来越接近期望值。在实际生活中,可以利用大数定律和期望值来判断一件事值不值得做。比如买彩票,期望值低于支出,随着实验次数增加,结果的平均值会越来越接近期望值,可以得出买彩票是非常糟糕的投资的结论。再比如高风险投资,期望值很高,要判断风险承受力,因为只有允许实验的次数越多,才越有可能得到期望投资回报。

(3)中心极限定理:任意一个群体的样本平均值都会围绕着该群体的整体平均值周围。就是说,当我们对一个基数庞大的群体做统计调查的时候,只需要对其中的一部分进行研究,得出的结论就能反映出整个群体的特点。而且抽样的数量越大,准确性越高。

2.随机取样都存在哪些偏见

(1)随机取样的关键点在于“随机”两个字。随机需要保证每个样本被抽到的概率相等,抽样后的样本才能代表整个对象的水平。如果不能保证每个样本被选中的概率相等,那这样的抽样结果就会存在偏见。

(2)选择性偏见:比如调查出行的人的消费水平时,如果只针对机场或长途汽车站的乘客展开调查,可能就会出现不同的结果,这就是选择性偏见。这种带有选择性偏见的样本,即便取样的量再大,得出的结论也是禁不起推敲的。

(3)幸存者偏见:一旦样本中有数据缺失,导致样本组成发生改变,就会影响分析结果。比如一个房子里站满了身高不等的人,让较矮的人离开,房间里的人的平均身高自然会上升,但实际上没有一个人长高了。

3.数据分析中需要警惕的常见错误

(1)忽略小概率事件:比如2008年那场金融灾难。当时很多公司都用一个叫“风险价值模型”的模型来评估投资风险和收益高低。这种预测可以覆盖99%的市场风险,但有1%的风险无法预测,但大家都不约而同地忽视了小概率风险。结果造成了一次全球大范围的金融危机。

(2)忽略统计误差:比如犯罪现场的DNA样本与被告的相吻合,这个样本和其他人相吻合的概率仅为百万分之一,如果忽略掉这百万分之一的误差,就有可能会让无辜的人获罪。因为这个误差虽然小,但警方的DNA样本库十分庞大,通过样本比对,找到两个DNA极度相似的人并不是不可能。所以给罪犯定罪时,还要参考性别、年龄等综合因素。

重要观点

1.统计学的基本原理就是通过分析数据,推断出事物本质,从而预测未来发展的轨迹。

2.当我们对一个基数庞大的群体做统计调查的时候,只需要对其中的一部分进行研究,得出的结论就能反映出整个群体的特点。

3.随机取样需要保证每个样本被抽到的概率相等,这样抽样后的样本才能代表整个对象的水平。然而我们开展调查时,因为人口组成非常复杂,这个环节经常出错。如果不能保证相关人口被选中的概率相等,那这种带有偏见的样本,往往会得出荒谬的结论。

4.统计学虽然有精确的数学计算,但精确有时候并不意味着准确。这是因为,只要数据建立在抽样调查之上,抽取的样本和真实结果之间就会存在误差。我们不可能消灭误差,只能通过躲开误区、缩小误差,来无限接近真相。

5.在大数据时代,各行各业都需要用到统计学知识来处理数据。对于数据的收集、整理、分析、总结都要谨慎,否则很有可能会失之毫厘,谬以千里,造成很严重的结果。

撰稿:周弘安平

0
《赤裸裸的统计学》的全部笔记 60篇
豆瓣
免费下载 iOS / Android 版客户端