赤裸裸的统计学 8.1分
读书笔记 part of my notes
hayney

我们可以通过统计分析来确定两个变量之间的强烈联系,但却无法解释为什么存在着这样的联系,在某些情况下,我们也无法确定这种联系是否为因果关系,也就是说,不知道其中一个变量的变化是否真的能引起另一个变量的变化。

描述任务的第一步通常是估量某套数据的“中间位置”,也就是统计学家所说的“集中趋势”。

中位数正好将一组数字一分为二,1/2位于中位数之前,另外1/2位于中位数之后(如果遇上一组数字的数量为偶数,那么中位数就是中间两个数的平均值)。

标准差是衡量离散的指标,反映了分散在平均值周围的数据的聚合程度。

举个简单的例子,美国成年男性的平均身高为70英寸(1.778米),标准差约为3英寸(0.0762米),这意味着有很大一部分美国成年男性的身高在67英寸(约1.7米)到73英寸(约1.85米)之间。

对于任何一组数据来说,只要知道了平均数和标准差,我们就能进行简单的统计学分析,得出一些可以信赖的结论。

我告诉你美国SAT数学考试的平均分为500分,标准差为100,与身高的例子一样,大部分参加考试的学生的成绩都会在一个标准差范围内浮动,比如400~600分。

根据《华尔街日报》的报道,美国人甚至连在购物商场停车都呈现出正态分布,正对着商场入口的地方停车数量最多,也就是正态曲线的“峰值”,在入口左右两侧的停车数量逐渐变少,即曲线两端下滑的“尾巴”。

那就是我们通过定义就能够清楚地知道,有多少数值位于平均值一个标准差的范围之内(68.2%),有多少数值位于两个标准差的范围以内(95.4%),还有多少数值位于3个标准差的范围以内(99.7%),以此类推。

中间的那条线代表平均值,通常由希腊字母μ表示;标准差通常由希腊字母σ表示;每条色带均代表一个标准差。

在钠含量和收入这两个例子里,我们都缺少背景资料。赋予这些比较型数据意义的最简单的方法就是使用百分比。如果我跟你说,某品牌麦片A配方的钠含量比B配方高了50%,我的外甥阿尔在2013年的收入与2012年相比减少了47%,是不是就更容易理解了?用百分比来表示变化,可以让我们有一种用刻度测量的感觉。

主张并促成这次个税改革的民主党(正确无误地)指出,伊利诺伊州的个人所得税税率上升了两个百分点,从3%上涨到5%;共和党(同样正确无误地)指出,该州的所得税税率上升了67%,我们可以用刚刚学会的公式验证一下,(5-3)/3=2/3,即67%。

美国民主党将重点放在了税率的绝对变化上,而共和党则更关注税率的百分差。如刚才所说,两党在技术上都是正确的,但我可能会觉得共和党的描述更加准确地传达了税率变化所带来的影响,因为我以后要缴纳给政府的个人所得税—一笔我真的会在乎的钱—正如共和党所说的那样,确确实实上涨了67%。

所有指数均取决于其构成的描述性数据以及它们的权重,任何一点儿微小的变化都有可能引起结果的改变,因此,即使是最终得到的那个指数,可能是一种情况不完美但有现实意义的,也可能是完全不合理的。

要评价美国“中间阶级”的经济状况,我们需要了解(通货膨胀调整后的)工资中位数在过去几十年中的变化,他们还建议我留意一下处于第25百分位数和第75百分位数人群的工资变化,因为这两拨人通常被认为是中产阶级中的高收入和低收入人群。

方差和标准差是测量和描述数据分布的离散情况最常用的统计学技巧。方差通常用符号σ2表示,体现各个数值距离它们的平均值的距离远近。

假设有一组数量为n的数字x 1 、x 2 、x 3 ……x n ,它们的平均值为μ。

它们的方差σ 2 =[(x 1 -μ) 2 +(x 2 -μ) 2 +(x 3 -μ) 2 +……+(x n -μ) 2 ]/n。

中位数的决定性特征—不考虑数据距离中间位置有多远或是多近,而是关注它们是高于中间位置还是低于中间位置—反而成为它的弱点。

经济学家甚至为这一重要的现象冠以专业术语,以表示相关数据是否考虑了通货膨胀因素。名义数据就是没有就通货膨胀做出调整的数字,比较1970年某项政府项目的名义花费与2011年政府在相同项目上的名义花费,实际上看的仅仅是政府财政部在这两年所开出的支票的票面金额,并没有考虑1970年的1美元能买的东西比2011年买到的东西多。

你应该知道,从长远来看,保险并不能为你省钱。保险能为你做的是,当你遭遇一些难以承受的巨大损失时,如价值4万美元的汽车被盗、35万美元的房子被烧毁等,为你提供赔付,帮你渡过难关。从统计学的角度来看,购买保险是一项“糟糕的投资”,因为平均来看,你支付给保险公司的钱永远要比得到的赔付多。但如果想防止一些足以毁掉你生活的结果出现,保险就是一个理性的工具。

“一个婴儿的死亡是悲剧,两个婴儿死亡就很可疑,三个婴儿死亡便可断定为谋杀,这就是大名鼎鼎的‘麦都定律’。

0
《赤裸裸的统计学》的全部笔记 60篇
豆瓣
免费下载 iOS / Android 版客户端