统计思维 统计思维 7.4分

因为"赌气",这位作者写了本能硌掉牙的"硬书"

东北黄老邪
2017-12-26 05:21:10

文/黄老邪

1.

2013年,在日本有一本很有名气的畅销书,叫《看穿一切数字的统计学》,尽管这本书畅销37余万册,但是仍然有很多读者在看完之后觉得不过瘾,认为这书写得不够硬,缺少统计学的干货。于是,书的作者"一气之下",又出了一本书,名字叫《统计思维》。

这位作者叫西内启,他毕业于东京大学医学部生物统计学专业。曾任东京大学研究生学院助理讲师,大学医院医疗资讯网络研究中心副主任,哈佛大学癌症研究中心客座研究员。目前在为日本多项社会创新提案提供数据支持和分析指导。

诚如西内启在序中所言,他写这本《统计思维》的初衷就是为了弥补读者朋友们对于统计学这门知识的硬货渴望。但这本书真的非常硬,牙口不好的读者恐怕会被硌掉几颗牙下来。

2.

《统计思维》全书共计28万字,包括序章、1~4章、终章、附录,共七部分。序章主要讲述作者出书的背景,并概括性的点明本书的主旨:统计学在商务社会里的重要意义与使用

...
显示全文

文/黄老邪

1.

2013年,在日本有一本很有名气的畅销书,叫《看穿一切数字的统计学》,尽管这本书畅销37余万册,但是仍然有很多读者在看完之后觉得不过瘾,认为这书写得不够硬,缺少统计学的干货。于是,书的作者"一气之下",又出了一本书,名字叫《统计思维》。

这位作者叫西内启,他毕业于东京大学医学部生物统计学专业。曾任东京大学研究生学院助理讲师,大学医院医疗资讯网络研究中心副主任,哈佛大学癌症研究中心客座研究员。目前在为日本多项社会创新提案提供数据支持和分析指导。

诚如西内启在序中所言,他写这本《统计思维》的初衷就是为了弥补读者朋友们对于统计学这门知识的硬货渴望。但这本书真的非常硬,牙口不好的读者恐怕会被硌掉几颗牙下来。

2.

《统计思维》全书共计28万字,包括序章、1~4章、终章、附录,共七部分。序章主要讲述作者出书的背景,并概括性的点明本书的主旨:统计学在商务社会里的重要意义与使用方法。书的主体部分是四个章节,通过商务社会里的具体案例,从浅入深,讲述了统计学中均值,方差,偏差,标准误差,概率,正态分析,t检验,x检验,一元回归,多元回归等基本概念跟用法。终章对全书做总结,再次归纳了统计学思维在商务实践中的使用方法跟分析顺序。

值得一提的是,作者西内启很能照顾读者朋友,为了避免大家看到正文中出现一大串的公式而失去阅读耐心,他把本书用到的所有统计学的概念跟数学定义,包括推导过程全部作为附录放到了书的最后,非常方便查阅。

不同于传统的统计学教材,《统计思维》这本书并没有过度纠缠在统计学大量专业术语的概念定义跟公式计算。这本书最大的亮点在于写作的出发点跟写作策略。作者更侧重通过具体的商务社会的案例,用逐层剥洋葱的方式来详细阐述,如何用统计学的思维来洞察这些案例中呈现给读者的数据背后的规律。

正如作者在书中反复强调的观点:

统计学有三大功能:把握现状、预测未来以及洞察人类行为的"因果关系"。而在商务领域,无论身处哪个行业,哪种职位,都需要用数据来洞察个人和集体的行动,进而寻找改变这种行动的方法。

说一个例子。如果有人提出,“在一个企业或者职场中,参加过体育社团的人更容易升为主管”,这样的结论你怎么看?

一般来说,普通人在分析一件事情时往往依靠感觉,但感觉一般来说是具有欺骗性的,我们需要用数据来说话。如果看过《统计思维》这本书,你或许就可以尝试用下面的方法来进行分析。

第一步:收集数据。通过企业的人事部门跟自己的调查,你可以得到下面这张数据表格。

第二步:数据的统计分析。

很多人拿到这个数据可能只会进行一个简单的比例计算。譬如说,计算出参加过体育社团的人成功率是21%(用63除以300),没有参加过社团的人的成功率是18.5%(用37除以200)。因此参加过体育社团的人成功率更高。这个结论充分吗?

要知道,即使是投硬币,多次出现正面的情况也是有着一定的概率的。仅仅用一个比例值来得出结论,这在商务社会里是非常不够用的。根据本书作者提供的统计学分析思路,这个问题的正确处理过程应该是下面这个样子的:

(1) 进行标准误差SE计算。参加过体育社团者成功率的SE是对P*(1-P)这个值开根号,这里的P就是刚才简单计算得到的21%,可以知道SE的结果为2.35%。

(2) 确定置信区间。根据统计学基本定义,比例或平均值在正负2SE的置信区间内,代表在5%的显著性水平下无法否定的假设的水平,这就是著名的95%置信度。因此可以计算出参加过体育社团者成功率在正负2SE之间的概率是16.3%~25.7%。

(3) 用同样的方法计算出未参加体育社团者成功率的标准误差SE位于13%~24%之间。

(4) 计算参加体育社团者成功率与未参加体育社团者率比例之差的标准误差。这里需要用到一个z检验的方法。最后得到这个比例之差的2SE区间是-4.8%~9.8%。

这意味着:在双侧5%的显著性水平下,我们无法否定参加过体育社团者成功率比未参加才的高出9.8%的假设,也无法否定参加过体育社团者成功率比未参加者低4.8%的假设。

翻译成人话就是:无法确定哪一方成功率更高。

上面这个例子大家可能会觉得过于简单,似乎不值得这么兴师动众来分析它。要注意,这里作者仅仅是用一个简单的例子来说明用统计学思维来分析现象的科学方法。而在真正的商务社会里,我们遇到的问题远比上面这个例子要复杂得多,比如说商场的消费者购买力的分析,如何根据购买者的性别、商品的种类、广告的投放力度来进行分析,比如说电子商务网站中用户的点击率与喜好分析,商家的满意度调查等等。

3.

在互联网时代,数据的获取相比之前变得前所未有的容易,但这些数据如果不采用科学严谨的统计方法来处理,造成的信息浪费姑且不说,很多时候,通过浅显的数据分析得出的结论因为站不住脚,反而会误导决策者的战略制定,给企业造成严重的损失,这才是真正值得我们重视的。

不可否认,因为语言跟教学区域的不同,《统计思维》这本书翻译出来的内容,跟我们国内常见的统计学相关书籍中讲解的方式方法并不相同。但这并不打紧,如果你有一定的概率论基础,高中时学过的那些排列组合的基础知识还没有完全遗失殆尽,《统计思维》这本书还是值得一看的,毕竟这本书的立意跟讲解角度确实足够新颖,很多不起眼的地方都着实能够让人眼前一亮。

好了,朋友们,这样一本"难啃"的硬书,你有没有勇气下嘴呢?

—The End—

5
2

查看更多豆瓣高分好书

回应(0)

添加回应

统计思维的更多书评

推荐统计思维的豆列

了解更多图书信息

豆瓣
免费下载 iOS / Android 版客户端