数据分析入门书籍-关键指引

侯祥胡
2017-09-17 看过

《深入浅出数据分析》是美国O’REILLY出版社的“深入浅出”系列之一,以类似“章回小说”的活泼形式,穿插插图,对话,问答,作业,生动地向读者展现优秀的数据分析人员应知应会的统计学入门技术:

首先是数据分析的四个基本步骤

1、确定问题(找到关键的人,问对关键的问题,获得一手信息。学会提问,提问的艺术,沟通的艺术)

2、分解问题(可以借鉴完全穷尽法,列出假设情况,分组Checklist点检),小心选取统计模型【=心智模型,方向错误最终导致结论错误甚至截然相反】

3、收集假设情况各方面的数据,检验你的理论。调查表的设计,统计调查数据的处理(平均值法,异常数据的处理-分组细分还是剔除,如何随机分组),随机抽样,做出比较(比较有基准才能判别好坏)、总结(找到关键点)、评估,根据数据做出大胆假设,然后设计实验(实验组,控制组或者说是对照组),小心求证(是否有混杂因素,是否结论与证据的方向反了。当有新证据出现时,是否融入贝叶斯统计手法,Plan-Do-Check-Action循环改进)

4、综合结论做出建议决策

其次穿插于后面的都是服务于这四个步骤的方式方法:

随机抽样、 实验方法、最优化方法(利用Excel优化求解工具求取约束条件下目标函数的最值,散点图与可行区域组合进行数据可视化)、假设检验方法、贝叶斯统计方法、主观概率法、启发法、相关系数、相关性、散点图、直方图法、回归法、均方根误差、误差处理、相关数据库、数据整理技巧。

最后,三篇附录

介绍数据分析十大要务、R工具及Excel ToolPak工具的启用,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。有进一步深入学习需求的读者,建议入手《深入浅出统计学》《美的证据》、《信息视觉化》

本书使用了excel和R语言(免费开源的统计编程工具,比excel更灵活,推荐)做演示,Excel/R组织清理数据,在R中进一步整理,通过散点图、直方图找出有意义的模式,借助启发式算法做出结论,通过实验与假定预测未来,再以清楚直观的图形展示分析结果。

书籍封面的标语是:为破解繁杂数据、研究统计学以及制定明智决策指点迷津

用户阅读书籍期望能达成的目标:

1、用线性回归法预测加薪幅度。

2、用实验法探明谁是真正的客户(目标消费者)。评估广告效果

3、将重要统计概念概念:随机取样,贝叶斯,误差径直印入脑海深处。

4、优化业务模式,提高销售额。

5、克服认知误差。

6、清理庞杂数据,实现高效分析。

《深入浅出数据分析》目录如下:

1 数据分析引言:分解数据 1

2 实验:检验你的理论 37

3 最优化:寻找最大值 75

(限制条件原料橡皮总量限定,求橡皮鸭、橡皮鱼哪种产量组合下能使目标销售利润最大-隐含条件,全部卖完)

4 数据图形化:图形让你更精明 111

(哪种改版方案更好-散点图、汇总均值数据、多变量散点图)

5 假设检验:假设并非如此 139

排除法、证伪法筛选剔除虚假信息,信息真实度评级,排序

6 贝叶斯统计:穿越第一关 169

基础概率,先验概率,

7 主观概率:信念数字化 191

信心度评级数字化,贝叶斯规则修正主观概率

8 启发法:凭人类的天性作分析 225

9 直方图:数字的形状 251

数据的分布,差异,集中趋势,数据分组,排序,汇总,R语言直方图

10 回归:预测 279

11 误差:合理误差 315

12 相关数据库:你能关联吗? 359

countif,sumif

13 整理数据:井然有序 385

substitute()

附录一 尾声:正文未及的十大要诀 417

附录二 安装R:启动R! 427

附录三 安装Excel分析工具:ToolPak 431

原书中文版定价88元,太贵!

1 有用
0 没用

查看更多豆瓣高分好书

评论 0条

添加回应

深入浅出数据分析的更多书评

推荐深入浅出数据分析的豆列

了解更多图书信息

豆瓣
免费下载 iOS / Android 版客户端