一本数据分析的入门读物

豆儿
2015-06-08 看过
对于数据分析,我完全是门外汉。最近因为一些原因需要短期内对数据分析有大概的了解和掌握,于是在知乎某个答案的推荐下找来本书,断断续续花了一周的时间看完。
总体来说,是不错的入门导读。以案例的方式引出数据分析中常用的种种方法,避免了教科书式的枯燥乏味,趣味性强,令人产生一读到底的冲动。此外,书中主要用到的分析工具是Excel、R语言和数据库。Excel中Solver软件包在最优化方法中得到运用,Data Analysis则可用来绘制直方图,更别提各种函数在数据整理中的灵活调用了。书中后半段开始频频使用R语言进行数据的分析和处理,例如绘制直方图、散点图、回归线及其均方根误差范围,对于没有编程基础的我来说,理解起来颇为吃力。数据库和SQL语句的应用只出现在第12章,我作为一个电脑盲看着“关系数据库管理系统”等专业术语也是醉了,内心不禁泪流满面:为啥大学的时候不好好学习数据库和C++呢?有点基础也不至于现在睁眼瞎。
本书介绍了10种分析方法:实验、最优化、数据图形化、“假设检验”、贝叶斯统计、“主观概率”、“启发法”、直方图、回归、误差。(其中“”表示是我自己掌握得不太好的部分。因为我个人比较喜欢定量而非定性的分析方法。)
①假设检验。通过得到的信息逐条判定它对每个假设是增强还是减弱的作用,进而对假设的可能性大小进行排序,据此得到最后结果。
②主观概率。当不同观点之间冲突较大时,通过将其转化为数字来协调分歧,并使用散点图进行二维表征,直观呈现出某一观点的分歧状况,使用标准偏差则可以对平均值周围的离散程度进行量度。这里,贝叶斯规则可以用来修正主观概率。
③启发法。
待续……(等我有时间再写)
想成为数据分析师,除了专业知识过硬,更重要的是对客户要求的把握和相关信息的全面搜集。有时,信息的变化往往会彻底推翻分析结果。工具和方法是死的,不要沉迷于构造模型和算法,把分析结果拿到实际中考虑,意义远大于一切。
0 有用
0 没用

查看更多豆瓣高分好书

评论 1条

添加回应

深入浅出数据分析的更多书评

推荐深入浅出数据分析的豆列

了解更多图书信息

豆瓣
免费下载 iOS / Android 版客户端