一些笔记

Drifting_Moon
2019-08-04 看过
这些人发明了如此简单而常用的东西,以至所有人都忘了这些东西也需要人发明出来。

非常匆忙地读了一遍之后,脑子里第一时间浮现的是小说《好兆头》里的这句话,它基本上是我对这本书印象的完美概括。

经济学专业的学生,如果选过一些 policy evaluation 和 causal inference 方面的计量课程的话,对这本书的讨论内容和数学语言应该都不会太陌生。counterfactual,confounding factor,treatment effect,self-selection bias,上课的时候这些概念总是被作为某种客观存在呈现出来,看起来如此地清晰明了,以至于人都意识不到这么直白的数学定义也是经历了漫长的辩论才最终被 formalized 的,并且它们存在时间其实并没有很长。总之只知道如何拿来用就对了。但是这种拿来主义并不是没有问题。缺乏对这些概念的演进过程的认知在我需要从在更本质的意义上理解因果性的时候成为了很大的障碍。脱离了具体的案例和论文,想真正厘清因果的概念的时候才发现经济学作为一个靠 causal interpretation 吃饭的学科,对于因果和相关的区别有意或无意的含混竟然依旧广泛存在。

神奇的是,教科书解释不清的问题这本通俗书解释了,而且简单得不可思议。

以下自用笔记。不一定准确。

[因果关系的三个层级:观察,干预,反事实]

1. 观察:如果我观察到...会怎样?

2. 干预/do factor:如果我们实施...行动,会怎样?

3. 反事实/counterfactual:假如当时发生的事情与实际不同,会怎样?

书里作者描述的 2 跟 1 的差别并不是老生常谈的 “相关性不等于因果性”,而是更接近某种降维打击:任何一个不使用存在于 2,3 层级中的语言的模型都不能被拿来回答因果性关系,不管它被冠以格兰杰因果还是其他什么名字。用作者的话说,“没有哪种纯粹基于数据的方法可以回答 2,3 层级的问题。”用经济学的话说,不要用 reduced-form model 去做 structural model 才能做的判断。

真正能让你在因果之梯上爬升一个层级的,是干预/do factor(第七章)的存在。无干预,不因果。而能够去设计一个 do factor 的前提,就是有因果图假设。实际上作者全书强调的一个核心观点就是单纯从数据出发的无模型的分析永远只能停留在第一层级上,因为数据的处理和直觉的混乱导致一些谬误很难避免(第六章)。事先去设定一个因果图的存在并不是循环论证;恰恰相反,这样做会增加你的论证的可信度:把所有结论的前提假设都摆在台面上,可以让相关行业的专家更好地检视其合理性;数据结果本身也是对这个因果图进行的反馈和评估。

3 跟 2 的差别相比而言感觉并没有因果本质上的差异。区别仅在于 do factor 默认是事先推演(“如果我做了A,B就会发生”),而反事实/counterfactual(第八章)是事后复盘或者事后归因(“假如我不做A,B 就不会发生”) 。

无反事实想象即无因果认知。我们对一切已发生事件的缘故的解释都基于我们对 “本来可能发生什么/what could have happened” 的想象。

这种有点离经叛道的解读方式在哲学上的源头来自于休谟和大卫.刘易斯的理论。作者进一步认为反事实是否 “以物理或形而上学的实体形式存在” 根本不重要,重要的是反事实是否在不同的人中间一致。换句话说,问题的重点在于,我们体验的是同一个事实(姑且排除perception的不同),可是我们想象的是同一个反事实吗?感觉人类对于一切事物的争论本质上都可以被归因为:我们很大程度上想象的并不是同一个反事实。。

另一个问题在于如何建立剂量—响应关系,毕竟因果影响是多元复杂的,不是台球桌上一个小球撞另一个那么简单。作者的解决办法很简单:使用确定性的模型或者说结构方程模型,并且指出这种模型最早就是经济学中使用的结构方程模型。作者默默地在脚注里黑了经济学一把,考虑到经济学内不同领域目前对于何谓 structural model 的看法还是惊人地含混,我觉得他黑的没什么问题。。 所以回头来看,卢卡斯批判也不过是赖特开启的因果革命的一声遥远的回响(...but what's taking you guys so long to go back to the starting point?好吧历史总是螺旋上升的。

有意思的是书里描写的统计学界十分抗拒 impose structure on the data,实际上你经济学(起码宏观领域)的问题好像在于 DSGE 模型 impose TOO much structural on the data...然后管任何不符合你模型预测的东西叫 puzzle。

[数据接合与因果中介]

第三章贝叶斯网络中提到了三点网络的三种基本接合形式:链,叉与对撞(collider),非常有意思。第六章的一些悖论可以拿这几种形式来理解。在第九章里作者进一步利用反事实的建模语言 formalize 了不同接合形式的不同案例。

[贝叶斯网络]

1. 贝叶斯学派与频率学派

2. 贝叶斯法则与贝叶斯网络

“信息是一个方向上的条件概率和另一个方向上的似然比。”“对于模型中任何给定的路径模式,我们应该期望在数据中看到怎样的概率依存模式。”

3. 贝叶斯网络与因果推断

“贝叶斯网络抓住了实现因果图与数据的交互的关键。贝叶斯网络的所有概率性质和在其基础上发展起来的信念传播算法在因果图中仍然有效。”

以下一些无关感想。

这本书最有意思的地方之一其实是它并没有囿于学科的限制,可以看出来作者跟其他自然和社会学科的研究者也进行过很深的交流,而且作者本人也有哲学背景。前半部分的历史介绍有点让人想起《女士品茶》,另外作者还引用了《未来简史》的作者尤瓦尔·赫拉利的观点,才意识到这真的是新书啊。

虽然案例旁征博引,但是全书一以贯之的是作者对清晰的数学语言的追求。这点之前一位教授的观点异曲同工:使用数学能强迫你把自己没想清楚甚至都没发现的隐藏假设清晰地表达出来,从而评估其合理性和对结论的影响。用作者的话说,“公式揭示了一切——没有留下任何一处疑问或含糊。在阅读一篇科学文章时,我经常会发现自己从一个公式跳到另一个公式,而完全跳过了中间的文字叙述。对我来说,公式是一个成熟的想法,而文字是不成熟的想法。”天才果然有其类似之处。

另外,作者也在书中聊了几个学者坎坷的研究经历,从一心一意养豚鼠的赖特到成为时代牺牲品的伯克斯,并且毫不吝啬对他们捍卫自己学术发现的勇气的赞美和钦佩。毕竟研究者公开跟学术霸权唱反调,最好的结果是一辈子默默无闻,最坏的可能性是像伯克斯这样无法继续做研究甚至无法继续活下去。但是这也不能让他们放弃。学界总是还有这样的人。他们的存在或许就是日常读博心猿意马但总归没办法彻底放弃的原因之一吧。

p.s. 表格里老是有一些印刷错误。虽然不影响理解但是still

P179 表 6.5,第二行第三列 0.341应该是0.314。

P318 表 9.1,第四列title应该是使用止血带。

3 有用
0 没用
为什么 为什么 8.7分

查看更多豆瓣高分好书

评论 0条

添加回应

为什么的更多书评

推荐为什么的豆列

了解更多图书信息

豆瓣
免费下载 iOS / Android 版客户端