标准误与自由度

咱说
2009-11-01 看过
几个月前我初拾心理统计,看的就是这本传说中国内最优秀的《现代心理与教育统计学》,看到一半的时候实在看不下去了,转而看Gravetter教授的《行为科学统计》,短短数日,大彻大悟,醍醐灌顶,豁然开朗,啷哩咯啷,写下了那篇《标准误与标准差》(http://www.douban.com/review/1931228/)。

想当时初看,脑子里没有形成体系,又愚笨而得不到书中真传,所以只是粗浅地对比评论了此书。而今大彻大悟后再看此书,本指望能看出些好来,优秀教材总归有优秀之处吧,不想,却愈发看出了书中的不足,甚至是谬误。

统计的重点在推论统计,(初级)推论统计的重点则是假设检验和方差分析,而推论统计的基础是概率论。概率论的基础是什么?答曰:中心极限定理和大数定律(狭义而言即切比雪夫定理)。假设检验和方差分析的核心概念又是什么?答曰:标准误和自由度。如果一本统计学的教材,在进入假设检验的章节之前,没有把上述两个定理和两个概念讲明白,那么,对于假设检验和方差分析的那些公式和步骤多半得生吞活剥死记硬背了。

来看此书。它在引入“标准误”这个概念时几近提到了中心极限定理,但没有指明,反倒是讲到〈假设检验〉中的“平均数的显著性检验”时,在“总体非正态分布”的情形里突然给出了中心极限定理的定义。至于大数定律则压根没提,而它在前面“描述统计”部分讲标准差时早早提到的“切比雪夫定理”其实是“切比雪夫不等式”。

说到“标准误”这个概念,我那篇评论中已经指出了,它是在毫无强调的语境中以极短的篇幅给出了标准误的概念,让人丝毫体会不到其重要性。至于标准误的深刻含义和讨论,那就更是半句没有。再说到“自由度”,包括与之密切相关的“无偏估计”,两个名词提及了N次,却从来没有停下来讲讲其内涵。在〈概率分布〉中第一次提及时,它说“自由度是指任何变量中可以自由变化的数目”,准确地说应该是“任何变量中可以自由变化的变量的数目”呀!

如果说作者没有把上述概念讲明白,是由于作者作为专家已经意识不到初学者的障碍何在的话,那下面指出的这个问题不得不让我心疑作者是否真得理解了标准误和自由度。自打书中的公式6-11给出后,作者反复地用这个公式进行偷梁换柱。换出来了什么呢?(“√”表示“根号下”)

本来,根据定义,t检验的标准误=无偏估计的标准差/√n,同时无偏估计的标准差=√SS/(n-1)。可书中却往往写成t检验的标准误=样本的标准差/√(n-1),这里样本的标准差=√SS/n。诚然,这两种表达方式在数学上是等价的。可问题在于,后一种表达式没有实质意义,反倒让人直观地觉得标准误和标准差有个莫名其妙的√(n-1)的关系。加之书中本来就没有详细讨论过它们的关系,也许有人真就会这么错误地理解了。

如果我没有理由去怀疑作者的权威性的话,那唯一合理的解释是,作者这么偷梁换柱是为了便于读者计算。因为作者对于t检验的很多公式都在加减乘除一番之后给出了一个最终的公式,就是那种只要把公式中的各个未知数的值代入就可以得到结果的公式。可作者没有想到的是,在这么加减乘除之后得到的那个面目全非的一劳永逸的公式是难以被理解性记忆的,因为从式子上已经看不到什么逻辑什么定义了。如果学习统计学到头来只是为了把这些公式强行灌输进脑海里,试问这么一本教材和用于分析数据的计算机程序何异呢?还是想把学习者的人脑训练成不要理解只要执行的电脑?

而对于上面已经写过的SS这个符号,本书到了〈方差分析〉才第一次现身。SS的用处大着呢!记住了它,方差、标准差、假设检验和相关回归通通用得着,还可以和相关里的SP对比着理解。它不仅让各种表达式显得简洁,从逻辑上易于理解,而且它本身就可以简化计算。按心理学的话来讲,就是引入SS,可以减轻记忆容量,深化记忆的加工水平。何乐而不为呢?本书却没有这么做,包括〈方差分析〉中,如果能够多引入几个符号,就不会出现两个Σ粘在一起,还上标下标括号一大堆的繁忙景象,急死个人儿呀。

这就说到〈方差分析〉中的问题。其一,“完全随机设计的方差设计”里分了样本容量相同、样本容量不同和利用统计量进行方差分析三种情形,每种情形下分别给出了一套方差分析的公式。实际上,如果作者能够多花点篇幅讲明白方差分析中各个SS和df的定义式的实质含义的话,甭管你是分三种情形,还是三百种情形,一套定义式完全可以通吃!所谓万变不离其宗嘛。其二,作者在“随机区组设计的方差分析”中,把重复测量设计作为随机区组设计的一种(两个例题也都是重复测量设计),这种处理值得商榷。虽然从统计的角度讲,两种设计的分析确实是一回事,可是从实验的角度讲,这分明是两种不同的设计。

剩下想说的是,这本书今年出了所谓的修订版,实际上就是更正了若干笔误及排版错误,还有个别术语的修正。如果这样就能称之为修订版的话,我想说,这修订版里剩下的笔误和排版错误还够出本修订版呢!若在美国,五年时间够出两个货真价实的修订版了吧。其实最显著的变化是,价钱徒增了三元。此外,这书压根就没有提到如“效应大小”、“多元方差分析”等内容,如何能称之为“现代”呢?

在看了一本又一本国内编写的心理学教材后,我一个最深的感触就是,好教材难得,教材的整体水平差了国外一大截。如果说教材的差距某种程度上反映了中国与发达国家科研水平的差距的话,这还只是一方面。它反映的应该还有国内学者和国外学者科研水平上的差距,很多教材内容的深度、广度和新鲜度尤其是作者自己对知识理解的程度,都弗如甚远。不仅如此,它还可以反映国内学者和国外学者人文素养上的差距,为什么人家能把知识讲得那么生动活泼读得简直欲罢不能而我们却往往生硬干瘪读得快要捶胸顿足?

还是向前看吧,希望在前头,社会在进步,事情正在起变化。早些年那些运动给这个国家造成的创伤不是一代人就恢复得了的。1980年代中后期上大学的知识分子里,其实已经有些起色了,只是基数太小。再过十年,又会是一幅新气象。再过二十年,我们这代人应该能够做出些改变了。

Update:进一步发现了书里的一处严重错误:它把“样本标准差”和“作为总体无偏估计的标准差”当成了两码事。这也正好解释了它为什么要把t检验的公式那么偷梁换柱,为什么专门列出个“利用统计量进行方差分析”的一套公式。

是《行为科学统计》上指出样本标准差即作为总体无偏估计的标准差让我注意到这个问题。本来还以为只是两本书理解上的出入,然后我翻了手头有的多本生物统计学的教材和资料,都是和《行为》一个讲法。事实上,SPSS软件的数据分析以及科研论文中报告的样本标准差,无一不是作为总体无偏估计的标准差!

这么大的一个错误,却一版再版。这么一个错误的存在,就意味着此书中假设检验的大部分公式都是错误的,包括书中很多给出了标准差数值的例题的解也是错误的。压根就没有也不需要s和s(下标)n-1这么两个不同的符号。所谓公式6-11更是无中生有。至于在进行方差齐性检验时可以用s近似代替s(下标)n-1就更不对头了。
90 有用
6 没用

查看更多豆瓣高分好书

评论 60条

查看更多回应(60)

现代心理与教育统计学的更多书评

推荐现代心理与教育统计学的豆列

了解更多图书信息

豆瓣
免费下载 iOS / Android 版客户端