音韵研究 音韵研究 8.7分

《北宋中原韵辙考》数学笔记

Kahaani
2018-03-25 20:57:46

页205:

反切可看做是一种最严格的「押韵」。

因此,音韵学的两大材料:反切和押韵,在统计方法上有相通之处。尤其是,该文使用「韵次」的概念,形式上和反切系联相似。

将统计方法应用于音韵学,可以分为三个层次:(页192) (1)算术统计:最早为白涤洲(1931)。 (2)古典概率:陆志韦(1939)的「几遇数公式」。以上都是研究反切的。 (3)数理统计:该文(1982/1989),用 t 检验研究宋词押韵。按:同时期还有白一平(1985)用 χ² 检验(卡方检验)研究诗经押韵。

后来麦耘(2005)和冯蒸(2010)的总结,都采纳了这个三分法。

从数学的角度,三个层次的具体方法是: (1)算术统计:朴素的「算比例」。 (2)古典概率:排列组合。 (3)数理统计:假设检验。

该文基于宋词做了两件事: (1)分辙。 (2)辙内分韵。(主要)

分辙的方法: (1)使用「分辙公式」计算离合指数。 (2)不使用假设检验。

分韵的方法: (1)使用「分韵公式」计算离合指数。 (2)如果离合指数不大不小(介于50到90之间),使用 t 检验。

「分辙公式」和「分韵公式」仍属于古典概率,只有分韵的第二步才算

...
显示全文

页205:

反切可看做是一种最严格的「押韵」。

因此,音韵学的两大材料:反切和押韵,在统计方法上有相通之处。尤其是,该文使用「韵次」的概念,形式上和反切系联相似。

将统计方法应用于音韵学,可以分为三个层次:(页192) (1)算术统计:最早为白涤洲(1931)。 (2)古典概率:陆志韦(1939)的「几遇数公式」。以上都是研究反切的。 (3)数理统计:该文(1982/1989),用 t 检验研究宋词押韵。按:同时期还有白一平(1985)用 χ² 检验(卡方检验)研究诗经押韵。

后来麦耘(2005)和冯蒸(2010)的总结,都采纳了这个三分法。

从数学的角度,三个层次的具体方法是: (1)算术统计:朴素的「算比例」。 (2)古典概率:排列组合。 (3)数理统计:假设检验。

该文基于宋词做了两件事: (1)分辙。 (2)辙内分韵。(主要)

分辙的方法: (1)使用「分辙公式」计算离合指数。 (2)不使用假设检验。

分韵的方法: (1)使用「分韵公式」计算离合指数。 (2)如果离合指数不大不小(介于50到90之间),使用 t 检验。

「分辙公式」和「分韵公式」仍属于古典概率,只有分韵的第二步才算是数理统计。

分辙公式(页230~231)其实就是陆志韦的「几遇数公式」。「几遇数公式」可以由排列组合推导出来。

分韵公式(页228~229)看起来也很像「几遇数公式」。区别在于: (1)分辙公式的总数 Z > Zj+Zk,即包括考察对象(J 辙和 K 辙)之外的其他辙。 分韵公式采用 Za+Zb 作为总数,不包括考察对象(A 韵和 B 韵)之外的其他韵(如果辙内多于三个韵)。 (2)分辙公式中,Z = 2Y。 分韵公式中,Za+Zb 不一定是 Yaa+Ybb+Yab 的两倍(如果 A 韵或 B 韵和其他韵互押)。

所以问题是: (1)分韵和分辙在形式上并无区别,为什么分韵要采用另一个公式? 页207有一段简单的解释,但很不具体。 (2)分韵公式的数学依据是什么? 页236~237的比喻很形象,但不准确。摸出红红、绿绿、红绿的概率分别是 25/99, 25/99, 49/99,而非 1/4, 1/4, 1/2。而且没有说明,如果袋子里有第三种颜色的球,应该如何计算。

再说说该文的 t 检验。

页231~235以「阳江是否合韵」演示了计算过程。文中没有使用 P 值,为了方便下面的比较,这里求出 P = 0.0520,含义是:拒绝 H₀(阳江合韵)的最小显著性水平是 0.0520。这个值比文中采用的显著性水平 0.05 只大了一点点,也就是页235所说的「t 比 t₋ₐ(n-1) 大得有限」。

页233:

把宕辙全部统计材料任意分为大致均匀的16组(多两组少两组没关系,Z 大就多分两组,Z 小就少分两组)。

分组是为了做 t 检验。之所以分成14~18组,大概是一种折衷: (1)分组数量越多,结论把握越大。 (2)但是材料数量有限,不能分成太多组。

但问题是:

(1)分组后是否服从和总体一样的分布?每一组是否要重新计算标准比值 μ₀?

(2)分组数量是否影响结果? 试着将页234的数据两两合并成8组:[1,2],[3,4],[5,6],[7,8],[9,10],[11,12],[13,14],[15,16],求出来 P = 0.0766 合并成4组:[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16],P = 0.1387 合并成2组:[1,2,3,4,5,6,7,8],[9,10,11,12,13,14,15,16],P = 0.2337

(3)随机分组是否影响结果? 试着换几种方式合并成8组: [1,3],[2,4],[5,7],[6,8],[9,11],[10,12],[13,15],[14,16],P = 0.1337 [1,5],[2,6],[3,7],[4,8],[9,13],[10,14],[11,15],[12,16],P = 0.1172 [1,9],[2,10],[3,11],[4,12],[5,13],[6,14],[7,15],[8,16],P = 0.0655

(4)以江唐、江阳两列为例,每一组的数量很小,很多组甚至是0,是否影响统计的效力?

麦耘(2002)也提及后两点。

白一平(1985)研究诗经押韵,也是相似的流程: (1)提出和「韵次」等价的概念。 (2)提出和「几遇数公式」类似的公式。(古典概率) (3)使用 χ² 检验。(数理统计)

关于题目: 1982年硕士论文的原题是《证北宋豫鲁地区十八辙三十四组》,大概是效仿陆志韦的《证广韵五十一声类》。 1989年出版改为《北宋中原韵辙考》,则似研究宋代用韵的前贤之作:周祖谟《宋代汴洛语音考》,鲁国尧《宋代辛弃疾等山东词人用韵考》、《宋代苏轼等四川词人用韵考》。

上面提到的文献:(前几篇没能读到) 白涤洲,1931,广韵声纽韵类之统计 陆志韦,1939,证广韵五十一声类 白一平,1985,汉语上古音的*-u和*-iw在诗经中的反映(冯蒸译,1997) 麦耘,2002,用卡方计算分析隋代押韵材料 麦耘,2005,汉语历史音韵研究中的一些方法问题 冯蒸,2010,二十世纪汉语历史音韵研究的一百项新发现与新进展

0
0

查看更多豆瓣高分好书

回应(0)

添加回应

推荐音韵研究的豆列

了解更多图书信息

豆瓣
免费下载 iOS / Android 版客户端