Machine Learning in Action 8.5分
读书笔记 第四章
传统保守拉拉桑

1.朴素贝叶斯 是贝叶斯决策理论 的一小部分。 贝叶斯决策理论 就是学出概率最高的事件。 朴素是naive翻译过来的,感觉不是很恰当。之所以naive是因为做了一个,随机变量都是独立的一个假设。 书上拿一段讲了一下条件概率,昨晚上看了 《思考的乐趣》,第一节就是说条件概率教你说谎,当时觉得真心好牛啊~~~概率这种虚的东西,用到现实生活中,将很多事情抽象成“事件”~数学真的很有趣~(*^__^*) 2.若需要N个样本确定一个属性,那需要N的10次方个样本确定10个属性。。需要N的n次方个样本确定n个属性。若各个属性之间相互独立,样本可以减少到N*n个。 3.ln(a*b) = ln(a)+ln(b). Doing this allows us to avoid the underflow or round-off error problem. 这一章,书上举了三个例子: 1.automatic document classification 这个例子是说明算法的。 1)把所有的posting里面的单词进行统计,放入vocabList中。 2)然后针对每个posting产生一个Vec,再对所有的posting产生一个trainMat 3)计算概率p0Vect,p1Vect,pAbusive。根据公式pAbusive是P(C1),1-pAbusive是P(C0),p0Vect和p1Vect是P(w|C0)和P(w|C1) 4)在计算P(w|Ci)*P(Ci)时,使用ln(a*b)=ln(a)+ln(b),这样消除了数值太小可能被变成0的问题。 那个p1 = sum(vec2Classify*p1Vec)+log(pClass1)让我想了老半天,是因为trainNB0两个地方需要改。 5)算出来p0和p1,那个大就属于哪个类。 剩下的两个例子是用于测试trainNB0的~ 2.spam email 主要陈述了一些文本解析的问题。如何从文本中去除一些标点,空格,链接等。 3.reveal local attitude from personal ads 要求我装了一个feedparser

3
《Machine Learning in Action》的全部笔记 37篇
豆瓣
免费下载 iOS / Android 版客户端