推荐系统实践 8.1分
读书笔记 4
老中医

3. 实际在线系统使用UserCF的例子 相比我们后面要讨论的基于物品的协同过滤算法(ItemCF), UserCF在目前的实际应用中使用并不多。其中最著名的使用者是Digg,它在2008年对推荐系统进行了新的尝试②。Digg使用推荐系统的原因也是信息过载,它的研究人员经过统计发现,每天大概会有15 000篇新的文章,而每个用户的精力是有限的,而且兴趣差别很大。因此Digg觉得应该通过推荐系统帮用户从这么多篇文章中找到真正令他们感兴趣的内容,同时使每篇文章都有机会被展示给用户。

② 参见Digg的官方博客http://about.digg.com/blog/digg-recommendation-engine-updates,关于Digg的推荐算法的详细设计参见http://vimeo.com/1242909?pg=embed&sec=1242909处的访谈。 Digg的推荐系统设计思路如下。用户在Digg中主要通过“顶”和“踩”(如2-8所示,最左侧的两个手形按钮就是“顶”和“踩”的按钮)两种行为表达自己对文章的看法。当用户顶了一篇文章,Digg就认为该用户对这篇文章有兴趣,而且愿意把这篇文章推荐给其他用户。然后,Digg找到所有在该用户顶文章之前也顶了这一篇文章的其他用户,然后给他推荐那些人最近顶的其他文章。从这里的简单描述可以看到,Digg

模型加权融合基于物品的协同过滤(item-based collaborative filtering)算法是目前业界应用最多的算法。无论是亚马逊网,还是Netflix、Hulu、YouTube,其推荐算法的基础都是该算法。本节将从基础的算法开始介绍,然后提出算法的改进方法,并通过实际数据集评测该算法。

基于物品的协同过滤算法主要分为两步。 计算物品之间的相似度。 根据物品的相似度和用户的历史行为给用户生成推荐列表。

0
《推荐系统实践》的全部笔记 119篇
豆瓣
免费下载 iOS / Android 版客户端