小白醉
豆瓣最近十年高分热剧百佳,按照 豆瓣评分 和 评分人数 的 加权平均分 进行排名。
评语数据:豆瓣评分R,评分人数v,加权平均分WR
加权平均分(WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C
在这里:
R = 该电影的豆瓣评分
v = 该电影的评分人数
m = 列入榜单所需要的最少评分人数
C = 数据库中所有电影的总平均分
最少评分人数m值设为20000,m值的选取参考了二八定律(又名80/20定律、帕累托法则(Pareto‘s principle),二八定律是19世纪末20世纪初意大利经济学家帕累托发现的。他认为,在任何一组东西中,最重要的只占其中一小部分,约20%,其余80%尽管是多数,却是次要的),优秀的作品往往占的是少数,本榜单容量是100部,所以选取的是评分人数在前500名左右的作品作为基础优选范围,最少评分人数m值就是用来设定这个大致范围的;
C值取7.0,C=SUMPRODUCT(R,v)/SUM(v),根据2010年代274部评分人数超过10000的中国大陆剧的豆瓣评分与评分人数的乘积之和除以评分总人次所得为7.027。因为大陆剧是国人能从烂剧到精品剧全范围接触到的,所以以之为简化版统计基准。此处所得C值的含义是评分者每次评分的平均值,也就是说,此处所得的7.0分即是大众认可的平均线。
算法参考:https://www.douban.c
系列剧一般只取在榜单时间范围内加权平均分排名最高的一部。
我的TOP100系列
豆瓣动画电影TOP100 https://www.douban.c
豆瓣动画剧集TOP100 https://www.douban.c
豆瓣电视剧TOP100 https://www.douban.c
豆瓣电视剧TOP100 (2010-2020) https://www.douban.c
豆瓣电视剧TOP100 (中日韩2010-2020) https://www.douban.c