IMDb电影评分的计算方法是如何的?

我观看的电影很多都会先查看评分,这里就要说道IMDB了,首先介绍下IMDB是什么:互联网电影资料库(Internet Movie Database,简称IMDb)是一个关于电影演员、电影、电视节目、电视明星、电子游戏和电影制作的在线数据库。

计算方式在TOP 250的页面底部就有 http://www.imdb.com/chart/top?sort=ir,desc

The formula for calculating the Top Rated 250 Titles gives a true Bayesian estimate:

weighted rating (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C

Where:

  • R = average for the movie (mean) = (Rating)
  • v = number of votes for the movie = (votes)
  • m = minimum votes required to be listed in the Top 250 (currently 25000)
  • C = the mean vote across the whole report (currently 7.0)

For the Top 250, only votes from regular voters are considered.

其中:
R = average for the movie (mean) = (Rating) (是用普通的方法计算出的平均分)
v = number of votes for the movie = (votes) (投票人数,需要注意的是,只有经常投票者才会被计算在内,这个下面详细解释)
m = minimum votes required to be listed in the top 250 (currently 1250) (进入imdb top 250需要的最小票数,只有三两个人投票的电影就算得满分也没用的)
C = the mean vote across the whole report (currently 6.9) (目前所有电影的平均得分)

另外重点来了,根据这个注释:
note: for this top 250, only votes from regular voters are considered.
只有’regular voters’的投票才会被计算在IMDB top 250之内,这就是IMDB防御因为某种电影的fans拉票而影响top 250结果,把top 250尽量限制在资深影迷投票范围内的主要方法。regular voter的标准不详。

IMDB TOP 250的电影评分计算方法正是大名鼎鼎的贝叶斯统计算法。要想领悟这种算法的精妙之处,我们首先需要看一个例子:
电影A,十个人看过,全部评分均为10分;
电影B,十万个人看过,评分平均值为9.8分。
请问你愿意相信哪部电影更加优秀??贝叶斯算法的核心思想就是避免让电影A的最终得分会超过B。

此条目发表在生活分类目录,贴了标签。将固定链接加入收藏夹。

发表回复