推荐系统 TOP K 评价指标

符号说明
示例数据
一、Hit Rate
二、Recall
三、NDCG

符号说明

$top\_k$: 当前用户预测分最高的k个items，预测分由高到低排序

$pos$: 当前用户实际点击过的items

$N$: 测试用户数量

示例数据

N = 4

| len(top_k & pos) | len(pos) ｜预测中（四声）的item在top_k中的位置（1为预测中，长度为用户实际点击过的items长度）

| ---- | ---- | ---- ｜

| 1 | 2 | 1 0

| 2 | 3 | 0 1 1

| 3 | 4 | 1 0 1 1

| 0 | 3 | 0 0 0

一、Hit Rate

网上有2种定义方式，不知道哪个更为正确的，有知道的人能不能麻烦告诉我一下？

第一种

对所有用户：我们真正喜欢的物品中，你给我们推荐了多少

hit = 0

total = 0

for i in users:

  top_k = 获取top_k的代码

  hit += len(top_k & pos)

  total += len(pos)

hit_rate = hit / total

$hit\_rate = \frac{1 + 2 + 3 + 0}{2 + 3 + 4 + 5}$

第二种

被推荐到喜欢物品的用户占总用户的比例

hit = 0

for i in users:

  top_k = 获取top_k的代码

  if top_k中有预测到pos中的item:

    hit += 1

hit_rate = hit / N

$hit\_rate = \frac{1 + 1 + 1 + 0}{4}$

二、Recall

对某个用户：我真正喜欢的物品中，你给我推荐了多少

recall = 0

for i in users:

  top_k = xxx(i)

  recall += len(top_k & pos) / len(pos)  # 用户i的recall

recall = mean(recall)

$recall = (\frac{1}{2} + \frac{2}{3} + \frac{3}{4} + \frac{0}{3})\ /\ 4$

三、NDCG

对某个用户：实际的折扣累计收益 DCG (Discounted Cumulative Gain) / 理想的DCG

DCG：考虑位置因素，希望用户喜欢的物品在top_k中排得越前越好

iDCG：归一化，解决【不同用户的DCG求和项数不同，不能进行比较】的问题

NDCG = 0

for i in users:

  DCG = 0

  iDCG = 0

  top_k = xxx(i)

  for rank in range(k):

    if top_k[rank] in pos:

      DCG += 1 / log2(rank + 2)

  for i in range(min(k, len(pos))):

    iDCG += 1 / log2(i + 2)

  NDCG_u = DCG / iDCG

  NDCG += NDCG_u

NDCG = mean(NDCG)

随机推荐

不想业务被中断？快来解锁华为云RDS for MySQL新特性
摘要:新特性上线!华为云RDS for MySQL又添新技能,实力保障业务连续性. 本文分享自华为云社区<不想业务被中断?快来解锁华为云RDS for MySQL新特性>,作者:Gauss ...
用 Java 写一个单例类?
饿汉式单例 public class Singleton { private Singleton(){} private static Singleton instance = new Singlet ...
memcached 的多线程是什么？如何使用它们？
线程就是定律(threads rule)!在 Steven Grimm 和 Facebook 的努力下, memcached 1.2 及更高版本拥有了多线程模式.多线程模式允许 memcached 能 ...
java后台解决上传图片翻转90的问题，有demo，经过测试可用
1.需要加入依赖 metadata-extractor.jar 依赖如下 <dependencies> <!-- Extracts Exif, IPTC, XMP, ICC and ...
centos简单命令备忘
1.查看当前目录 [root@instance-aif30iaj bin]# df -h 2.查看指定目录在命令后直接放目录名,比如查看"usr"目录使用情况: [root@in ...
String工具类之“前缀比较”StringUtils.startsWith和StringUtils.startsWithIgnoreCase
(1)字符串以prefix为前缀(区分大小写) StringUtils.startsWith(被比较的字符串,比较字符串) 总结: 根据下面代码发现,上面的例子有部分时错误的,有可能是因为思维原因,他 ...
ubuntu+ROS安装turtulebot3
0 简介 Turtlebot是一种室内移动机器人,搭载激光传感器,使机器有精确的距离感知能力.通过搭建仿真环境,可以在没有硬件支持的情况下进行仿真和编程,并熟悉ros系统.环境使Ubuntu16.04 ...
USB与电池切换电路图
小程序web-view加载H5信息不全
满足小程序的web-view标签跳转网页形式配置小程序后台的web-view(业务域名) 可打开关联的公众号的文章通常实现逻辑页面加载的时候赋值于一个data对象的值,然后赋值到web-view ...
SQL之总结（二）
4.关于取两个日期之间的年份: ceil(MONTHS_BETWEEN(sysdate, c.sendtime)/12) workTime ceil(n) 取大于等于n的最小整数 floor(n) 取 ...