ctr预估简单的解释就是预测用户的点击item的概率。为什么一个回归的问题需要使用分类的方法来评估，这真是一个好问题，尝试从下面几个关键问题去回答。

　　1、ctr预估是特殊的回归问题

　　ctr预估的目标函数为

　　　　　　　　　　　　　　　　　　　　　　　　f(x)=P(+1|x)

　　特殊之处在于目标函数的值域为[0,1]，而且由于是条件概率，具有如下特性

　　如果将ctr预估按照一般的回归问题处理（如使用Linear Regression），面临的问题是一般的linear regression的值域范围是实数域，对于整个实数域的敏感程度是相同的，所以直接使用一般的linear regression来建立ctr预估模型很容易受到noise的影响。以Andrew Ng课程中的例子图1.b所示，增加一个噪音点后，拟合的直线马上偏移。另外，由于目标函数是条件概率，训练样本中会存在特征x完全相同，y为+1和-1的样本都出现的问题，在linear regression看来是一个矛盾的问题，而Logistics Regression很好的解决了这个问题[1]。

　　2、LR模型的cost function不使用平方差

　　一般回归问题采用的cost function是预测值和实际值的平方差，而LR模型无法采用平方差作为cost function的原因是由于基于LR模型公式的平方差函数是非凸函数，无法方便的获得全局最优解。

　　LR模型采用的cost function是采用cross-entropy error function（也有叫做对数似然函数的），error measure是模型假设h产生训练样本D的可能性（likelihood）[2]。

　　假设y1=+1, y2=-1, ......., yn=-1，对应的likelihood为：

　　3、为什么AUC也可以用于LR模型的评估

　　普遍上对于AUC的认识是在分类问题中，取不同的threshold后，在横坐标false positive rate，纵坐标为true positive rate平面上绘制ROC曲线的曲线下面积，所以很难理解是如何与这里的回归问题联系起来。实际上，一个关于AUC的很有趣的性质是：它和Wilcoxon-Mann-Witney Test是等价的[3]。而Wilcoxon-Mann-Witney Test就是测试任意给一个正类样本和一个负类样本，正类样本的score有多大的概率大于负类样本的score。有了这个定义，我们就得到了另外一种计算AUC的方法：具体来说就算统计一下所有M*N（M为正类样本的数目，N为负类样本的数目）个正负样本对中，有多少个组中的正样本的score大于负样本的score。

　　参考文献

　　[1]逻辑回归模型(Logistic Regression, LR)基础。 http://www.cnblogs.com/sparkwen/p/3441197.html

　　[2] Machine Learning Foundation, Coursera.

　　[3]AUC(Area Under roc Curve )计算及其与ROC的关系 http://www.cnblogs.com/guolei/archive/2013/05/23/3095747.html

　　原文连接：

　　https://www.evernote.com/shard/s66/sh/8f1d15c8-48b6-4b34-a4bc-89a60c09d724/a3bbdc80ade0c94b014910321eb4a10c#

为什么CTR预估使用AUC来评估模型？的更多相关文章

计算广告CTR预估系列(七)--Facebook经典模型LR+GBDT理论与实践
计算广告CTR预估系列(七)--Facebook经典模型LR+GBDT理论与实践 2018年06月13日 16:38:11 轻春阅读数 6004更多分类专栏: 机器学习机器学习荐货情报局版 ...
Spark Mllib里决策树二元分类使用.areaUnderROC方法计算出以AUC来评估模型的准确率和决策树多元分类使用.precision方法以precision来评估模型的准确率（图文详解）
不多说,直接上干货! Spark Mllib里决策树二元分类使用.areaUnderROC方法计算出以AUC来评估模型的准确率具体,见 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的 ...
召回率、AUC、ROC模型评估指标精要
混淆矩阵精准率/查准率,presicion 预测为正的样本中实际为正的概率召回率/查全率,recall 实际为正的样本中被预测为正的概率 TPR F1分数,同时考虑查准率和查全率,二者达到平衡,= ...
Kaggle ： Display Advertising Challenge( ctr 预估 )
原文:http://blog.csdn.net/hero_fantao/article/details/42747281 Display Advertising Challenge --------- ...
广告点击率 CTR预估中GBDT与LR融合方案
http://www.cbdio.com/BigData/2015-08/27/content_3750170.htm 1.背景 CTR预估,广告点击率(Click-Through Rate Pred ...
CTR预估中GBDT与LR融合方案(转载)
1.背景 CTR预估,广告点击率(Click-Through Rate Prediction)是互联网计算广告中的关键环节,预估准确性直接影响公司广告收入.CTR预估中用的最多的模型是LR(Logis ...
CTR预估中GBDT与LR融合方案
1. 背景 CTR预估(Click-Through Rate Prediction)是互联网计算广告中的关键环节,预估准确性直接影响公司广告收入.CTR预估中用的最多的模型是LR(Logistic R ...
Spark Mllib里决策树回归分析使用.rootMeanSquaredError方法计算出以RMSE来评估模型的准确率（图文详解）
不多说,直接上干货! Spark Mllib里决策树二元分类使用.areaUnderROC方法计算出以AUC来评估模型的准确率和决策树多元分类使用.precision方法以precision来评估模型 ...
CTR预估之LR与GBDT融合
转载自:http://www.cbdio.com/BigData/2015-08/27/content_3750170.htm 1.背景 CTR预估,广告点击率(Click-Through Rate ...

随机推荐

负载均衡算法WRR介绍
一.负载均衡负载均衡是一个很大的概念,既有从硬件层面来解决问题的,又有从软件层面解决的,有关负载均衡的介绍,推荐阅读: http://os.51cto.com/art/201108/285359.h ...
linux下c语言实现简单----线程池
这两天刚好看完linux&c这本书的进程线程部分,学长建议可以用c语言实现一个简单的线程池,也是对线程知识的一个回顾与应用.线程的优点有好多,它是"轻量级的进程",所需资源 ...
k8s入坑之路（11）kubernetes服务发现
kubernetes访问场景 1.集群内部访问 2.集群内部访问外部 3.集群外部访问内部 1.集群内部访问 1.pod之间直接ip通讯(利用calico通过路由表经过三层将ip流量转发)由于容器之间 ...
【java+selenium3】多窗口window切换及句柄handle获取(四)
一 .页面准备 1.html <html> <head> <title>主页面 1</title> </head> <body> ...
elementUI合并表格span-method用法
官方文档参考链接一参考链接二
linux下go环境配置
环境申明: centos 7.4 1.go下载最新的版本(linux) 下载本地后rz到服务器,然后tar -zxvf go1.9.2.linux-amd64.tar.gz 解压出go文件放在 ...
大一C语言学习笔记（6）---自省篇--流程控制；break，continue，return间的异同；数组应用到循环语句中需要注意的问题；++i 和 i++的异同等。
下面是傻瓜博主"曾经"犯过的错和一些心得: ༼ つ ◕_◕ ༽つ 1.要想流程控制学好,一定要学会化繁为简,举栗子: 三目运算符 (略?略:略)---就是一个数字嘛, ...
SVD专题1 算子的奇异值分解——矩阵形式的推导
目录 SVD专题1 算子的奇异值分解--矩阵形式的推导前言 Preface 几点说明预备知识 Prerequisite 1.1 极分解 Polar Decomposition 1.2 等距同构 U ...
inline-block布局VS浮动布局
a.不同之处:对元素设置display:inline-block ,元素不会脱离文本流,而float就会使得元素脱离文本流,且还有父元素高度坍塌的效果 b.相同之处:能在某程度上达到一 ...
java解析Excel日期格式转换问题
Excel上传导入,Excel里面单元格是日期的会解析出来数字,比如2020-07-11会解析为44023解决方法一: Excel单元格格式设置为文本格式.解决方法二: 使用代码处理,把解析出来的44 ...

为什么CTR预估使用AUC来评估模型？

1、ctr预估是特殊的回归问题

2、LR模型的cost function不使用平方差

3、为什么AUC也可以用于LR模型的评估

参考文献

原文连接：

为什么CTR预估使用AUC来评估模型？的更多相关文章

随机推荐

热门专题

　　1、ctr预估是特殊的回归问题

　　2、LR模型的cost function不使用平方差

　　3、为什么AUC也可以用于LR模型的评估

　　参考文献

　　原文连接：