click through rate prediction

包括内容如下图：

使用直接估计法，置信区间置信率的估计：

1.使用二项分布直接估计

$p(0.04<\hat{p}<0.06) = \sum_{0.04n\leq k \leq 0.06n}{n \choose k}0.05^{k}0.95^{n-k}$

low=ceil(n*0.04);%上取整

high=floor(n*0.06);%下取整

prob = 0;

for i=low:1:high

    prob = prob+nchoosek(n,i)*(0.05^i)*(0.95^(n-i));

end

2.使用正态分布近似

$\mu = p = 0.05,\sigma^2 = \frac{p(1-p)}{n} = \frac{0.05*0.95}{n}$

normcdf(0.06,0.05,sigma/x(i)^0.5) - normcdf(0.04,0.05,sigma/x(i)^0.5)

warning off all;

clear all;clc;close all;

x=500:1:1500;

y = zeros(1,size(x,2));

y2 = zeros(1,size(x,2));

sigma = sqrt(0.05*0.95);

for i =1:size(x,2)

    y(i) = adPredict(x(i));

    y2(i) = normcdf(0.06,0.05,sigma/x(i)^0.5) - normcdf(0.04,0.05,sigma/x(i)^0.5);

end

plot(x,y,'b-'); hold on;

plot(x,y2,'r-');

hold on;

x1=[500 1500];

y1=[0.85 0.85];

plot(x1,y1,'y-');

打印曲线：观测到，n=1000，差不多置信度会到达0.85

AUC概念及计算：

sklearn代码：sklearn中有现成方法，计算一组TPR,FPR，然后plot就可以；AUC也可以直接调用方法。

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import LogisticRegression

from sklearn import datasets

from sklearn.preprocessing import StandardScaler

from sklearn.metrics import roc_auc_score

from sklearn.metrics import roc_curve

digits = datasets.load_digits()

X, y = digits.data, digits.target

X = StandardScaler().fit_transform(X)

# classify small against large digits

y = (y > 4).astype(np.int)

X_train = X[:-400]

y_train = y[:-400]

X_test = X[-400:]

y_test = y[-400:]

lrg = LogisticRegression(penalty='l1')

lrg.fit(X_train, y_train)

y_test_prob=lrg.predict_proba(X_test)

P = np.where(y_test==1)[0].shape[0];

N  = np.where(y_test==0)[0].shape[0];

dt = 10001

TPR = np.zeros((dt,1))

FPR = np.zeros((dt,1))

for i in range(dt):

    y_test_p = y_test_prob[:,1]>=i*(1.0/(dt-1))

    TP = np.where((y_test==1)&(y_test_p==True))[0].shape[0];

    FN = P-TP;

    FP = np.where((y_test==0)&(y_test_p==True))[0].shape[0];

    TN = N - FP;

    TPR[i]=TP*1.0/P

    FPR[i]=FP*1.0/N

plt.plot(FPR,TPR,color='black')

plt.plot(np.array([[0],[1]]),np.array([[0],[1]]),color='red')

plt.show()

#use sklearn method

# fpr, tpr, thresholds = roc_curve(y_test,y_test_prob[:,1],pos_label=1)

# plt.plot(fpr,tpr,color='black')

# plt.plot(np.array([[0],[1]]),np.array([[0],[1]]),color='red')

# plt.show()

rank = y_test_prob[:,1].argsort()

rank = rank.argsort()+1

auc = (sum(rank[np.where(y_test==1)[0]])-(P*1.0*(P+1)/2))/(P*N);

print auc

print roc_auc_score(y_test, y_test_prob[:,1])

click through rate prediction的更多相关文章

微软的一篇ctr预估的论文：Web-Scale Bayesian Click-Through Rate Prediction for Sponsored Search Advertising in Microsoft’s Bing Search Engine。
周末看了一下这篇论文,觉得挺难的,后来想想是ICML的论文,也就明白为什么了. 先简单记录下来,以后会继续添加内容. 主要参考了论文Web-Scale Bayesian Click-Through R ...
【论文笔记】用反事实推断方法缓解标题党内容对推荐系统的影响 Click can be Cheating: Counterfactual Recommendation for Mitigating Clickbait Issue
Click can be Cheating: Counterfactual Recommendation for Mitigating Clickbait Issue Authors: 王文杰,冯福利 ...
【点击模型学习笔记】Predicting Clicks_Estimating the Click-Through Rate for New Ads_MS_www2007
概要: 微软研究院的人写的文章,提出用逻辑回归来解决ctr预估问题,是以后ctr的经典解决方式,经典文章. 详细内容: 名词: CPC -- cost per click CTR -- click t ...
python命令行神器Click
原文: http://www.lengirl.com/code/python-click.html Click 是用Python写的一个第三方模块,用于快速创建命令行.我们知道,Python内置了一个 ...
Bayesian CTR Prediction for Bing
Microsoft published a paper in ICML 2009 named ‘Web-Scale Bayesian Click-Through Rate Prediction for ...
【python】命令行神器 Click 简明笔记
全文拷贝自命令行神器 Click 简明笔记 Click Click 是用 Python 写的一个第三方模块,用于快速创建命令行.我们知道,Python 内置了一个 Argparse 的标准库用于创建 ...
命令行神器 Click 简明笔记
Click 是用 Python 写的一个第三方模块,用于快速创建命令行.我们知道,Python 内置了一个 Argparse 的标准库用于创建命令行,但使用起来有些繁琐,Click 相比于 Argpa ...
Andrew 机器学习课程笔记
Andrew 机器学习课程笔记完成 Andrew 的课程结束至今已有一段时间,课程介绍深入浅出,很好的解释了模型的基本原理以及应用.在我看来这是个很好的入门视频,他老人家现在又出了一门 deep l ...
主流CTR预估模型的演化及对比
https://zhuanlan.zhihu.com/p/35465875 学习和预测用户的反馈对于个性化推荐.信息检索和在线广告等领域都有着极其重要的作用.在这些领域,用户的反馈行为包括点击.收藏. ...

随机推荐

Unicode与汉字
当遇到\u7f3a\u5c11 这样形式的字符串时,其实它代表的是汉字具体的网上可以进行Unicode转中文翻译
利用Azure Automation实现云端自动化运维(4)
在上述基本准备工作做完后,wo们看看如何实现利用Azure Automation实现定时自动开关机的操作,这种场景非常适合Dev/Test环境,因为Azure的虚拟机是按照分钟收费的,所以我们可以在开 ...
PHP中的错误处理
程序只要在运行,就免不了会出现错误!或早或晚,只是时间问题罢了. 错误很常见,比如Notice,Warning等等.此时一般使用set_error_handler来处理: <?php set_e ...
Windows消息拦截技术的应用（作者博客里有许多相关文章）
民航合肥空管中心周毅一.前言众所周知,Windows程式的运行是依靠发生的事件来驱动.换句话说,程式不断等待一个消息的发生,然后对这个消息的类型进行判断,再做适当的处理.处理完此次消息后又回到 ...
Java 并发专题：FutureTask 实现预加载数据在线看电子书、浏览器浏览网页等
继续并发专题~ FutureTask 有点类似Runnable,都可以通过Thread来启动,不过FutureTask可以返回执行完毕的数据,并且FutureTask的get方法支持阻塞. 由于:Fu ...
mysql 匹配update
update 语句示例: UPDATE `zjzc`.`QRTZ_SCHEDuler_state` SET `ip`='220.191.34.246' WHERE `sn`='3117764' and ...
rails跑通第一个demo
rails -h 查看帮助 Usage: rails new APP_PATH [options] Options: -r, [--ruby=PATH] # Path to the Ruby bina ...
CSS美化页面滚动条
文章来自:http://www.webhek.com/scrollbar 本文将会告诉你如何用CSS修改/美化浏览器页面上出现的滚动条.改变它们的颜色,调整它们的外形,适配你对页面UI设计.我们首先将 ...
Poj 1269 Intersecting Lines_几何模板
#include <iostream> #include <math.h> #include <iomanip> #define eps 1e-8 #define ...
【LeetCode练习题】Multiply Strings
Multiply Strings Given two numbers represented as strings, return multiplication of the numbers as a ...

click through rate prediction

click through rate prediction的更多相关文章

随机推荐

热门专题