背景:stanford的计算广告学(computational advertising)课程,yahoo的人主讲,课程链接:http://www.stanford.edu/class/msande239/#lecture-handouts,这个ppt使其中的一讲,93页

主要内容:

1. Display ad targeting:

    相比于搜索广告来讲,搜索体现了明显的意图,显示广告,用户只有浏览行为,而浏览行为体现出的用户行为比起搜索行为差了好多,所以是“High entropy” of user intent。相比而言,显示广告的CRT和搜索广告相比也差了几个数量级。

    如何降低“high entropy"?利用搜索行为、利用用户交易行为(购买、放入购入车、添加关注等等)

   展示广告定向可以分解为三个相关联的任务:
(1)User profile generation: describe the user

(2)Audience selection: find the best audience for a given ad

(3)Performance prediction: find the best ad for a given impression (we have discussed this before) 

   对上面三个任务,细分来说:
(1)User profile generation:可以利用的信息(用户注册信息,活动——点击、浏览等,用户的社会关系——邮件组、好友等)。总之,user data --> intents and interests
(2)Audience selection: 与(1)相关联,但是目标不同,可以由不同的公司来做
  用户筛选与广告筛选是一个对偶问题。


2. 传统定向广告技术

传统的定向广告技术都是把人群进行分类,在此基础上将人群与广告类别建立起来联系,对特定人群投放特定的广告。

细分为如下几类技术:
(1)Demographic targeting ——人口统计学

(2)Geo targeting —— 地理位置信息

(3)Behavioral targeting —— 用户行为信息

(4)Retargeting —— 重定向广告

细分来详细说:

(1)Demographic targeting:网站的注册信息,年龄、性别、收入、位置、兴趣等等
这些信息有的是用户直接注册的,有些是需要推断的,方法是根据用户的行为,训练分类器,进行特定类别的分类;除了分类器外,还可以利用 网页——用户 之间的二部图、辅以一些降维技术(SVD)。

(2)Geo targeting:
这部分信息比较难获得,即便获得也不见得准确。获取方式:用户注册、用户ip、gps、用户浏览器或者操作系统的语言设置。在手机上LBS更有需求。

(3)Behavioral targeting:
基于用户历史行为的定向广告,历史性为包括:浏览、搜索、购买、广告点击等等

(4)Retargeting:
ppt上说的不是太详细,我理解是Retargeting的过程是:用户近期浏览行为(或者其他行为),抽取关键词,存放在用户cookie当中,当用户浏览网页有广告投放需求的时候,通过cookie中的关键词来决定投放什么广告

以下的内容,每一节介绍一篇yahoo发表的论文


3. Social targeting: the power of the graph

是指基于社交网络的定向广告。
社交网络能够利用量方面信息:1. 用户注册信息;2. 用户关系链

“The social graph can be used to smooth the data available” —— 作者认为社交关系链的作用之一,是对用户当前缺失注册信息的一种平滑,可以根据他的朋友是什么样的人来推断他是什么样的人

graph分几种:1. mail graph(邮件之间的关系);2. social graph
graph的用法:1. 分类(将graph特征加入到标准behavior targeting流程中);2. ensemble(结合behavior model和graph model);3. network propagation(随机游走的方式,推测网络中缺失的属性值)
实验表明:单独的用户行为特征在targeting中远好于单独的graph特征,不过两者结合的能取得最好的结果。

4. current trend in targeting

从基于用户群划分的模型逐渐转向基于模型的、更加精准的个性化推荐


5. User profile generation: interests and intents 
     ——Working with high entropy of intent

讨论了人口属性中对定向广告的影响。
有一个观察:用户在买了某个大件商品之后,不再可能再买同样的东西了,此时投放广告是没用的

6. Generative language models for user profiles 

讲的是CIKM2011上的一篇文章。

形式化“Audience selection task”任务:给定一群种子用户,寻找和当前用户群相似的用户,类似信息检索。
种子用户的用户行为用event来表示,event序列用语言模型来建模

7. Learning BT categories from click data 

预测CRT的。用的回归。相关细节和公式可以参考原文。

8. Information-Theoretic User Profile Generation

9. 总结:直接copy&paste原文了
! -Targeting is a key step in differentiation of impressions and 

extracting value! 

!  -Traditional targeting: demo, geo, BT 

!  ---How to get the data from the user? 

!  ---Infer the data from historical activity 
!  One of the key step in targeting is user profile generation 
!  ---Generative models to assign probability of a sequence of events 
!  ---Weighting based on time, event type and content 
!  ---Predict the counts of events in certain categories 
!  ---Clustering and other unsupervised techniques useful – more to come in the next lecture


【targeting学习笔记】Display Advertising Targeting的更多相关文章

  1. CSS学习笔记

    CSS学习笔记 2016年12月15日整理 CSS基础 Chapter1 在console输入escape("宋体") ENTER 就会出现unicode编码 显示"%u ...

  2. Sass学习笔记之入门篇

    Sass又名SCSS,是CSS预处理器之一,,它能用来清晰地.结构化地描述文件样式,有着比普通 CSS 更加强大的功能. Sass 能够提供更简洁.更优雅的语法,同时提供多种功能来创建可维护和管理的样 ...

  3. Linux 学习笔记

    Linux学习笔记 请切换web视图查看,表格比较大,方法:视图>>web板式视图 博客园不能粘贴图片吗 http://wenku.baidu.com/view/bda1c3067fd53 ...

  4. CSS3与页面布局学习笔记(八)——浏览器兼容性问题与前端性能优化方案

    一.浏览器兼容 1.1.概要 世界上没有任何一个浏览器是一样的,同样的代码在不一样的浏览器上运行就存在兼容性问题.不同浏览器其内核亦不尽相同,相同内核的版本不同,相同版本的内核浏览器品牌不一样,各种运 ...

  5. 0028 Java学习笔记-面向对象-Lambda表达式

    匿名内部类与Lambda表达式示例 下面代码来源于:0027 Java学习笔记-面向对象-(非静态.静态.局部.匿名)内部类 package testpack; public class Test1{ ...

  6. 烤鸭的Source Insight学习笔记

    如果你觉得这网页排版不好看,可以去下载我上传的word版:<烤鸭的Source Insight学习笔记.doc> http://download.csdn.NET/detail/benka ...

  7. 【前端】移动端Web开发学习笔记【2】 & flex布局

    上一篇:移动端Web开发学习笔记[1] meta标签 width设置的是layout viewport 的宽度 initial-scale=1.0 自带 width=device-width 最佳实践 ...

  8. X-Cart 学习笔记(二)X-Cart框架1

    目录 X-Cart 学习笔记(一)了解和安装X-Cart X-Cart 学习笔记(二)X-Cart框架1 X-Cart 学习笔记(三)X-Cart框架2 X-Cart 学习笔记(四)常见操作 四.X- ...

  9. OpenGL学习笔记3——缓冲区对象

    在GL中特别提出了缓冲区对象这一概念,是针对提高绘图效率的一个手段.由于GL的架构是基于客户——服务器模型建立的,因此默认所有的绘图数据均是存储在本地客户端,通过GL内核渲染处理以后再将数据发往GPU ...

随机推荐

  1. mysql 更改密码

    Mac 安装mysql时会生成一个默认密码: 这个可以在通知中找到,如果你需要更改密码则继续看下面, 今天给mac安装了MySQL,安装过程非常的顺利,但是在用一个可视化工具进行连接时,需要输入密码, ...

  2. memcached内存分配机制

    memcached的内存分配没有用到c语言中自带的malloc函数,因为这个函数分配内存的时候效率很低,对于这种要求快速响应,对效率要求非常高的缓存软件来说非常不合适. memcached用的是自己的 ...

  3. keil5破解

    没有破解之前的keil只能编译限制大小的代码,72K好像我忘了?太长的话会报错. 注册机网址:http://bbs.armfly.com/read.php?tid=2346 1.在keil5左上角的F ...

  4. C# Graphics中有关绘图质量的几个Mode

    一.CompositingMode 获取一个值,该值指定如何将合成图像绘制到此 Graphics.复合模式确定从源映像的像素是覆盖(SourceCopy)还是组合(SourceOver, 需要使用半透 ...

  5. web.xml执行顺序

    出自:http://blog.csdn.net/u010833154/article/details/50697987 引言:启动java web程序的时候,java web会读取配置文件web.xm ...

  6. 管理Entity Framework中的树结构

    很多时候您需要在数据库中存储逻辑树的层次结构.这个问题有很多种实现方式,但最常见的是使用一个简单自关联的表,如下图所示 如果您映射此表与实体框架您将自动获得一个树状结构,您需将关系字段重命名,因为他们 ...

  7. 字符编码 ASCII,Unicode和UTF-8的关系

    转自:http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/00143166410626 ...

  8. 【原】Coursera—Andrew Ng机器学习—Week 9 习题—异常检测

    [1]异常检测 [2]高斯分布 [3]高斯分布 [4] 异常检测 [5]特征选择 [6] [7]多变量高斯分布 Answer: ACD B 错误.需要矩阵Σ可逆,则要求m>n  测验1 Answ ...

  9. c3p0、dbcp和proxool比较

    现在常用的开源数据连接池主要有c3p0.dbcp和proxool三种,其中: hibernate开发组推荐使用c3p0; spring开发组推荐使用dbcp(dbcp连接池有weblogic连接池同样 ...

  10. MySQL篇之Navicat可视化工具

    主要内容: Navicat工具的介绍和使用 1.介绍和下载安装 <1>介绍 Navicat是一款针对MySQL数据库开发的可视化管理工具,以图形界面的形式操作MySQL数据库. 但在生产环 ...