MLR算法[Paper笔记]

介绍

MLR算法是alibaba在2012年提出并使用的广告点击率预估模型，2017年发表出来。

如下图，LR不能拟合非线性数据，MLR可以拟合非线性数据，因为划分-训练模式。

讨论，非线性拟合能力：

数据划分规则如下公式，特征分片数m=1时，退化为LR；上图MLR中m=4。m越大，模型的拟合能力越强，一般m=12。

基础知识

优化方法：

1）剃度下降：

大小：一阶导数，方向：导数负方向。由目标函数的泰勒一阶展开式求得

2）牛顿法：

大小：一阶导数，方向：－海信矩阵的逆。由目标函数的泰勒二阶展开式求

3）拟牛顿法(LBFGS)：牛顿方向通过约等替换，每个样本保存下面三个参数：delta x ，delta剃度和p：

增量替换，计算牛顿方向D

LBFGS方法通过一阶导数中值定理，避免了计算海信矩阵（复杂度太大）。但是L1范数不能求导，所以需要OWLQN方法。

4）OWLQN：

(1)次梯度定义如下，

(2)不可导点取左or右次梯度，如下

直观解释，当你打算用左偏导时，说明是在负象限，因此要加上一个负值，使得更新之后参数更往负象限前进，这样就避免了跨象限；当打算用右偏导数时，说明在正象限，一次要加上一个正值，使得更新之后参数更往正象限前进，从而避免跨象限；否则，只能直接设置subgradient为0。

(3)象限搜索line search：

x不在0点时，line search在x_i所在象限搜索；如果模型参数在0点，就要在(2)次梯度约束的象限内进行line search.

MLR算法

算法公式如下：

0计算边界下降方向d：

1计算梯度大小：theta在0处不可导，取sign符号函数dij。

2计算最终下降方向p：

3象限内梯度下降，同OWLQN，line search：

paper介绍，MLR与LBFGS有三点不同：

1）OWLQN需要计算次梯度，MLR需要计算方向导数；

2）计算最终下降方向p时，MLR也要进行象限约束；

3）象限搜索line search，与OWLQN相似。

分布式框架实现

分布式

User特征共享

个人理解是为了加快运算速度，具体特征划分如下所示。其中，c是用户特征，nc是非用户特征。

实验结果

实验截图略，具体图表可以查看参考paper

纵坐标是内存使用率，特征共享技巧使速度提高了三倍。

参考paper：Learning Piece-wise Linear Models from Large Scale Data for Ad Click Prediction

MLR算法[Paper笔记]的更多相关文章

读paper笔记[Learning to rank]
读paper笔记[Learning to rank] by Jiawang 选读paper: [1] Ranking by calibrated AdaBoost, R. Busa-Fekete, B ...
C / C++算法学习笔记（8）－SHELL排序
原始地址:C / C++算法学习笔记(8)-SHELL排序基本思想先取一个小于n的整数d1作为第一个增量(gap),把文件的全部记录分成d1个组.所有距离为dl的倍数的记录放在同一个组中.先在各组 ...
Manacher算法学习笔记 | LeetCode#5
Manacher算法学习笔记 DECLARATION 引用来源:https://www.cnblogs.com/grandyang/p/4475985.html CONTENT 用途:寻找一个字符串的 ...
《Algorithms算法》笔记：元素排序(4)——凸包问题
<Algorithms算法>笔记:元素排序(4)——凸包问题 Algorithms算法笔记元素排序4凸包问题凸包问题凸包问题的应用凸包的几何性质 Graham 扫描算法代码凸包问 ...
《Algorithms算法》笔记：元素排序(3)——洗牌算法
<Algorithms算法>笔记:元素排序(3)——洗牌算法 Algorithms算法笔记元素排序3洗牌算法洗牌算法排序洗牌 Knuth洗牌 Knuth洗牌代码洗牌算法洗牌的思想很 ...
《Algorithm算法》笔记：元素排序(2)——希尔排序
<Algorithm算法>笔记:元素排序(2)——希尔排序 Algorithm算法笔记元素排序2希尔排序希尔排序思想为什么是插入排序 h的确定方法希尔排序的特点代码有关排序的介绍 ...
MIT算法导论笔记
详细MIT算法导论笔记 (网络链接) 第一讲:课程简介及算法分析 (Sheridan) 第二讲:渐近符号.递归及解法 (Sheridan) 第三讲:分治法(1)(Sheridan) 第四讲:快排及随 ...
Johnson算法学习笔记
\(Johnson\)算法学习笔记. 在最短路的学习中,我们曾学习了三种最短路的算法,\(Bellman-Ford\)算法及其队列优化\(SPFA\)算法,\(Dijkstra\)算法.这些算法可以快 ...
某科学的PID算法学习笔记
最近,在某社团的要求下,自学了PID算法.学完后,深切地感受到PID算法之强大.PID算法应用广泛,比如加热器.平衡车.无人机等等,是自动控制理论中比较容易理解但十分重要的算法. 下面是博主学习过程中 ...

随机推荐

vue.js快速搭建图书管理平台
前言上一期简单讲解了vue的基本语法,这一次我们做一个小项目,搭建一个简单的图书管理平台,能够让我们更深刻的理解这门语言的妙用. 1.DEMO样式首先我们需要搭建一个简单的demo样式 ...
LeetCode 628. Maximum Product of Three Numbers （最大三数乘积）
Given an integer array, find three numbers whose product is maximum and output the maximum product. ...
maven中jetty插件配置
maven中jetty插件的配置,可用于项目在内置jetty服务器中的部署. <plugin> <groupId>org.mortbay.jetty</groupId&g ...
WPF获得全局窗体句柄,并响应全局键盘事件
场景 wpf窗体运行后,只能捕获当前Active窗体的按键事件,如果要监听windows全局事件,并对当前窗口事件响应. 第一步:导入Winows API public class Win32 { [ ...
Java微信公众平台开发_02_启用服务器配置
源码将在晚上上传到 github 一.准备阶段需要准备事项: 1.一个能在公网上访问的项目: 见:[ Java微信公众平台开发_01_本地服务器映射外网 ] 2.一个微信公众平台账号: 去注册: ...
编程&blog处女篇-用C#求100以内的质数
using System;namespace Loops{ class Program { static void Main(string[] args) { /*局部变量定义*/ int i, j; ...
Angular5.0.0新特性
文章来自官网部分翻译https://blog.angular.io/version-5-0-0-of-angular-now-available-37e414935ced Angular5.0.0版本 ...
【前端】跨浏览器事件处理程序EventUtil.js个人注释及详解
<javascript高级程序设计>跨浏览器事件处理程序EventUtil.js个人注释 EventUtil.js // 跨浏览器事件处理程序封装 var EventUtil = { // ...
NHibernate Criteria中 Restriction与Expression的差别
http://stackoverflow.com/questions/5483393/nhibernate-criteria-restriction-vs-expression 据说是Restrict ...
一款特好用的JavaScript框架——JQuery
了解了解 jQuery是一个快速,小巧,功能丰富的JavaScript库.它使诸如HTML文档遍历和操纵,事件处理,动画和Ajax等事情变得简单得多,而且易于 ...

MLR算法[Paper笔记]

MLR算法[Paper笔记]的更多相关文章

随机推荐

热门专题