在线学习和在线凸优化（online learning and online convex optimization）

开启一个在线学习和在线凸优化框架专题学习：

1.首先介绍在线学习的相关概念

在线学习是在一系列连续的回合（rounds）中进行的；

在回合 $t$ ,学习机（learner）被给一个question： ${x_t}$ (一个向量，即为特征向量), ${x_t}$ 为从instance domain： $\chi$ 采样得到的。学习机给出一个预测值： ${p_t}$ ，然后得到正确的答案： ${y_t}$ ， ${y_t}$ 从target domain： ${\rm{Y}}$ 采样得到，定义损失函数为 $l({p_t},{y_t})$ 。在大多数情况下， ${p_t}$ 在 ${\rm{Y}}$ 中，但是，允许学习者从更大的集合中选择预测有时很方便，我们用D表示prediction domain。下图展示了在线学习框架：

2在线学习考虑的两个限制

第一个限制特别适合于在线分类的情况：

我们假设所有的answer都是由一些target mapping生成的: ${h^ * }:\chi \to Y$ ， ${h^ * }$ 取自固定集合，称为假设类，由H表示，这是学习者已知的。由于这种对序列的限制，我们称之为realizable case，学习者应该尽可能少犯错误，假设 ${h^ * }$ 和问题的顺序可以由对手来选择。对于在线学习算法A，我们用 ${M_A}\left( H \right)$ 表示A在一系列用 ${h^ * } \in H$ 标记的例子上可能犯的最大错误数。我们再次强调 ${h^ * }$ 和问题的顺序可以由对手来选择。 ${M_A}\left( H \right)$ 的上界称为mistake bound，我们将研究如何设计 ${M_A}\left( H \right)$ 最小的算法。

第二个限制是relaxation of the realizable assumption:

我们不再假设所有答案都是由 ${h^ * } \in H$ 产生，但是我们要求学习机与来自H最好的固定预测器竞争。这被算法的regret所捕获，regret度量了回顾过去，学习机有多“抱歉”没有遵循一些假设 ${h^ * } \in H$ 的预测。形式上，算法相对于 ${h^ * }$ 的regret当在一系列T实例上运行时定义为：

算法相对于假设类H的regret是：

　　学习机的目标是相对于H具有尽可能低的regret。我们有时会对“low regret”算法感到满意，我们认为与轮数T呈次线性增长，其意味着当T变为无穷大时，学习机的平均损失与H中最佳假设的平均损失之间的差异趋于零。

次线性增长： $\mathop {\lim }\limits_{T \to \infty } \frac{{{\mathop{\rm Re}\nolimits} gre{t_T}}}{T} = 0$

3.在线学习算法的使用例子

（1）在线回归

（2）专家建议预测

（3）在线排名（推荐系统）

未完，待续。。。。。。

下一节我们将从一个在线分类的例子说起。

在线学习和在线凸优化（online learning and online convex optimization）—基础介绍1的更多相关文章

在线学习和在线凸优化（online learning and online convex optimization）—FTL算法5
最自然的学习规则是使用任何在过去回合中损失最小的向量. 这与Consistent算法的精神相同,它在在线凸优化中通常被称为Follow-The-Leader,最小化累积损失. 对于任何t: 我们谈到了 ...
在线学习和在线凸优化（online learning and online convex optimization）—在线凸优化框架3
近年来,许多有效的在线学习算法的设计受到凸优化工具的影响. 此外,据观察,大多数先前提出的有效算法可以基于以下优雅模型联合分析: 凸集的定义: 一个向量的Regret定义为: 如前所述,算法相对于竞 ...
在线学习和在线凸优化（online learning and online convex optimization）—在线分类问题2
紧接上文,我们讲述在线分类问题令,为0-1损失,我们做出如下的简化假设: 学习者的目标是相对于hypotheses set: H具有low regret,其中H中的每个函数是从到{0,1}的映射,并 ...
在线学习和在线凸优化（online learning and online convex optimization）—凸化方法4
一些在线预测问题可以转化到在线凸优化框架中.下面介绍两种凸化技术: 一些在线预测问题似乎不适合在线凸优化框架.例如,在线分类问题中,预测域(predictions domain)或损失函数不是凸的.我 ...
在线学习和在线凸优化（online learning and online convex optimization）—FTRL算法6
zz姚班天才少年鬲融凭非凸优化研究成果获得斯隆研究奖
姚班天才少年鬲融凭非凸优化研究成果获得斯隆研究奖近日,美国艾尔弗·斯隆基金会(The Alfred P. Sloan Foundation)公布了2019年斯隆研究奖(Sloan Research ...
在线学习--online learning
在线学习 online learning Online learning并不是一种模型,而是模型的训练方法.能够根据线上反馈数据,实时快速的进行模型调优,使得模型能够及时反映线上的变化,提高线上预测的 ...
各大公司广泛使用的在线学习算法FTRL详解
各大公司广泛使用的在线学习算法FTRL详解现在做在线学习和CTR常常会用到逻辑回归( Logistic Regression),而传统的批量(batch)算法无法有效地处理超大规模的数据集和在线数据 ...
各大公司广泛使用的在线学习算法FTRL详解 - EE_NovRain
转载请注明本文链接:http://www.cnblogs.com/EE-NovRain/p/3810737.html 现在做在线学习和CTR常常会用到逻辑回归( Logistic Regression ...

随机推荐

CSVN（SVN）命令入门及使用过程中遇到的错误问题汇总
首先进入web管理界面新建一个版本库新建一个文件text svn add text #如果提示错误,在后面增加–force svn ci -m 'add text' #如果提示错误,将csvn下的目 ...
100 webhook implementations
转自: https://streamdata.io/blog/100-webhook-implementations/ 很不错的整理 What is the scope of the event-d ...
A* 寻路学习
启发式搜索:启发式搜索就是在状态空间中的搜索.对每一个搜索的位置进行评估,得到最好的位置,再从这个位置进行搜索直到目标．这样可以省略大量无谓的搜索路径,提高了效率．在启发式搜索中,对位置的估价是十分重 ...
Laya播放unity特效
杭州-fun 2017/12/5 20:47:12 其实网上就有你搜下就有了现成的脚本,设置帧数和截取时间它会截屏并保存成贴图导入laya生成atlas就能用了就是unity的截屏功能就 ...
Dynamics CRM Solution
Default solution Dynamics comes pre-loaded with a Default Solution Contains all the base objects, en ...
性能测试之mysql监控、优化
我们在做性能测试的目的是什么,就是要测出一个系统的瓶颈在哪里,到底是哪里影响了我们系统的性能,找到问题,然后解决它.当然一个系统由很多东西一起组合到一起,应用程序.数据库.服务器.中中间件等等很多东西 ...
谈谈在 .Net 生态里为什么没有 Hadoop 系列？
在 .Net 生态里为什么没有 Hadoop 系列 ? 有需要有 Hadoop 系列吗 ?
CommonJS 规范中的 module、module.exports 区别
CommonJS 规范中的 module.module.exports 区别 CommonJS规范规定,每个模块内部,module变量代表当前模块.这个变量是一个对象,它的exports属性(即mod ...
TypeScript 之 NPM包的类型
https://m.runoob.com/manual/gitbook/TypeScript/_book/doc/handbook/Typings%20for%20NPM%20Packages.htm ...
es query_string 和 match 的区别
默认使用空格拆分成多个子项,并且每个子项都会去分词查询.可以通过 default_operator 指定子项之间的关系.默认是或 . 然后每个子项前面可以使用 -+ 指定必须有 ...

在线学习和在线凸优化（online learning and online convex optimization）—基础介绍1

在线学习和在线凸优化（online learning and online convex optimization）—基础介绍1的更多相关文章

随机推荐

热门专题