在线学习和在线凸优化（online learning and online convex optimization）

　　一些在线预测问题可以转化到在线凸优化框架中。下面介绍两种凸化技术：

　　一些在线预测问题似乎不适合在线凸优化框架。例如，在线分类问题中，预测域（predictions domain）或损失函数不是凸的。我们描述了两种凸化技术，它们允许我们在其他场景中使用在线凸优化框架。

　　1.Convexification by Randomization

　　为了演示randomization技术，我们考虑一个专家建议的预测问题：每个在线回合中，学习者必须从d位给定专家的建议中进行选择。

　　 ${p_t} \in \{ 1,2,...,d\}$ 表示选到的专家，然后学习机收到一个向量 ${y_t} \in {[0,1]^d}$ ，其中 ${y_t}[i]$ 表示听从第 $i$ 个专家的建议所遭受的损失，学习机需要支付的损失为 ${y_t}[{p_t}]$ 。在这种情况下，decision space是离散的，因此非凸。

　　有限假设类（finite hypothesis class）的在线分类问题可以很容易地作为具有专家建议问题的预测的特例。因此，Cover’s impossibility result意味着没有算法可以通过专家建议问题获得预测的low Regret。

　　然而，正如我们在下面所示，通过允许学习者随机化他的预测，我们可以将问题转化为在线凸优化框架，因此可以获得针对该问题的low Regret算法。令 $S = \{ w \in {R^d}:w \ge 0 \wedge {\left\| w \right\|_1} = 1\}$ 是probability simplex，S是一个凸集。　　

　　在第 t回合，学习者选择，并且基于根据随机抽取一个专家，学习机支付期望损失：

　　现在，我们将问题转化成了在线凸优化。

　　2.Convexification by Surrogate Loss Functions

　　为了解释第二种凸化技术，我们再次从有限假设类的在线分类具体问题开始。回想一下，我们用来回避 Cover’s impossibility result的技术之一依赖于可实现性假设（realizability assumption）。我们假设存在 ${h^ * } \in H$ 使得对于所有的t有 ${y_t} = {h^ * }({x_t})$ 。有了这个假设，我们描述了Halving算法并且表明它最多 ${\log _2}(\left| H \right|)$ 个预测错误。我们现在使用在线凸优化语言得出类似的保证:

　　S是一个凸集， ${f_t}$ 对于所有t是一个凸函数，我们转化得到一个在线凸优化问题。

　　接下来的部分中，我们将推导出在线凸优化问题的算法。特别是，这些算法之一具有如下的regret bound：

　　其中， $\eta$ 是一个参数，在这里设置为1/4， ${L_t}$ 是函数 ${f_t}$ 关于L1范数的Lipschitz参数。在我们的案例中， ${L_t} = \left\{ \begin{array}{l}<br /> 1,t \in M\\<br /> 0,t \notin M<br /> \end{array} \right.$ ,因此：

　　通过 ${f_t}$ 的 surrogate property，我们获得：

　　这种类型的界限，其中错误的数量受到 competing hypothesis的convex surrogate loss的上限，通常被称为relative loss bound。

　　在realizable的情况下，我们可以进一步简化 relative loss bound如下。由于bound适用于所有u∈S，因此它特别适用于向量u=(0，...，0,1,0，...，0)，其中1位于对应于 true hypothesis ${h^ * } \in H$ 的位置。

　　通过我们的构造，对于所有t，，产生：

　　未完，待续。。。。。。

　　下一节分析FTL算法

在线学习和在线凸优化（online learning and online convex optimization）—凸化方法4的更多相关文章

在线学习和在线凸优化（online learning and online convex optimization）—FTL算法5
最自然的学习规则是使用任何在过去回合中损失最小的向量. 这与Consistent算法的精神相同,它在在线凸优化中通常被称为Follow-The-Leader,最小化累积损失. 对于任何t: 我们谈到了 ...
在线学习和在线凸优化（online learning and online convex optimization）—基础介绍1
开启一个在线学习和在线凸优化框架专题学习: 1.首先介绍在线学习的相关概念在线学习是在一系列连续的回合(rounds)中进行的: 在回合,学习机(learner)被给一个question:(一个向量 ...
在线学习和在线凸优化（online learning and online convex optimization）—在线凸优化框架3
近年来,许多有效的在线学习算法的设计受到凸优化工具的影响. 此外,据观察,大多数先前提出的有效算法可以基于以下优雅模型联合分析: 凸集的定义: 一个向量的Regret定义为: 如前所述,算法相对于竞 ...
在线学习和在线凸优化（online learning and online convex optimization）—在线分类问题2
紧接上文,我们讲述在线分类问题令,为0-1损失,我们做出如下的简化假设: 学习者的目标是相对于hypotheses set: H具有low regret,其中H中的每个函数是从到{0,1}的映射,并 ...
CMU Convex Optimization(凸优化)笔记1--凸集和凸函数
CMU凸优化笔记--凸集和凸函数结束了一段时间的学习任务,于是打算做个总结.主要内容都是基于CMU的Ryan Tibshirani开设的Convex Optimization课程做的笔记.这里只摘了 ...
Convex optimization 凸优化
zh.wikipedia.org/wiki/凸優化以下问题都是凸优化问题,或可以通过改变变量而转化为凸优化问题:[5] 最小二乘线性规划线性约束的二次规划半正定规划 Convex functi ...
在线学习和在线凸优化（online learning and online convex optimization）—FTRL算法6
在线学习--online learning
在线学习 online learning Online learning并不是一种模型,而是模型的训练方法.能够根据线上反馈数据,实时快速的进行模型调优,使得模型能够及时反映线上的变化,提高线上预测的 ...
各大公司广泛使用的在线学习算法FTRL详解
各大公司广泛使用的在线学习算法FTRL详解现在做在线学习和CTR常常会用到逻辑回归( Logistic Regression),而传统的批量(batch)算法无法有效地处理超大规模的数据集和在线数据 ...

随机推荐

supervisor使用总结
简介: Supervisor是一个进程控制系统. 它是一个C/S系统(注意: 其提供WEB接口给用户查询和控制). 它允许用户去监控和控制在类UNIX系统的进程. 它的目标与launchd.daemo ...
CodeBlocks中去掉下划线的方法
[问题] 如上图所示,某些字符下面会出现红色下划线,看着挺难受后的,决定想办法去掉. 这是拼写检查插件在作怪,把这个插件屏蔽掉就OK了. [步骤一]点击[插件]下的[管理插件]按钮 [步骤二]点击[管 ...
php7 php-fpm 重启
PHP7中php.ini.php-fpm和www.conf的配置 http://www.tuicool.com/articles/NjmQNj6 php-fpm 关闭: kill -SIGINT ` ...
JS replace()用法实现replaceAll
由于js没有提供replaceAll,则使用正则表达式实现全局替换. javascript中replace() 方法如果直接用str.replace("-","!&quo ...
WyBox 7620a 启用第二个串口
要修改的文件有两个 mt7620a.dtsi MT7620a.dts 1.进入target/linux/ramips/dts/ mt7620a.dtsi 把”disabled”改为”ok”,添加两行 ...
[转] nginx配置优化+负载均衡+动静分离(附带参数解析)
#指定nginx进程运行用户以及用户组user www www;#nginx要开启的进程数为8worker_processes 8;#全局错误日志文件#debug输出日志最为详细,而crit输出日志 ...
eval 日期对象
js中,eval相当于python中的eval(表达式)和exec(代码)的集合. var d = new Date(); #申明一个新的日期对象,方便之后调用,它的方法getDate();ge ...
WPF DataGrid添加编号列
WPF DataGrid添加编号列? 第一步:<DataGridTemplateColumn Header="编号" Width="50" MinWidt ...
Azure PowerShell (15) 批量导出Azure ASM/ARM VM信息
<Windows Azure Platform 系列文章目录> 客户又提出新的需求,需要知道所有订阅下的虚拟机数量.运行情况等信息. 我花了点时间,写了一个PowerShell脚本,发布到 ...
Windows XP Professional产品序列号
BX6HT-MDJKW-H2J4X-BX67W-TVVFG产品密钥:FCKGW-RHQQ2-YXRKT-8TG6W-2B7Q8产品密钥:CCC64-69Q48-Y3KWW-8V9GV-TVKRM Wi ...

在线学习和在线凸优化（online learning and online convex optimization）—凸化方法4

在线学习和在线凸优化（online learning and online convex optimization）—凸化方法4的更多相关文章

随机推荐

热门专题