在线学习--online learning

在线学习 online learning

Online learning并不是一种模型，而是模型的训练方法。能够根据线上反馈数据，实时快速的进行模型调优，使得模型能够及时反映线上的变化，提高线上预测的准确率。

在线模型的评估之--Mistake Bound

假设有一个模型完全预测正确，Mistake Bound表示的就是找到这个模型最多犯错的次数。

用Halving算法来解决这个问题，算法步骤如下：

所以犯错次数小于等于对模型集合数量求以2为底的对数。

在线模型的评估之--Regret 后悔度

Regret的求解举例

Regret练习：

在线学习模型的有效必要条件就是

Online Learning训练过程也需要优化一个目标函数（红框标注的），但是和其他的训练方法不同， Online Learning要求快速求出目标函数的最优解，最好是能有解析解。

在线学习流程：
Learning的流程包括：将模型的预测结果展现给用户，然后收集用户的反馈数据，再用来训练模型，形成闭环的系统。

在线学习模型之FTRL--Follow The Regularized Leader

算法基本思想：

在这里最后一步更新w的时候需要找到使得损失函数之和最小的w，在线学习是速度需要很快，但是一般这个损失函数不是很快可以求解的，需要找到一个代理的损失函数，使得损失函数可以快速求解。代理损失函数需要满足几个要求：
1.代理损失函数比较容易求解，最好是有解析解
2.Regret满足

关于次梯度

ftrl相关学习资料

在线学习--online learning的更多相关文章

在线学习和在线凸优化（online learning and online convex optimization）—FTL算法5
最自然的学习规则是使用任何在过去回合中损失最小的向量. 这与Consistent算法的精神相同,它在在线凸优化中通常被称为Follow-The-Leader,最小化累积损失. 对于任何t: 我们谈到了 ...
在线学习和在线凸优化（online learning and online convex optimization）—在线凸优化框架3
近年来,许多有效的在线学习算法的设计受到凸优化工具的影响. 此外,据观察,大多数先前提出的有效算法可以基于以下优雅模型联合分析: 凸集的定义: 一个向量的Regret定义为: 如前所述,算法相对于竞 ...
在线学习和在线凸优化（online learning and online convex optimization）—在线分类问题2
紧接上文,我们讲述在线分类问题令,为0-1损失,我们做出如下的简化假设: 学习者的目标是相对于hypotheses set: H具有low regret,其中H中的每个函数是从到{0,1}的映射,并 ...
在线学习和在线凸优化（online learning and online convex optimization）—基础介绍1
开启一个在线学习和在线凸优化框架专题学习: 1.首先介绍在线学习的相关概念在线学习是在一系列连续的回合(rounds)中进行的: 在回合,学习机(learner)被给一个question:(一个向量 ...
【深度学习Deep Learning】资料大全
最近在学深度学习相关的东西,在网上搜集到了一些不错的资料,现在汇总一下: Free Online Books by Yoshua Bengio, Ian Goodfellow and Aaron C ...
各大公司广泛使用的在线学习算法FTRL详解
各大公司广泛使用的在线学习算法FTRL详解现在做在线学习和CTR常常会用到逻辑回归( Logistic Regression),而传统的批量(batch)算法无法有效地处理超大规模的数据集和在线数据 ...
各大公司广泛使用的在线学习算法FTRL详解 - EE_NovRain
转载请注明本文链接:http://www.cnblogs.com/EE-NovRain/p/3810737.html 现在做在线学习和CTR常常会用到逻辑回归( Logistic Regression ...
机器学习(Machine Learning)&深度学习(Deep Learning)资料【转】
转自:机器学习(Machine Learning)&深度学习(Deep Learning)资料 <Brief History of Machine Learning> 介绍:这是一 ...
机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 2)
##机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 2)---#####注:机器学习资料[篇目一](https://github.co ...

随机推荐

oracle_存储过程_有参数_获取部门装置层级树
create or replace procedure P_UTIL_TREE(P_APPL_NAME in VARCHAR2, P_HIERARCHY_TYP in VARCHAR2, TREETY ...
SQLServer------Sql Server性能优化辅助指标SET STATISTICS TIME ON和SET STATISTICS IO ON
转载: http://www.cnblogs.com/xqhppt/p/4041799.html
day10<面向对象+>
面向对象(package关键字的概述及作用) 面向对象(包的定义及注意事项) 面向对象(带包的类编译和运行) 面向对象(不同包下类之间的访问) 面向对象(import关键字的概述和使用) 面向对象(四 ...
Java信号量 Semaphore 介绍
一.介绍 Semaphore当前在多线程环境下被扩放使用,操作系统的信号量是个很重要的概念,在进程控制方面都有应用.Java 并发库的Semaphore 可以很轻松完成信号量控制,Semaphore ...
Python 文件类型
Python的文件类型分为以下几种: 1. 源代码文件,也就是以 .py 为扩展名的文件,由 python 程序解释,不需要编译 2. 字节代码文件,python 源代码文件经过编译后生成的扩展名为 ...
complex()
complex() 用于将一个对象转换为复数 In [1]: complex(123) # 将整数转换为复数 Out[1]: (123+0j) In [2]: complex(') # 将纯数字的字符 ...
line-height和vertical-algin
项目中,经常会用到line-height和vertical-algin来解决垂直居中的问题,但对其原理和应用限制却很少了解.因此做了一下总结: line-height具有继承性,对inline元素.t ...
Android ImageResizer：inSampleSize
import android.annotation.TargetApi; import android.content.Context; import android.content.res.Reso ...
ubuntu 14.04 返回到经典桌面方法
1.打开终端,运行下面命令:sudo apt-get install gnome-session-fallback 2.重启机器,选择gnome,然后登录
2012Noip提高组Day2 T3 疫情控制
题目描述 H 国有 n 个城市,这 n 个城市用 n-1 条双向道路相互连通构成一棵树,1 号城市是首都,也是树中的根节点. H 国的首都爆发了一种危害性极高的传染病.当局为了控制疫情,不让疫情扩散到 ...

在线学习--online learning

在线学习--online learning的更多相关文章

随机推荐

热门专题