声明:

1,本篇为个人对《2012.李航.统计学习方法.pdf》的学习总结,不得用作商用。欢迎转载,但请注明出处(即:本帖地址)。

2,因为本人在学习初始时有非常多数学知识都已忘记。所以为了弄懂当中的内容查阅了非常多资料,所以里面应该会有引用其它帖子的小部分内容,假设原作者看到能够私信我,我会将您的帖子的地址付到以下。

3。假设有内容错误或不准确欢迎大家指正。

4。假设能帮到你,那真是太好了。

IIS的推导过程

IIS是一种最大熵学习模型的最优化算法。其推导步骤例如以下:

目标是通过极大似然预计学习模型參数求对数似然函数的极大值

IIS的想法是:如果最大熵模型当前的參数向量是λ = (λ1, λ2, …, λn)T,我们希望找到一个新的參数向量λ +
δ= (λ1+δ1, λ2+δ2, …, λn+δn)T。使得模型的对数似然函数值增大。假设能有这样一种參数向量更新的方法F:λ ->λ+δ,那么就能够反复使用这一方法,直至找到对数似然函数的最大值。

对于给定的经验分布,模型參数从λ到λ+δ,对数似然函数的该变量是

PS:上面 >= 的推导是依据不定时:-loga >= 1 - a, a > 0

将上述求得的结果(最后一行)记为A(δ| λ),于是有:

L( λ+ δ ) – L( λ ) >= A(δ | λ)

为了进一步减少这个下界,即缩小A(δ | λ)。引入一个变量:

由于fi是二值函数,故f#(x,y)表示的是全部特征(x, y)出现的次数,然后利用Jason不等式,可得:

我们把上述式子求得的A(δ | λ)的下界记为B(δ | λ),即:

相当于B(δ | λ)是对数似然函数添加量的一个新的下界,可记作:L(λ+δ)-L(λ)  >= B(δ | λ)。

接下来,对B(δ| λ)求偏导,得:

此时得到的偏导结果仅仅含δ,除δ之外不再含其他变量,令其为0,可得:

从而求得δ,问题得解。

IIS算法描写叙述

         输入:

特征函数f1, f2, …,fn;经验分布,模型Pλ(y|x)

         输出:

最优參数值λi*。最优模型Pλ

         解:

1,对全部i∈{1, 2, …, n}。取初值λi = 0

2,对每一i∈{1, 2, …, n}:

a)令δi是例如以下方程(这里将其称作方程一)

的解,这里:

b)更新λi的值:λi <- λi + δi

3,假设不是全部λi都收敛,则反复步骤2。

这一算法的关键步骤是a)。即求解a)中方程的δi。

假设f#(x, y) 是常数。即对不论什么x, y。有f#(x,y) = M,那么δi能够显示的表示成:

假设f#(x, y) 不是常数,那么必须通过数值计算求δi,而简单有效的方法是牛顿法。以g(δi) = 0,表示上面的方程一,牛顿法通过迭代求的δi,使得g(δi*)= 0。迭代公式是:

求得了δ。便相当于求得权值λ,终于将λ 回代到下式中:

即得到最大熵模型的最优预计。

參考:

http://blog.csdn.net/v_july_v/article/details/40508465?

utm_source=tuicool&utm_medium=referral

逻辑斯蒂回归3 -- 最大熵模型之改进的迭代尺度法(IIS)的更多相关文章

  1. 【分类器】感知机+线性回归+逻辑斯蒂回归+softmax回归

    一.感知机     详细参考:https://blog.csdn.net/wodeai1235/article/details/54755735 1.模型和图像: 2.数学定义推导和优化: 3.流程 ...

  2. 【转】机器学习笔记之(3)——Logistic回归(逻辑斯蒂回归)

    原文链接:https://blog.csdn.net/gwplovekimi/article/details/80288964 本博文为逻辑斯特回归的学习笔记.由于仅仅是学习笔记,水平有限,还望广大读 ...

  3. 机器学习之LinearRegression与Logistic Regression逻辑斯蒂回归(三)

    一 评价尺度 sklearn包含四种评价尺度 1 均方差(mean-squared-error) 2 平均绝对值误差(mean_absolute_error) 3 可释方差得分(explained_v ...

  4. spark机器学习从0到1逻辑斯蒂回归之(四)

      逻辑斯蒂回归 一.概念 逻辑斯蒂回归(logistic regression)是统计学习中的经典分类方法,属于对数线性模型.logistic回归的因变量可以是二分类的,也可以是多分类的.logis ...

  5. python机器学习实现逻辑斯蒂回归

    逻辑斯蒂回归 关注公众号"轻松学编程"了解更多. [关键词]Logistics函数,最大似然估计,梯度下降法 1.Logistics回归的原理 利用Logistics回归进行分类的 ...

  6. 【项目实战】pytorch实现逻辑斯蒂回归

    视频指导:https://www.bilibili.com/video/BV1Y7411d7Ys?p=6 一些数据集 在pytorch框架下,里面面有配套的数据集,pytorch里面有一个torchv ...

  7. [置顶] 局部加权回归、最小二乘的概率解释、逻辑斯蒂回归、感知器算法——斯坦福ML公开课笔记3

    转载请注明:http://blog.csdn.net/xinzhangyanxiang/article/details/9113681 最近在看Ng的机器学习公开课,Ng的讲法循循善诱,感觉提高了不少 ...

  8. 【TensorFlow入门完全指南】模型篇·逻辑斯蒂回归模型

    import库,加载mnist数据集. 设置学习率,迭代次数,batch并行计算数量,以及log显示. 这里设置了占位符,输入是batch * 784的矩阵,由于是并行计算,所以None实际上代表并行 ...

  9. 逻辑斯蒂回归(Logistic Regression)

    逻辑回归名字比较古怪,看上去是回归,却是一个简单的二分类模型. 逻辑回归的模型是如下形式: 其中x是features,θ是feature的权重,σ是sigmoid函数.将θ0视为θ0*x0(x0取值为 ...

随机推荐

  1. Balloons(DFS)

    http://acm.sdut.edu.cn/sdutoj/problem.php?action=showproblem&problemid=2248 题意:(1)求图中四连块(有公共边的方块 ...

  2. ul和li里面的list-style

    对ul   list-type  只是设置ul的样式对li    list-type 是对li的综合样式设定  语法是 li-style:list-style-type/list-style-imag ...

  3. html5小知识点

    1.兼容性问题: 对于不支持H5标签的浏览器,可以使用javascript来解决他们.然后在样式表中对这些标签定义一下默认的display:block. 采用第三方库:html5shiv.js < ...

  4. Chrome 最小化恢复之后部分黑屏

    解决办法:设置->显示高级设置->关闭硬件加速

  5. cocos creator制作微信小游戏

    2019-05-30 22:11:47 基础: javaScript基础   https://www.bilibili.com/video/av34087791?from=search&sei ...

  6. POJ 1149 PIGS (AC这道题很不容易啊)网络流

    PIGS Description Mirko works on a pig farm that consists of M locked pig-houses and Mirko can't unlo ...

  7. ABP的一些特性 (Attribute)

    大家应该很熟悉Attribute这个东西吧,ABP里面扩展了一些特性,做过滤权限,返回内容等进行控制,在这里小记下,方便后续查看. [DontWrapResult]  //ABP默认对返回结果做了封装 ...

  8. Windows phone开发 网络编程之HttpWebRequest

    HttpWebRequest和WebClient的区别1,HttpWebRequest是个抽象类,所以无法new的,需要调用HttpWebRequest.Create();2,其Method指定了请求 ...

  9. ROS:ubuntuKylin17.04-Ros使用OrbSLAM2

    忙于图像处理和DCNN,很长时间不使用ROS,重新安装系统后,再次使用ORB-SLAM2(ROS)进行三维重建和实时追踪的演示. 参考以前的文章:ROS:ubuntu-Ros使用OrbSLAM ORB ...

  10. 作业08之《MVC实现用户权限》

    1. 赋给用户一个userid,在用户角色表将用户和角色关联起来,在角色权限表中将角色和权限对应起来,权限表中存储的是左边菜单栏的名称. 2. 在判断权限时,通过用户的userid,获取其角色id,然 ...