機器學習基石(Machine Learning Foundations) 机器学习基石作业三课后习题解答

今天和大家分享coursera-NTU-機器學習基石(Machine Learning Foundations)-作业三的习题解答。笔者在做这些题目时遇到非常多困难，当我在网上寻找答案时却找不到，而林老师又不提供答案，所以我就想把自己做题时对题目怎样思考的写下来，为大家提供一些思路。当然，我对题目的理解不一定是正确的，假设各位博友发现错误请及时留言联系。谢谢！再次提醒：请不要以此博客作为通过考试的用途，还是更好学习、理解课程的途径！

希望我的博客对您的学习有所帮助！

本文出处：http://blog.csdn.net/a1015553840/article/details/51103628

其它作业解析请看汇总贴：http://blog.csdn.net/a1015553840/article/details/51085129

第三次作业林老师主要讲了四大块内容:

1.线性回归（Linear Regression）：线性回归方程。错误计算方法为square error。參数w计算方法。pseudo-inverse，线性回归实现步骤等

2.逻辑回归（Logistic Regression）:逻辑回归理论，错误计算方法cross entropy error。梯度下降法求最优解并推到逻辑回归的梯度下降公式

3.线性模型（Linear Model for Classification）:证明了线性回归和逻辑回归也能用于线性分类（VC bound）,随机梯度下降法（Stochstic）。多类别分类OVA,OVO

4.非线性转化（Noliear Transformation）:介绍了怎样把低维空间内的高次曲线化为高纬空间内的线性分类，并说明他的局限性（转换代价大）

1.第一题

（1）题意：在目标函数f上加入噪声epsilon，噪声强度为sigma^2。Ein的计算公式也已经给出。

求给定sigma=0.1。d=8时。能使Ein大于0.008的最小样本数N

（2）分析：这是一道非常普通的计算题，把值带入计算能够了

（3）答案：100

2.第二题

（1）题意：hat marix H的定义已经给出，求五项陈述哪些是正确的

（2）分析：老师在上课的时候说过H的作用是将y从N维空间投影到X召开得到的d+1维度空间上。（I-H）是指y与展开平面的垂直距离。对角线trace(I-H) = N-(d+1)

a.H是半正定的。正确。理由博主也不知道

b.H是可逆的，错误。博主个人认为是错的

c.H的一些特征值可能大于1。错误。半正定矩阵的特征值小于等于1

d.个人认为是正确的。

trace(I-H)=N-(d+1)

e.正确。由于H的作用是把y投影到hat y，那么无论投影几次都是不变的

（3）答案：none of above

3.第三题

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">

（1）题意：求以下哪个式子是题中式子的上限？

（2）分析：做出这六个Error的图例如以下所看到的

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">

能够看到，仅仅有第五个是他的上限

（3）答案：max(0,1-ywx) ^ 2

4.第四题

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">

（1）题意：下列哪些不是对w到处可微的

（2）分析：非常显然，max(0,-ywx)在0出不是可微的。左导数为-1。右导数为0

（3）答案：最后一项

（1）题意：利用随机梯度下降法计算下列错误函数。忽略个别不可微的点，以下哪个结果是PLA

（2）分析：

（3）答案： max(0,-ywx)

6.第六题

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">

（1）题意：求E在（0，0）附近的梯度

（2）分析：非常easy。分别求E对u。v的偏倒数，然后将（0，0）带入就可以

（3）答案：（-2，0）

7.第七题

（1）题意：利用上面的梯度下降公式。从(0,0)開始迭代，步长为0.01，求迭代五次后的错误E

（2）分析：这个太简单了，随便用C或者MATLAB写个算法就能够了。博主这里就不再累述

（3）答案：2.825

8.第八题

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">

（1）题意：这里讲的是二元泰勒展开

（2）分析：二元泰勒展开公式为http://wenku.baidu.com/link?

url=TFtNo_C9OV4MqsshuXz6yfMnjf-2A4-94zMsSS5qYepqhniR2aL6UbN3yjsCrMdFPY4_Zt2andPoxV0GII3b3QjBom1Xdmb-8cZyUgv-A3S

带入计算就可以。

注意与各项的相应关系。

（3）答案：（1.5，4，-1，-2，0，3）

9.第九题

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">

（1）题意：利用Hessian Matrix计算牛顿方向

（2）分析：Hessian Matrix见http://baike.baidu.com/link?url=zCgekuYg4ViCDXyjWlpQZPEfGXZoUGl7bP8lpe_N6ww7bSeLqyyIKdUORTVaBdjw9KBhIXJmCmL2s5ZDEIb2y_

Newton迭代见http://blog.csdn.net/luoleicn/article/details/6527049

（3）答案：第一项

10.第十题

（1）题意：利用牛顿迭代求迭代五次后E值

（2）分析：我们已经从第9题知道了牛顿方向，自己用MATLAB写一个简单的实现就能够了，这里就不再累述

（3）答案：2.361 (能够看到，牛顿迭代五次为2.361，梯度下降五次为2.825，说明牛顿迭代更快！

)

11.第十一题

（1）题意：求可以被全部二次+一次曲线shatter的最小x的集合

（2）分析：

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">

利用途中六条线能够轻松shatter

（3）答案：x1,x2,x3,x4,x5,x6

12.第十二题

（1）题意：利用上面的式子将d维度的X空间转换为Z空间。求转换后的d_vc

（2）分析：增加X有N个点。则每个点利用[x = xn]都能转化为一个维度的z,那么转换后终于得到的Z空间的维度为N。

我们要做的是在Z空间进行二元分类，因为我们曾经课程t推导过，d为空间的感知机（perceptrons）的d_vc = d+1。那么Z空间得到的d_vc = N +1 。那么对于随意N个点都是能够被shatter的。故N取随意大，d_ve = N+1，随意大的N都是能够被shatter的，所以d_vc = 无穷

（3）答案：无穷

第十三题到第十五题的C++实现请看：http://blog.csdn.net/a1015553840/article/details/51085094

16.第十六题

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">

（1）题意：这道题说的是多元逻辑回归的代价函数推导。

（2）分析：这道题笔者也不太懂。然后在百度上查找资料。国内站点上好像没有太多写多元逻辑回归的文章。所以我在一个国外的站点上找到了相关资料，然而并没有看到推导过程。网址为：http://blog.datumbox.com/machine-learning-tutorial-the-multinomial-logistic-regression-softmax-regression/ 。他是依据吴恩达的那套理论做的。当中J(theta)就是我们这里所说的Ein。

（3）答案：第二项

17.第十七题

、

（1）题意：这道题的意思是我们从16中知道了Ein的计算方法，就他对wi的偏导数

（2）分析：求导就可以

（3）答案：第四项

18. 第18-20题的C++实现请看：http://blog.csdn.net/a1015553840/article/details/51085835

本文出处：http://blog.csdn.net/a1015553840/article/details/51103628

其它问题解答请看汇总贴：http://blog.csdn.net/a1015553840/article/details/51085129

機器學習基石(Machine Learning Foundations) 机器学习基石作业三课后习题解答的更多相关文章

機器學習基石(Machine Learning Foundations) 机器学习基石课后习题链接汇总
大家好,我是Mac Jiang,非常高兴您能在百忙之中阅读我的博客!这个专题我主要讲的是Coursera-台湾大学-機器學習基石(Machine Learning Foundations)的课后习题解 ...
機器學習基石(Machine Learning Foundations) 机器学习基石作业四 Q13-20 MATLAB实现
大家好,我是Mac Jiang,今天和大家分享Coursera-NTU-機器學習基石(Machine Learning Foundations)-作业四 Q13-20的MATLAB实现. 曾经的代码都 ...
機器學習基石 (Machine Learning Foundations) 作业1 Q15-17的C++实现
大家好,我是Mac Jiang.今天和大家分享Coursera-台湾大学-機器學習基石 (Machine Learning Foundations) -作业1的Q15-17题的C++实现. 这部分作业 ...
機器學習基石机器学习基石（Machine Learining Foundations）作业2 Q16-18 C++实现
大家好,我是Mac Jiang,今天和大家分享Coursera-NTU-機器學習基石(Machine Learning Foundations)-作业2 Q16-18的C++实现.尽管有非常多大神已经 ...
機器學習基石机器学习基石（Machine Learning Foundations）作业2 第10题解答
由于前面分享的几篇博客已经把其他题的解决方法给出了链接,而这道题并没有,于是这里分享一下: 原题: 这题说白了就是求一个二维平面上的数据用决策树来分开,这就是说平面上的点只能画横竖两个线就要把所有的点 ...
機器學習基石机器学习基石（Machine Learning Foundations）作业1 习题解答（续）
这里写的是习题1 中的 18 , 19, 20 题的解答. Packet 方法,我这里是这样认为的,它所指的贪心算法是不管权重更新是否会对train data有改进都进行修正,因为这里面没有 ...
【Machine Learning】机器学习及其基础概念简介
机器学习及其基础概念简介作者:白宁超 2016年12月23日21:24:51 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现的深入理解.本系列文章是作者结 ...
【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 17—Large Scale Machine Learning 大规模机器学习
Lecture17 Large Scale Machine Learning大规模机器学习 17.1 大型数据集的学习 Learning With Large Datasets 如果有一个低方差的模型 ...
【Machine Learning】机器学习の特征
绘制了一张导图,有不对的地方欢迎指正: 下载地址机器学习中,特征是很关键的.其中包括,特征的提取和特征的选择.他们是降维的两种方法,但又有所不同: 特征抽取(Feature Extraction): ...

随机推荐

Flask实战第56天：板块管理
cms布局编辑 cms_boards.html {% block main_content %} <div class="top-box"> <button c ...
WPS设置去广告
韩梦飞沙韩亚飞 313134555@qq.com yue31313 han_meng_fei_sha WPS设置去广告设置密码和权限
bzoj 3312: [Usaco2013 Nov]No Change
3312: [Usaco2013 Nov]No Change Description Farmer John is at the market to purchase supplies for his ...
进阶的Redis之哈希分片原理与集群实战
前面介绍了<进阶的Redis之数据持久化RDB与AOF>和<进阶的Redis之Sentinel原理及实战>,这次来了解下Redis的集群功能,以及其中哈希分片原理. 集群分片模 ...
JavaScript 匹配字符串偶数位置的字符及匹配 $ 符号
已知一个字符串#####,现需要替换偶数位置的#为&. function replaceDemo(){ var s = "1#2#3#4#5#"; var regex = ...
mysql memory存储引擎简单测试
Auth: jin Date: 20140423 mysql> CREATE TABLE `t4` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` ...
Windows环境下32位汇编语言程序设计(典藏版)
<Windows环境下32位汇编语言程序设计(典藏版) > 基本信息作者: 罗云彬出版社:电子工业出版社 ISBN:9787121207594 上架时间:2013-7-8 出版日期:2 ...
关于Android架构那些事
刚开始,因为业务比较赶,我们也没有进行比较好的顶层设计,对代码的要求也是最低要求——完成功能开发就行了.这种短期设计也就造成了我们代码的扩展性几乎为零,稍微添加一点新功能,都要大动干戈.在后台系统架构 ...
如何修改chrome谷歌浏览器的默认搜索引擎
如图设置,chrome自己提供的百度的引擎,不能用,自己添加一个即可添加的方法如下:打开百度搜索内容“cai”,然后把搜索的url内容放到上图的网址栏里,并用%s替换“cai”
流畅的python第十五章上下文管理器和else块学习记录
with 语句和上下文管理器for.while 和 try 语句的 else 子句 with 语句会设置一个临时的上下文,交给上下文管理器对象控制,并且负责清理上下文.这么做能避免错误并减少样板代码, ...

機器學習基石(Machine Learning Foundations) 机器学习基石 作业三 课后习题解答

機器學習基石(Machine Learning Foundations) 机器学习基石 作业三 课后习题解答的更多相关文章

随机推荐

热门专题

機器學習基石(Machine Learning Foundations) 机器学习基石作业三课后习题解答

機器學習基石(Machine Learning Foundations) 机器学习基石作业三课后习题解答的更多相关文章