线性回归 Linear regression(3) 线性回归的概率解释

这篇博客从一种方式推导了Linear regression 线性回归的概率解释，内容来自Standford公开课machine learning中Andrew老师的讲解。

线性回归的概率解释

在Linear regression中我们人为的定义了，损失函数 $J(\theta )= \frac{1}{2}\sum_{i=1}^{m}(h_\theta (x)^{(i)}-y{(i)})^{2}$ ，然而我们并没有说明为什么我们会选择最小二乘作为我们的损失函数。

下面是一种概率解释：让我们回到一开始的式子来看一看，一开始我们定义线性回归方程 $y^{(i)}=\theta ^{T}x^{(i)}+\varepsilon^{(i)}$ ，其中 $\varepsilon^{(i)}$ 是我们的误差项，那么对于 $\varepsilon^{(i)}$ 我们假设它是独立同分布（IID）的高斯分布，即 $\varepsilon^{(i)}\sim N(0,\sigma ^2)$ （假设它为高斯分布，我们主要用了概率统计里的一个很重要的定理：中心极限定理），那么我们可以得到：

$p(\varepsilon ^{(i)})=\frac{1}{\sqrt{2\pi }\sigma }exp(-\frac{(\varepsilon ^{(i)})^2}{2\sigma ^2})$

将线性回归方程代入到我们得到：

$p(y^{(i)}|x^{(i)};\theta)=\frac{1}{\sqrt{2\pi}\sigma } exp(-\frac{(y^{i}-\theta ^Tx^{(i)})^2}{2\sigma ^2})$

从而我们可以得到我们的似然（likelihood）函数

$L(\theta )=L(\theta ;X,\vec{y})=p(\vec{y}|X;\theta )$

$L(\theta )=\prod_{i=1}^{m}p(y^{(i)}|x^{(i)};\theta ) \$

$L(\theta )=\prod_{i=1}^{m}\frac{1}{\sqrt{2\pi}\sigma }exp(-\frac{(y^{(i)}-\theta^Tx^{(i)})}{2\sigma ^2})$

我们要对我们的似然函数进行极大似然估计（MLE），一般情况下我们会把似然函数求对数，再进行极大似然估计，原因很简单，求对数之后单调性不变，函数本身的e也会没有，函数会变得比较简单。

所以log likelihood l(Θ):

$l(\theta )=logL(\theta)=\sum_{i=1}^{m}log\frac{1}{\sqrt{2\pi}\sigma }exp(-\frac{(y^{(i)}-\theta^Tx^{(i)})}{2\sigma ^2})$

$l(\theta )=mlog\frac{1}{\sqrt{2\pi}\sigma}-\frac{1}{\sigma^2}\frac{1}{2}\sum_{i=1}^{m}(y^{(i)}-\theta^Tx^{(i)})^2$

$l(\theta )=c_1-c_2\frac{1}{2}\sum_{i=1}^{m}(y^{(i)}-\theta^Tx^{(i)})^2$

至此，我们最大化似然函数l(Θ)，等价于最小化损失函数J(Θ)，这也说明了在我们的推导中，最后结果与我们假设的高斯分布的方差σ是没有关系的。

我们回过头来再考虑一下，我们假设了什么，我们假设误差项服从高斯分布，这个假设对于线性回归模型来说非常形象，其实我们一开始就假设了这个模型是一个线性模型，那么很自然的我们会考虑误差一定是离线性函数越近可能性越大，离线性函数越远可能性越小。所以在机器学习模型中，假设对于我们来说相当重要。

我的感受是：任何的机器学习算法都不能被称为一定是一个好的算法，只有当我们的假设符合数据本身的性质，我们的机器学习模型才能达到一个好的效果。

线性回归 Linear regression(3) 线性回归的概率解释的更多相关文章

线性回归 Linear regression(1)线性回归的基本算法与求解
本系列内容大部分来自Standford公开课machine learning中Andrew老师的讲解,附加自己的一些理解,编程实现和学习笔记. 第一章 Linear regression 1.线性回归 ...
线性回归 Linear regression(2)线性回归梯度下降中学习率的讨论
这篇博客针对的AndrewNg在公开课中未讲到的,线性回归梯度下降的学习率进行讨论,并且结合例子讨论梯度下降初值的问题. 线性回归梯度下降中的学习率上一篇博客中我们推导了线性回归,并且用梯度下降来求 ...
斯坦福CS229机器学习课程笔记 Part1：线性回归 Linear Regression
机器学习三要素机器学习的三要素为:模型.策略.算法. 模型:就是所要学习的条件概率分布或决策函数.线性回归模型策略:按照什么样的准则学习或选择最优的模型.最小化均方误差,即所谓的 least-sq ...
Stanford机器学习---第二讲. 多变量线性回归 Linear Regression with multiple variable
原文:http://blog.csdn.net/abcjennifer/article/details/7700772 本栏目(Machine learning)包括单参数的线性回归.多参数的线性回归 ...
机器学习（三）--------多变量线性回归(Linear Regression with Multiple Variables)
机器学习(三)--------多变量线性回归(Linear Regression with Multiple Variables) 同样是预测房价问题如果有多个特征值那么这种情况下假设h表示 ...
Ng第二课：单变量线性回归(Linear Regression with One Variable)
二.单变量线性回归(Linear Regression with One Variable) 2.1 模型表示 2.2 代价函数 2.3 代价函数的直观理解 2.4 梯度下降 2.5 梯度下 ...
斯坦福第二课：单变量线性回归(Linear Regression with One Variable)
二.单变量线性回归(Linear Regression with One Variable) 2.1 模型表示 2.2 代价函数 2.3 代价函数的直观理解 I 2.4 代价函数的直观理解 I ...
机器学习方法：回归（一）：线性回归Linear regression
欢迎转载,转载请注明:本文出自Bin的专栏blog.csdn.net/xbinworld. 开一个机器学习方法科普系列:做基础回顾之用,学而时习之:也拿出来与大家分享.数学水平有限,只求易懂,学习与工 ...
机器学习 (一) 单变量线性回归 Linear Regression with One Variable
文章内容均来自斯坦福大学的Andrew Ng教授讲解的Machine Learning课程,本文是针对该课程的个人学习笔记,如有疏漏,请以原课程所讲述内容为准.感谢博主Rachel Zhang的个人笔 ...

随机推荐

无法读取服务器服务中的服务器队列性能数据。数据段的第一个四字节 (DWORD) 中包
无法打开服务器服务性能对象.数据段的第一个四字节 (DWORD) 包含状态代码. 解决方法:修改注册表禁用PerfNet性能计数器. 具体方法:打开注册表,在HKEY_LOCAL_MACHINE\SY ...
docker-machine windows
windows 官方使用 https://docs.docker.com/machine/drivers/hyper-v/ 坑点是 docker-machine create -d hyperv m ...
Ubuntu下配置Nginx+PHP
1.安装Nginxapt-get install nginx 2.启动Nginxservice nginx start 3.访问服务器IP 如果看到“Welcome to nginx!”说明安装好了. ...
C++（二十九） — new 和 delete
1.基本用法,定义变量.数组.对象 class test { public: test(int a_, int b_) { a = a_; b = b_; cout << "构造 ...
Educational Codeforces Round 40 I. Yet Another String Matching Problem
http://codeforces.com/contest/954/problem/I 给你两个串s,p,求上一个串的长度为|p|的所有子串和p的差距是多少,两个串的差距就是每次把一个字符变成另一个字 ...
Vim代码缩进设置
前段配置VPS,无奈只能使用Vim编辑Python代码,比较头疼的没法设置自动缩进,所以搜索了相关的配置,特记录如下. 将以下的设置加入到~/etc/vim/.vimrc中: set sw=4 set ...
vue-router防跳墙控制
vue-router防跳墙控制因为在实际开发中,从自己的角度来看,发现可以通过地址栏输入地址,便可以进入本没有权限的网页.而我们一般只是操作登录页面,其他页面很少考虑,此刻特来尝试解决一下基于vu ...
firefox与ie 的javascript区别
1. Document.form.item 问题现有问题: 现有代码中存在许多 document.formName.item("itemName") 这样的语句,不能在 ...
转载-lvs官方文档-Linux服务器集群系统（二）
Linux服务器集群系统(二) LVS集群的体系结构章文嵩 (wensong@linux-vs.org) 2002 年 4 月本文主要介绍了LVS集群的体系结构.先给出LVS集群的通用体系结构,并 ...
ios8 - CoreLocation定位服务的变化
在iOS8开发中,发现一个CoreLocation的使用问题,执行操作之后,不会调用到定位之后的delegate方法中. 根据文档,需要在使用CoreLocation前调用方法: [locationm ...

线性回归 Linear regression(3) 线性回归的概率解释

线性回归 Linear regression(3) 线性回归的概率解释的更多相关文章

随机推荐

热门专题