机器学习-Probabilistic interpretation

Probabilistic interpretation，概率解释
解释为何线性回归的损失函数会选择最小二乘

表示误差，表示unmodeled因素或随机噪声，真实的y和预测出来的值之间是会有误差的，因为我们不可能考虑到所有的影响结果的因素，比如前面的例子，我们根据面积和卧室的个数来预测房屋的价格，但是影响房屋价格的因素其实很多，而且有很多随机因素，比如买卖双方的心情，而根据中心极限定理，大量独立的随机变量的平均值是符合正态分布或高斯分布的
所以这里对于由大量unmodeled因素导致的误差的分布，我们假设也符合高斯分布。因为你想想，大量独立随机变量大部分误差会互相抵消掉，而出现大量变量行为相似造成较大误差的概率是很小的。
可以写成，因为误差的概率和预测出是真实值的概率是一样的

注意，这里：

不同于：

表示这里θ不是一个随机变量，而是翻译成given x⁽ⁱ⁾and parameterized by θ 因为对于训练集，θ是客观存在的，只是当前还不确定，所以有：

这个很容易理解，真实值应该是以预测值为中心的一个正态分布，给出θ似然性的定义：
给定训练集X和参数θ，预测结果等于真正结果的概率，等同于该θ为真实θ的可能性（似然性）。这里probability和likelihood有什么不同，答案没有什么不同。但是对于数据使用probability，对于参数使用likelihood，故最大似然法（maximum likelihood），就是找出L(θ)最大的那个θ，即概率分布最fit训练集的那个θ。

继续推导，把上面的式子带入，得到

实际为了数学计算方便，引入log likelihood，

可以看到，最终我们从L(θ)的最大似然估计，推导出损失函数J(θ)，最小二乘法：

Hence,maximizing l(θ) gives the same answer as minimizing

所以结论为，最小二乘回归被认为是进行最大似然估计的一个很自然的方法。

机器学习-Probabilistic interpretation的更多相关文章

回归问题中代价函数选择的概率解释(Probabilistic interpretation)
在我们遇到回归问题时,例如前面提到的线性回归,我们总是选择最小而成作为代价函数,形式如下: 这个时候,我们可能就会有疑问了,我们为什么要这样来选择代价函数呢?一种解释是使我们的预测值和我们训练样本的真 ...
Probabilistic interpretation
Under the previous probabilistic assumptions on the data, least-squares regression corresponds to fi ...
贝叶斯方法（Bayesian approach） —— 一种概率解释（probabilistic interpretation）
1. Bayesian approach 对于多项式拟合问题,我们可通过最小二乘(least squares)的方式计算得到模型的参数,最小二乘法又可视为最大似然(maximum likelihood ...
斯坦福CS229机器学习课程笔记 Part1：线性回归 Linear Regression
机器学习三要素机器学习的三要素为:模型.策略.算法. 模型:就是所要学习的条件概率分布或决策函数.线性回归模型策略:按照什么样的准则学习或选择最优的模型.最小化均方误差,即所谓的 least-sq ...
cs229 斯坦福机器学习笔记（一）-- 入门与LR模型
版权声明:本文为博主原创文章,转载请注明出处. https://blog.csdn.net/Dinosoft/article/details/34960693 前言说到机器学习,非常多人推荐的学习资 ...
Stanford机器学习笔记-2.Logistic Regression
Content: 2 Logistic Regression. 2.1 Classification. 2.2 Hypothesis representation. 2.2.1 Interpretin ...
Andrew Ng机器学习公开课笔记 -- 线性回归和梯度下降
网易公开课,监督学习应用.梯度下降 notes,http://cs229.stanford.edu/notes/cs229-notes1.pdf 线性回归(Linear Regression) 先看个 ...
###《Machine Learning》by Andrew NG
点击查看Evernote原文. #@author: gr #@date: 2014-10-17 #@email: forgerui@gmail.com Fundamental 一. 矩阵的迹.秩矩阵 ...
Markov Random Fields
We have seen that directed graphical models specify a factorization of the joint distribution over a ...

随机推荐

Xcode6 设置LaunchImage图标
最近设置LaunchImage图标时发现怎么都没有效果,后来发现是Xcode6中新建项目的时候会默认添加一个LaunchScreen.xib的文件,我们启动程序的时候也会发现,加载的时LaunchSc ...
github的提交源码到服务器
github是现代的代码库,各种牛人,各种开源,也是现在大公司招聘的一个考察点, 这里介绍一下怎样把本地源码提交到github上. 首先我们需要在github上创建一个respository. 2,输 ...
下面forward和redirect的描述，正确的是（ABCD）
A:forward是服务器将控制权转交给内部服务器对象,由新的对象来全权负责响应用户的请求 B:执行forward时,浏览器不知道服务器所发送的内容从那里来,浏览器地址栏中还是原来的地址 C:执行re ...
CXF Spring 使用
<?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.spr ...
UVa 12403 - Save Setu
题目:有两种操作:1.当前数值添加.2.输出当前数值. 分析:简单题.模拟就可以. 说明:A+B. #include <iostream> #include <cstdlib> ...
设计模式-（18）命令模式（swift版）
一,概念: 在软件系统中,“行为请求者”与“行为实现者”通常呈现一种“紧耦合”.但在某些场合,比如要对行为进行“记录.撤销/重做.事务”等处理,这种无法抵御变化的紧耦合是不合适的.在这种情况下,如何将 ...
织梦万能调用LOOP标签！
1,安装DEDE织梦程序时候,数据库名称设置独立的一个. 2,雨田SEOER这里用的是在织梦本地文件夹中新建myblog文件夹,然后里面装入emlog_5.3.0的安装文件.URL地址栏输入htt ...
C++ pair（对组）用法（转）
类模板:template <class T1, class T2> struct pair 参数:T1是第一个值的数据类型,T2是第二个值的数据类型. 功能:pair将一对值组合成一个值, ...
bzoj 4603 平凡的骰子
题目大意: 思路: 首先我们需要求出整个凸多面体的重心可以通过把多面体剖分为四面体求出每个四面体的重心四面体的重心为四个点的坐标和/4 对每个四面体的重心加上它们体积的权加权平均数即为整个的 ...
【转】Commonjs规范及Node模块实现
前言: Node在实现中并非完全按照CommonJS规范实现,而是对模块规范进行了一定的取舍,同时也增加了少许自身需要的特性.本文将详细介绍NodeJS的模块实现引入 nodejs是区别于javas ...

机器学习-Probabilistic interpretation

机器学习-Probabilistic interpretation的更多相关文章

随机推荐

热门专题