一起啃PRML - 1.2.4 The Gaussian distribution 高斯分布 正态分布
一起啃PRML - 1.2.4 The Gaussian distribution 高斯分布 正态分布
@copyright 转载请注明出处 http://www.cnblogs.com/chxer/
我们将用整个第二章来研究各种各样的概率分布以及它们的性质。然而,在这里介绍连续变量一种最重要的概率分布是很方便的。这种分布就是正态分布(normal distribution)或者高斯分布(Gaussian distribution)。在其余章节中(事实上在整本书中),我们将会经常用到这种分布。
正态分布是这么定义的:

图像长成这样:

我们待会被数学折磨完后再来了解这些参数的意义。
先来看看正态分布几个性质:全正且归一


好,接下来我们来算一下正态分布的期望以及二阶矩的期望以及方差。
先从简单的一阶期望开始:

然后我们就磨出来了,喜大普奔。
二阶矩似乎道理是一样的。以后再补上吧。

那么我们就把方差求出来了:

现在我们就知道每一个参数的意义了:
μ,被叫做均值(mean),以及σ2,被叫做方差(variance)。方差的平方 根,由σ给定,被叫做标准(standard deviation)。方差的倒数,记作β = 1 ,被叫做精度。
分布的最大值是众数。对于正态分布来说,众数是等于均值的。
我们也对D维向量x的正态分布感兴趣(不包括我),它是这么定义的:

现在假定我们有一个观测的数据集x = (x1, . . . , xN )T ,表示标量变量x的N次观测。注意, 我们使用一个字体不同的x来和向量变量(x1, . . . , xD)T 作区分,后者记作x。我们假定各次观 测是独立地从高分布中抽取的,分布的均值μ和方差σ2未知,我们想根据数据集来确定这 参数。独立地从相同的数据中抽取的数据点被称为独立同分布(independent and identically distributed),通常缩写成i.i.d.。我们已看到两个独立事件的联合概率可以由各个事件的边缘概率的乘积得到。由于我们的数据集x是独立同布的,因此给定μ和σ2,我们可以给出数据集的概率:

我们就得到了正态分布的似然函数。我们取对数就可以得到对数似然函数:

我们分别关于两个参数最大化对数似然函数,就得到了样本均值和样本方差:

事实上,我们发现样本均值应该是无偏的,也就是有:

对于样本方差,我们则需要考量。

当数据点的数量N增大时,最大似然解的偏移会变得不太严重,并且在极 限N → ∞的情况下,方差的最大似然解与产生数据的分布的真实方差相等。在实际应用中,只要N 的值不太小,那么偏移的现象不是个大问题。然而,在本书中,我们感兴趣的是带有很多参数的复杂模型。这些模型中,最大似然的偏移问题会更加严重。实际上,我们会看到,最大似然的偏移问题是我们在多项式曲线拟合问题中遇到的过拟合问题的核心。
一起啃PRML - 1.2.4 The Gaussian distribution 高斯分布 正态分布的更多相关文章
- 一起啃PRML - 1.2.3 Bayesian probabilities 贝叶斯概率
一起啃PRML - 1.2.3 Bayesian probabilities 贝叶斯概率 @copyright 转载请注明出处 http://www.cnblogs.com/chxer/ 这一节简单讲 ...
- 一起啃PRML - 1.2.2 Expectations and covariances 期望和协方差
一起啃PRML - 1.2.2 Expectations and covariances 期望和协方差 @copyright 转载请注明出处 http://www.cnblogs.com/chxer/ ...
- 一起啃PRML - 1.2.1 Probability densities 概率密度
一起啃PRML - 1.2.1 Probability densities @copyright 转载请注明出处 http://www.cnblogs.com/chxer/ 我们之前一直在讨论“谁取到 ...
- 一起啃PRML - 1.2 Probability Theory 概率论
一起啃PRML - 1.2 Probability Theory @copyright 转载请注明出处 http://www.cnblogs.com/chxer/ A key concept in t ...
- 一起啃PRML - 1.1 Example: Polynomial Curve Fitting 多项式曲线拟合
一起啃PRML - 1.1 Example: Polynomial Curve Fitting @copyright 转载请注明出处 http://www.cnblogs.com/chxer/ 前言: ...
- 一起啃PRML - 1 Introduction 绪论
一起啃PRML - 1 Introduction @copyright 转载请注明出处 http://www.cnblogs.com/chxer/ 这一部分主要是介绍一下Pattern Recogni ...
- 一起啃PRML - Preface 前言
一起啃PRML - 前言 Preface @copyright 转载请注明出处 http://www.cnblogs.com/chxer/ PRML,Pattern Recognition and M ...
- 正态分布(Normal distribution)又名高斯分布(Gaussian distribution)
正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学.物理及project等领域都很重要的概率分布,在统计学的很多方面有着重大的影 ...
- UNDERSTANDING THE GAUSSIAN DISTRIBUTION
UNDERSTANDING THE GAUSSIAN DISTRIBUTION Randomness is so present in our reality that we are used to ...
随机推荐
- JS中的replace方法以及与正则表达式的结合应用
replace方法的语法是:stringobj.replace(rgexp, replacetext) 其中stringobj是字符串(string),reexp可以是正则表达式对象(regexp)也 ...
- SQL Server 2012 数据库各个版本功能对比
作为这篇SQL SERVER 2008数据库各版本功能对比 的姊妹篇,就写点SQL Server 2012 各个版本的区别以及物理以及逻辑上的限制. 个部分来分http://technet.micro ...
- redis研究之watch
具体的看注释,代码如下: public static void TransTest() { RedisClient client1 = new RedisClient(host, port); Red ...
- JAVA中实现百分比
import java.text.NumberFormat; public class TeachYou { public static void main(String[] args) { //这里 ...
- Java 编译解释
JDK提供的主要开发工具有:编译程序,解释执行程序.调试程序.Applet执行程序.文档管理程序.包管理程序等. 1.编译程序:javac.exe,对应的javac命令将Java源程序转换为字节码. ...
- (转)怎么去掉Xcode工程中的某种类型的警告 Implicit conversion loses integer precision: 'NSInteger' (aka 'long') to 'int32
问题描述 在我们的项目中,通常使用了大量的第三方代码,这些代码可能很复杂,我们不敢改动他们,可是作者已经停止更新了,当sdk升级或者是编译器升级后,这些遗留的代码可能会出现许许多多的警告,那么我们有 ...
- extern “C”的作用
1.引言 C++语言的创建初衷是“a better C”,但是这并不意味着C++中类似C语言的全局变量和函数所采用的编译和连接方式与C语言完全相同.作为一种欲与C兼容的语言,C++保留了一部分过程 式 ...
- gcc 生成动态库时-fpic选项是什么意思。
-f后面跟一些编译选项,PIC是其中一种,表示生成位置无关代码(Position Independent Code)
- 常用命令su ls cp cd mv cat touch mkdir rm head less more pwd tac 等
1.用户切换 su:switch user su kevin //半切换,切换到kevin用户,但是不读取kevin用户的配置文件 su - kevin //完全切换,执行这个命令的时候表示切 ...
- @using (Html.BeginForm())收集
一 ,制定表单提交方式和路径 1,指明(视图,控制器,提交方式,参数) <%using(Html.BeginForm("Index","Home",For ...