统计学习方法—

背景基础知识备忘

　　平均差

　　　　MD=(∑|x_i-x'|)/n

　　加权平均差

　　　　A.D=(∑|x_i-x'|f_i)/∑f_i

　　方差

　　标准差

　　　　SD=方差的平方根

　　分布函数：

　　　　设X是一个随机变量，x是任意实数，函数称为X的分布函数。有时也记为X~F(x) 对于任意实数

,有

　　概率密度函数：

　　　　随机数据的概率密度函数：表示瞬时幅值落在某指定范围内的概率，因此是幅值的函数。它随所取范围的幅值而变化。

　　　密度函数f(x) 具有下列性质：

　　对概率密度函数作傅里叶变换可得特征函数。

　　特征函数与概率密度函数有一对一的关系。因此知道一个分布的特征函数就等同于知道一个分布的概率密度函数。

　　期望

　　离散型：

　　　　离散型随机变量的一切可能的取值xi与对应的概率Pi(=xi)之积的和称为该离散型随机变量的数学期望　

　　连续型：

　　　　若随机变量X的分布函数F(x)可表示成一个非负可积函数f(x)的积分，则称X为连续性随机变量，f(x)称为X的概率密度函数（分布密度函数）。

监督学习：

　　目标：学习出一个模型对于给定输入，对其相应输出做出很好的预测

　　训练数据集：T={(x_i,y_i)} i=1,2,3.......N

　　统计学习要素：

　　　　方法=模型+策略+算法

　　　模型：所要学习的条件概率分布或者决策函数

　　　策略：略损失最小的最优化的目标函数

　　　算法：学习模型的计算方法

　　exp：

　　　　损失函数 L(Y,f(x)) f(x)为预测值：

　　　　　　0-1损失：

　　　　　　　　L(Y,f(x))=1 Y !=f(x)

　　　　　　　　L(Y,f(x))=0 Y==f(x)

　　　　　　平方损失：

　　　　　　　　L(Y,f(x))=∑(Y-x')²

　　　　　　绝对损失：

　　　　　　　　L(Y,f(x))=|Y-f(x)|

　　　　　　对数损失对数似然损失函数：

　　　　　　　　L(Y,P(Y|X))=-logP(Y|X)

　　损失期望函数：

　　　　R_exp(f)=E_p [L(Y,f(x))]=∫_x*yL(y,f(x))p(x,y)dxdy 为模型联合分布的期望损失

　　由于对联合分布概率 p(x,y) 未知对训练集T有经验损失为

　　　　R_exp(f)=(∑L(y_i,f(x_i)))/N i=1,2,3,4.......N 为模型的平均损失

　　由大数定理：当样本容量N趋向于无穷时，经验损失趋向于期望损失由于N在实际问题中不可能趋向于无穷，用平均损失估计期望损失不准确，必须对他校正

　　方法有：1 经验风险最小化 2 结构风险最小化

　　经验风险最小化：对于假设空间F

　　　　min (∑L(y_i,f(x_i)))/N 的模型为最佳模型

　　结构风险最小化：

　　　　min (∑L(y_i,f(x_i)))/N+λJ(f) J(f)为模型复杂度模型越复杂 J(f)越大反之亦然 λ为系数用来权衡经验风险和模型复杂度

以上为背景知识，下一篇看模型评估以及模型选择

统计学习方法——P1的更多相关文章

【NLP】基于统计学习方法角度谈谈CRF（四）
基于统计学习方法角度谈谈CRF 作者:白宁超 2016年8月2日13:59:46 [摘要]:条件随机场用于序列标注,数据分割等自然语言处理中,表现出很好的效果.在中文分词.中文人名识别和歧义消解等任务 ...
统计学习方法 --- 感知机模型原理及c++实现
参考博客 Liam Q博客和李航的<统计学习方法> 感知机学习旨在求出将训练数据集进行线性划分的分类超平面,为此,导入了基于误分类的损失函数,然后利用梯度下降法对损失函数进行极小化,从而 ...
统计学习方法笔记--EM算法--三硬币例子补充
本文,意在说明<统计学习方法>第九章EM算法的三硬币例子,公式(9.5-9.6如何而来) 下面是(公式9.5-9.8)的说明, 本人水平有限,怀着分享学习的态度发表此文,欢迎大家批评,交流 ...
统计学习方法：KNN
作者:桂. 时间:2017-04-19 21:20:09 链接:http://www.cnblogs.com/xingshansi/p/6736385.html 声明:欢迎被转载,不过记得注明出处哦 ...
统计学习方法：罗杰斯特回归及Tensorflow入门
作者:桂. 时间:2017-04-21 21:11:23 链接:http://www.cnblogs.com/xingshansi/p/6743780.html 前言看到最近大家都在用Tensor ...
统计学习方法：核函数（Kernel function）
作者:桂. 时间:2017-04-26 12:17:42 链接:http://www.cnblogs.com/xingshansi/p/6767980.html 前言之前分析的感知机.主成分分析( ...
统计学习方法学习（四）--KNN及kd树的java实现
K近邻法 1基本概念 K近邻法,是一种基本分类和回归规则.根据已有的训练数据集(含有标签),对于新的实例,根据其最近的k个近邻的类别,通过多数表决的方式进行预测. 2模型相关 2.1 距离的度量方式 ...
李航《统计学习方法》CH01
CH01 统计学方法概论前言章节目录统计学习监督学习基本概念问题的形式化统计学习三要素模型策略算法模型评估与模型选择训练误差与测试误差过拟合与模型选择正则化与交叉验证正则 ...
统计学习方法ｃ++实现之六支持向量机（SVM）及SMO算法
前言支持向量机(SVM)是一种很重要的机器学习分类算法,本身是一种线性分类算法,但是由于加入了核技巧,使得SVM也可以进行非线性数据的分类:SVM本来是一种二分类分类器,但是可以扩展到多分类,本篇不 ...

随机推荐

C语言链表全操作（增，删，改，查，逆序，递增排序，递减排序，链式队列，链式栈）
一,数据结构——链表全操作: 链表形式: 其中,每个节点(Node)是一个结构体,这个结构体包含数据域,指针域,数据域用来存放数据,指针域则用来指向下一个节点: 特别说明:对于单链表,每个节点(Nod ...
你喜欢使用eclipse+tomcat编程吗?!
在eclipse中配置tomcat简直是一场灾难! 开源软件确实给开发者极大的自由,但,同时也带来额外的麻烦. eclipse+tomcat只是其中之一.我有幸碰到了N次,在N+1次时,不得不提笔撰文 ...
Codevs 3233 古道
3233 古道时间限制: 1 s 空间限制: 8000 KB 题目等级:**白银 Silver** [传送门](http://codevs.cn/problem/3233/) 题目描述 Descri ...
OpenJudge/Poj 1657 Distance on Chessboard
1.链接地址: http://bailian.openjudge.cn/practice/1657 http://poj.org/problem?id=1657 2.题目: 总时间限制: 1000ms ...
Redis 3.0.2集群搭建以及相关问题汇总
Redis3 正式支持了 cluster,是为了解决构建redis集群时的诸多不便 (1)像操作单个redis一样操作key,不用操心key在哪个节点上(2)在线动态添加.删除redis节点,不用停止 ...
.net 反射访问私有变量和私有方法
以下为本次实践代码: using System; using System.Collections.Generic; using System.ComponentModel; using System ...
将UIImage保存到iOS照片库和对应程序沙盒中－b
1.保存到iOS照片库需要引入QuartzCore.framework框架,具体代码如下:.h文件#import <QuartzCore/QuartzCore.h>UIImageView ...
Word2003中如何使封面和目录中不插入页码
Word2003中如何使封面和目录中不插入页码?? 转载自: http://blog.zzedu.net.cn/user1/zhaoweijie/archives/2010/187266.html ...
hdu 1269
强连通分量题,用tarjin算法: 这是一道很简单的tarjin算法题,基本上就是套模板: 贴代码: #include<cstdio> #include<vector> #in ...
BOM的来源是不可能出现的字符，GB2312双字节高位都是1，Unicode理论的根本缺陷导致UTF8的诞生
Unicode字符编码规范 http://www.aoxiang.org 2006-4-2 10:48:02Unicode是一种字符编码规范 . 先从ASCII说起.ASCII是用来表示英文字符的 ...

统计学习方法——P1

统计学习方法——P1的更多相关文章

随机推荐

热门专题