PRML读书笔记

一、基本名词

泛化(generalization)

训练集所训练的模型对新数据的适用程度。

监督学习(supervised learning)

训练数据的样本包含输入向量以及对应的目标向量。

分类( classification ):给每个输入向量分配到有限数量离散标签中的一个。
回归( regression ):输出由一个或者多个连续变量组成。

无监督学习(unsupervised learning)

训练数据由一组输入向量 x 组成,没有任何对应的目标值。

聚类(clustering):发现数据中相似样本的分组。
密度估计(density estimation):决定输入空间中数据的分布。

反馈学习(reinforcement learning)

在给定的条件下,找到合适的动作,使得奖励达到最大值。学习问题没有给定最优输出的用例。这些用例必须在一系列的实验和错误中被发现。
反馈学习的一个通用的特征是探索( exploration )和利用( exploitation )的折中,过分地集中于探索或者利用都会产生较差的结果。

探索:是指系统尝试新类型的动作,
利用:是指系统使用已知能产生较高奖励的动作。

二、概率论

1.概率论的两个基本规则:加和规则( sumrule )、乘积规则( product rule )

2.贝叶斯定理( Bayes' theorem )

贝叶斯定理中的分母可以用出现在分子中的项表示:

先验概率( prior probability ):$p(Y)$ 在未知$X$分布时，我们已知$Y$分布，顾称$p(Y)$为先验。
后验概率( posterior probability ):$p(Y|X)$ 在得知$X$分布后，加入$p(X)$的约束可以的到条件概率$p(Y|X)$，称之为后验。

3.概率密度

概率密度( probability density )

满足下面两个条件:

一个变量的变化$x = g(y)$ , 那么函数$f (x)$就变成了$ f ̃ (y) = f (g(y))$

累积分布函数( cumulative distribution function )

概率密度函数加和规则和乘积规则

4.期望和协方差

期望( expectation )

离散变量

连续变量

方差( variance )

可以化为：

协方差( covariance )

协方差是对两个随机变量 x 和 y而言：

在两个随机向量 x 和 y 的情形下,协方差是一个矩阵：

PRML读书笔记_绪论的更多相关文章

PRML读书笔记_绪论曲线拟合部分
一.最小化误差函数拟合正则化( regularization )技术涉及到给误差函数增加一个惩罚项,使得系数不会达到很大的值.这种惩罚项最简单的形式采用所有系数的平方和的形式.这推导出了误差函数的修 ...
PRML读书笔记——3 Linear Models for Regression
Linear Basis Function Models 线性模型的一个关键属性是它是参数的一个线性函数,形式如下: w是参数,x可以是原始的数据,也可以是关于原始数据的一个函数值,这个函数就叫bas ...
PRML读书笔记——机器学习导论
什么是模式识别(Pattern Recognition)? 按照Bishop的定义,模式识别就是用机器学习的算法从数据中挖掘出有用的pattern. 人们很早就开始学习如何从大量的数据中发现隐藏在背后 ...
『TensorFlow』读书笔记_进阶卷积神经网络_分类cifar10_上
完整项目见:Github 完整项目中最终使用了ResNet进行分类,而卷积版本较本篇中结构为了提升训练效果也略有改动本节主要介绍进阶的卷积神经网络设计相关,数据读入以及增强在下一节再与介绍网络相关 ...
『TensorFlow』读书笔记_进阶卷积神经网络_分类cifar10_下
数据读取部分实现文中采用了tensorflow的从文件直接读取数据的方式,逻辑流程如下, 实现如下, # Author : Hellcat # Time : 2017/12/9 import os ...
PRML读书笔记——线性回归模型（上）
本章开始学习第一个有监督学习模型--线性回归模型."线性"在这里的含义仅限定了模型必须是参数的线性函数.而正如我们接下来要看到的,线性回归模型可以是输入变量$x$的非线性函数. ...
The Way to Go读书笔记_第4章_基本结构和基本数据类型
“_”标识符 _ 本身就是一个特殊的标识符,被称为空白标识符.它可以像其他标识符那样用于变量的声明或赋值(任何类型都可以赋值给它),但任何赋给这个标识符的值都将被抛弃,因此这些值不能在后续的代码中使用 ...
PRML读书笔记——2 Probability Distributions
2.1. Binary Variables 1. Bernoulli distribution, p(x = 1|µ) = µ 2.Binomial distribution + 3.beta dis ...
PRML读书笔记——Introduction
1.1. Example: Polynomial Curve Fitting 1. Movitate a number of concepts: (1) linear models: Function ...

随机推荐

用OpenSCAD設計特製的遊戲骰子
一開始先製作一個簡單的立方體.定義一個變量「cube_size」,然後使用下圖的立方體程式.center=true的設定可讓立方體位於起始模型的正中央. 為你在OpenSCAD創造的物體加上不同顏色是 ...
ftp、ssh
ftp.ssh都是网络传输的协议,两者一般用来访问服务器,支持ftp的服务器称为ftp服务器,支持ssh的服务器称为ssh服务器. 说白了就是不同的访问方式,ssh更加安全,有相应的密匙 https: ...
[转]Qt 之 QFileSystemWatcher
简述 QFileSystemWatcher类用于提供监视文件和目录修改的接口. QFileSystemWatcher通过监控指定路径的列表,监视文件系统中文件和目录的变更. 调用addPath()函数 ...
ubuntu root 密码是随机的！ root权限下设置共享文件夹
一.Ubuntu的默认root密码是随机的,即每次开机都有一个新的root密码.我们可以在终端输入命令 sudo passwd,然后输入当前用户的密码,enter, 二.终端会提示我们输入新的密码并确 ...
数据库sql的in操作，解决in的过多
一个sql的拼写后,服务器会把这个sql传送到数据库服务器执行,一般不在一个物理机上.那么传送需要走网络,包丢失等网络情况就可能出现. 一般情况,一个sql的长度不会很大,但是有种这样的情况.in操作 ...
【转】js 获取浏览器高度和宽度值(多浏览器
原文地址:http://www.jb51.net/article/19844.htm js获取浏览器高度和宽度值,尽量的考虑了多浏览器. IE中: document.body.clientWidth ...
谈高清显示接口HDMI、RGB、LVDS、MIPI、eDP、mini-LVDS、V-By-One
近年来随着电子产业的高速发展,智能显示设备也取得了辉煌的成就,高清显示得到了消费者的青睐.目前高清显示协议接口有RGB.LVDS.MIPI.eDP.HDMI.miniLVDS.V-by-One等,由于 ...
SQL Server聚合函数与聚合开窗函数（转载）
以下面这个表的数据作为示例. 什么是聚合函数?聚合函数:聚合函数就是对一组值进行计算后返回单个值(即分组).聚合函数在计算时都会忽略空值(null).所有的聚合函数均为确定性函数.即任何时候使用一组相 ...
LOJ6089 小Y的背包计数问题背包、根号分治
题目传送门题意:给出$N$表示背包容量,且会给出$N$种物品,第$i$个物品大小为$i$,数量也为$i$,求装满这个背包的方案数,对$23333333$取模.$N \leq 10^5$ $23333 ...
linux配置iptables(3)
简单通用 web 服务器iptables 配置 *filter :INPUT DROP [0:0]:FORWARD DROP [0:0]:OUTPUT ACCEPT [0:0] #超出链规则的数据 ...

PRML读书笔记_绪论