PRML Chapter 1. Introduction

为了防止忘记,要把每章的重要内容都记下来,从第一章开始

2012@3@28
今天又回去稍微翻了一下第一章内容,发现第一次看的时候没有看透,每次翻都能翻出新的内容和感悟来。这主要得益于后面其他书里看到的一些内容后,再来看前面的某些话,就知道这些话不是白写的了,而是每一句都有一些深层的意义。

因此对于PRML这样的书,看一两遍是不够的,有空要多回翻

P 2

generalization的定义:The
ability to categorize correctly new examples that differ from those used for training is known as generalization

P3

1) classification 和 regression 的区别:classification的目标结果是有限的(finite),离散的(discrete),而regression的目标结果是连续的(continuous)

2) 无监督学习的目标一般可以是:聚类、密度估计(density estimation)或降维(高维降成2、3维)以可视化(visualization)

3) exploration 和 exploitation 的区别:exploration
是开发未知领域,而exploitation 是利用已知状态

P10

regularization 作者提到在E(w)(这个函数名字现在忘记了,到时想起来改正)上添加一项|W|^2,就能避免w中的值过大导致over-fitting,这就是regularization
的作用。Wikipedia的解释:In mathematics and statistics,
particularly in the fields of machine
learning
 and inverse
problems
, regularization involves
introducing additional information in order to solve an ill-posed
problem
 or to prevent overfitting.

Shrinkage  的概念,在Wiki中有http://en.wikipedia.org/wiki/Shrinkage_(statistics)

1.4 The Curse of Dimensionality

维度灾难就是,当输入数据的维数增大时,大部分数据的位置都将趋于整个数据空间的边缘。

直观的讲,当一个输入向量为v(x1, x2,  … , xn),有n维输入时,其实只要其中任意一个xi的值偏大,那么这个点就会处于整个数据空间的边缘位置,而对所有xi都比较小的可能性是很小的。

用书中P36页的定性描述可以表示为,在D维空间中一个直径为r=1的球体(sphere  超球体:hypersphere)体积,以及一个直径为r=1-ε与直径为r=1之间的空隙的体积,这两个体积的比值来说明维度灾难

如下图:

对于直径为r的超球体体积可以表示为VD(r)=KDrD,其中KD是一个只和D相关的常数,那么如下比例:

vp : VD(1)−VD(1−ϵ)VD(1)

就是ε那个空隙的体积和整个直径为r的超球体的体积之比。

我们可以发现,对于二维的圆,ε如果小,那么中间那个r=1-ε的圆的面积就会很大,导致整个vp的值很小。如ε=0.1时,vp=1−(1−0.1)2=0.19,所以ε那个环只占整个面积的19%

但是如果D很大很大呢,这时我们就会发现,即使ε很小很小,但是vp也会趋近于1,就是说在高维超球体中,ε的那个环的体积即使在ε很小的情况下,也会占据超球体的大多数体积,所以整个超球体中的大多数点都分布在整个超球体的边缘!

不过我还不是很明白具体应用中维度灾难导致的后果,要继续仔细看。

P43

discriminative models vs. generative models。书中43页排列了三种由复杂到简单的模型:

(a) generative
models
 同时对输入和输出数据进行建模,设x为输入特征,Ck为第k个输出类别,那么所求后验概率为 p(Ck|x)。

贝叶斯公式如下:p(Ck|x)=p(x|Ck)p(Ck)p(x)

那么产生式模型就要对每一对p(x|Ck)估计概率密度,同时再估计p(Ck)的单独概率密度(先验),而p(x)可由p(x)=∑kp(x|Ck)p(Ck)得到

或者产生式模型还可以直接估计p(x,Ck),我的理解就是枚举所有x和Ck的派对出现的概率。

今天才大致理解了何为产生式模型,所以产生式模型有如下典型(从大禹姐那里抄来的),从上述角度看,就可以知道为啥朴素贝叶斯是典型的产生式模型啦。

(b) discriminative
models
  判别式模型直接对p(Ck|x)建模,而不估计p(x|Ck)的概率密度。因此这就是传说中的“判别式模型估计条件概率”。

most discriminative models are inherently supervised and
cannot easily be extended to unsupervised
learning

判别式模型大概有:

(c) 最简单的模型,找一个
discriminant function f(x),直接将输入 x 映射为输入类别 Ck ,就是说,这个方法甚至不计算p(Ck|x)而直接得出答案Ck。

至此第一章大致看完,2012年3月1日,22:10

PRML Chapter 1. Introduction的更多相关文章

  1. PRML Chapter 2. Probability Distributions

    PRML Chapter 2. Probability Distributions P68 conjugate priors In Bayesian probability theory, if th ...

  2. JVM Specification 9th Edition (2) Chapter 1. Introduction

    Chapter 1. Introduction 翻译太累了,我就这样的看英文吧. 内容列表 1.1. A Bit of History 1.2. The Java Virtual Machine 1. ...

  3. TIJ——Chapter One:Introduction to Objects

    ///:~容我对这个系列美其名曰"读书笔记",其实shi在练习英文哈:-) Introduction to Objects Object-oriented programming( ...

  4. PRML读书笔记——Introduction

    1.1. Example: Polynomial Curve Fitting 1. Movitate a number of concepts: (1) linear models: Function ...

  5. Chapter 1. Introduction gradle介绍

      We would like to introduce Gradle to you, a build system that we think is a quantum leap for build ...

  6. Chapter 3 Introduction to Objects and Input/Output

    与声明一个primitive variable不同,声明一个对象的时候,并不创建用来存储一个对象的内存空间,而是创建了一个存储该对象所在内存空间的地址. 在java里,new是一个操作符,它让系统分配 ...

  7. Logback手冊 Chapter 1: Introduction

    翻译不周,多多包括 ---------------------------------------------------------------------------------------切割线 ...

  8. translation of 《deep learning》 Chapter 1 Introduction

    原文: http://www.deeplearningbook.org/contents/intro.html Inventors have long dreamed of creating mach ...

  9. Java Concurrency In Practice - Chapter 1 Introduction

    1.1. A (Very) Brief History of Concurrency motivating factors for multiple programs to execute simul ...

随机推荐

  1. es2自动发现插件

    https://www.elastic.co/guide/en/elasticsearch/plugins/current/discovery-multicast-usage.html http:// ...

  2. 自己写的AES和RSA加密解密工具

    package com.sdyy.common.utils; import java.security.Key; import java.security.KeyFactory; import jav ...

  3. 去他的效应(what-the-hell effect)与自我放纵

    去他的 效应(what-the-hell effect)与自我放纵 为什么写这篇文章: 对于我来说,但我感到疲惫——"无意拿起"手机,对自己说"随便看看"——但 ...

  4. 解决SaveChanges会Hold住之前的错误的问题

    问题描述: 在一次新增操作中,由于有一个必填字段忘记写了,然后直接点击提交,运行到savechanges的地方,程序报错,提示***字段为必填字段. 然后关掉页面,重新填写一次,这次什么都填写上了,一 ...

  5. 面试准备(二) 绘制 Activity 的生命流程图

    我们来看一下这一张经典的生命周期流程图: 相信不少朋友也已经看过这个流程图了,也基本了解了Activity生命周期的几个过程,我们就来说一说这几个过程. 1.启动Activity:系统会先调用onCr ...

  6. Linux常用指令---工作

    查看所有用户cat /etc/passwd 复制整个目录cp -ri A/B/* A1/B1/ 若复制过程中询问是否覆盖,输入y按回车 另外若A A1不在同一目录下,最好填绝对路径,就是/xxx/xx ...

  7. 学习Shell脚本编程(第4期)_在Shell程序中的使用变量

    变量的赋值 变量的访问 变量的输入 4.1 变量的赋值     在Shell编程中,所有的变量名都由字符串组成,并且不需要对变量进行声明.要赋值给一个变量,其格式如下: 变量名=值  注意: 等号(= ...

  8. win10快捷键大全 win10常用快捷键

    win10快捷键大全大家可以来了解一下,今天小编带来了win10常用快捷键,很多朋友喜欢使用快捷键来操作电脑,那么Windows10系统有哪些新的快捷键呢• 贴靠窗口:Win +左/右> Win ...

  9. Android开发的那些坑和小技巧

    1.android:clipToPadding 意思是控件的绘制区域是否在padding里面.默认为true.如果你设置了此属性值为false,就能实现一个在布局上事半功陪的效果.先看一个效果图. 上 ...

  10. java通过地址获取主机名

    关键代码: try { String str=Chat.getJt().getText().toString();//获取输入内容 String[] ipstr=str.split("[.] ...