最近重新看了一下概率论,感觉很多东西都遗忘了,还会陷入各种误区,赶紧的纠正回来。

概率论这块,主要内容包括:

事件、条件概率、随机变量、随机变量的分布函数、概率密度、联合分布、期望、方差、协方差。

我自己的误区总结:

1.事件和随机变量

首先要明确样本空间是所有可能发生的事件的集合,它由全部基本事件组成。而事件是基本时间的集合,是样本空间的子集,事件是固定的,或者说事件的概率是固定的(贝叶斯学派加入的先验概率先不考虑)。而随机变量一个映射,是从事件到实数的映射,随机变量表达了整个样本空间,描述了各种事件组合的可能,具备了期望方差等各种属性。所以,事件和随机变量是完全不同的概念,一静一动,不可搞混。

举个栗子,掷一个骰子一次,对应的基本事件就是骰子出现1的面、...、掷骰子出现6的面。基本事件是死的,他们的概率也是死的是1/6。针对一次骰子实验我们可以定义随机变量X,用X的实数值表达基本事件,比如X=1表示出现面1,X=6表示出现面6。

这样我们就去分开了事件和随机变量。

对于随机变量,有一个重要的概念就是累计分布函数(CDF,cumlative distribution function),用来表示随机变量概率分布的情况。显然累计分布函数正无穷大的极限是1,此外还有右连续、不递减等特型。

举个例子:

做两次抛硬币的实验,随机变量X表示正面出现的次数,显然,X=0,1,2,概率分别为:0.25,0.5,0.25. 其CDF如下:

代码如下:

>>> x = [-1, 0, 0, 1, 1, 2, 2, 3]
>>> y = [0, 0, 0.25, 0.25, 0.75, 0.75, 1, 1]
>>> fig = plt.figure()
>>> ax = plt.subplot()
>>> ax = plt.subplot(111)
>>> ax.plot(x,y)
[<matplotlib.lines.Line2D object at 0x10b5b4e10>]
>>> ax.set_ylim([-0.1, 1.1])
(-0.1, 1.1)
>>> ax.set_title("CDF plot")
<matplotlib.text.Text object at 0x10b59e950>
>>> plt.show()

1.2 条件概率的误区

实际上1.1理解了,1.2自然就理解了。就是随机事件的条件概率和随机变量的条件概率的区别。首先两者都可以计算条件概率,或者说条件概率本质山就是由事件的计算得到的。我的理解是,随机变量是数值转换后的条件概率,如果给定了数值,两者是等价的。但是随机变量是随机的,是动的,因此会存在条件概率分布等东东。所以两者还是不同的,依然是一静一动。

2.关于协方差

协方差是描述多个随机变量之间的关系的。如果两个随机变量是相互独立的,那他们的协方差或者相关系数是0,反之不成立。

考虑我们有m个样本,每个样本的特征数是n。那么我们可以将n个特征看成n个随机变量。每个随机变量都有m的实数值作为它的观测值,因此我们可以计算得到均值,方差。进而可以算出两两特征之间的协方差的。而这些协方差就够成了整个样本集的协方差矩阵。协方差矩阵很有用,特别是用在高斯分布的模型中的时候。

未完,待续。

跟着vamei复习概率论的更多相关文章

  1. FZU2132 - LQX的作业(概率论)

    Problem Description LQX在做作业时遇到一个难题不会做,请你帮她计算一下:在N个独立地分布于0和1之间的随机变量排为非递减顺序之后,这些变量中第M个小于等于x的概率是多少? Inp ...

  2. Beta版本冲刺Day3

    会议讨论: 628:已经将原本写在jsp中的所有界面修饰代码转移到了css文件中,同时当页面跳转的时候也不会出现崩溃的现象,并且已经解决了上次无法连接数据库的问题.但是又遇到了一些新的小问题,希望明天 ...

  3. R语言︱贝叶斯网络语言实现及与朴素贝叶斯区别(笔记)

    每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 一.贝叶斯网络与朴素贝叶斯的区别 朴素贝叶斯的 ...

  4. (ZT)算法杂货铺——分类算法之贝叶斯网络(Bayesian networks)

    https://www.cnblogs.com/leoo2sk/archive/2010/09/18/bayes-network.html 2.1.摘要 在上一篇文章中我们讨论了朴素贝叶斯分类.朴素贝 ...

  5. 搭建个人博客 github+hexo

    其实相关的教程网上有很多很多,不过就是很多很多,而且技术大神们每个人都写得不一样啊喂,为什么我明明就是一步一步按照教程来的还是有那么多乱七八糟的错?...所以我决定写此篇记录一下我搭建博客的过程以及我 ...

  6. ECNUOJ 2613 Gamma 函数

    Gamma 函数 Time Limit:1000MS Memory Limit:65536KBTotal Submit:237 Accepted:138 Description  Pollux最近在复 ...

  7. Linux下新手怎样将VIM配置成C++编程环境(能够STL自己主动补全)

    ~ 弄拉老半天,最终弄的几乎相同啦,果然程序猿还是须要有点折腾精神啊. 首先你要安装vim,命令:sudo apt-get install vim vim它仅仅是一个编辑器,它不是IDE(比方code ...

  8. CS229 机器学习课程复习材料-概率论

    本文是斯坦福大学CS229机器学习课程的基础材料,原始文件下载 原文作者:Arian Maleki , Tom Do 翻译:石振宇 审核和修改制作:黄海广 备注:请关注github的更新. CS229 ...

  9. 跟着百度学PHP[17]-复习PDO的几个关键词

    主要就是复习一下几个关键词.发现太久没有写又忘了.惭愧. final self static const

随机推荐

  1. MYSQL--表分区、查看分区(转)

    一.       mysql分区简介 数据库分区 数据库分区是一种物理数据库设计技术.虽然分区技术可以实现很多效果,但其主要目的是为了在特定的SQL操作中减少数据读写的总量以缩减sql语句的响应时间, ...

  2. lvs、haproxy、nginx 负载均衡的比较分析(转)

    原文:http://blog.csdn.net/gzh0222/article/details/8540604 对软件实现负载均衡的几个软件,小D详细看了一下,从性能和稳定上还是LVS最牛,基本达到了 ...

  3. 启动tomcat时为tomcat指定JDK

    背景:服务器环境:JDK1.7,Tomcat8 需求: 需要在Tomcat8部署项目,该项目需要运行在JDK1.8 将Tomcat8和JDK1.8上传至服务器,然后解压在指定目录下. 为tomcat指 ...

  4. Flask系列(十)自定义Form组件

    一.wtforms源码流程 1.实例化流程分析 # 源码流程 1. 执行type的 __call__ 方法,读取字段到静态字段 cls._unbound_fields 中: meta类读取到cls._ ...

  5. 深入跟踪MFC程序的执行流程

    来源: http://blog.csdn.net/ljianhui/article/details/8781991 在MFC程序设计的学习过程中最令人感到难受,甚至于有时会动摇学习者信心的就是一种对于 ...

  6. node的3大作用域

    除了持久性存储外,想要内存也可以存入数据,来做计算什么数据都存入访问一便数据库,效率就太低了 java有3大作用域request 指在一次请求的全过程中有效,即从http请求到服务器处理结束,返回响应 ...

  7. 27TCP

    TCP通信流程步骤: 服务端: 等待(被动)接收发送 1: 创建 socket:  socket() 2: 绑定端口:      bind() 3: 监听端口:      listen() 4: 接受 ...

  8. WLAN QOS

    1. 理解WLAN QOS 1.1       WLAN QOS简介 802.11的WLAN网络为用户提供了公平竞争无线资源的无线接入服务,但不同的应用需求对于网络的要求是不同的,而原始802.11网 ...

  9. 【PS技巧】创建2D对象的描边阴影

    在本场景中,怪物死亡掉落宝袋.所以在玩家眼里,宝袋是掉落在场景里,而不是像其他界面的UI元素,悬浮在场景上的. 所以,我们需要给宝袋添加阴影,增加它与场景之间的视觉过渡,比较简单的办法是使用阴影,正如 ...

  10. spring boot 使用属性加载顺序

    1.命令行中传入的参数 2.SPRING_APPLICATION_JSON中的属性.SPRING_APPLICATION_JSON是以JSON格式配置再系统环境变量中的内容 3.java:comp/e ...