超几何分布:

超几何分布基于这样一个模型,一个坛子中有N个球,其中m个白球,N-m个黑球,从中随机取n(不放回),令X表示取出来的白球数,那么:

我们称随机变量X满足参数为(n,m,M)的超几何分布。

考察其期望的求法:

几何分布:

在独立重复实验当中,每一次实验成功的概率是p,我们关注使得实验成功一次所需要重复的实验次数n及其对应的概率,很容易看到,我们有如下的分布列:

验证其作为分布列的性质:

几何分布的期望:

根据期望的定义,并在这里设q = 1-p

二项分布:

基于最基础的一个离散型随机变量——伯努利随机变量X,我们进行n次重复的实验,其概率分布结果就是所谓的二项分布。

具体点来说,就是某个实验成功的概率是p,现在我们进行n此时杨,设随机变量X表示n次实验后成功的次数,那么有如下分布列成立。

关于其期望,推导过程和几何分布、超几何分布中期望的推导是同质的,先推出X^k的表达式,然后根据二项式恒等关系,寻求自相似性建立递推关系,然后得到最终的期望值、方差。

关于二项分布概率值的单调性这里有这样一个命题:对于满足参数为(n,p)的二项随机变量,k取得[0,n]时,P{X=k}先递增,后递减,当k = (n+1)p时取得最大值。

基于我们最为熟悉的离散型分布——二项分布,我们能够衍生出很多别的分布列,对于之前介绍过的几何分布,我们赋予其的含义是:某个事件成功的概率是p,在n次独立重复实验中恰好成功一次的概率是多少。顺着这层含义,我们把1次编程r次,便得到了所谓的负二项分布。设负二项分布的随机变量是X,独立事件成功的概率是p,则在n次重复独立实验中恰好成功r次的概率是:

较之二项分布,我们能够看到,负二项分布更加强调n次重复实验中“恰好”成功r次,也就是要求第n次实验恰好是第r次成功的实验。

我们通过一个问题来进行举例——巴拿赫火柴问题。

Q:某个抽烟的数学家总是随身带着两盒火柴,一盒放在左边口袋一盒放在右边口袋。每次他需要火柴时,他就从任意的口袋中的火柴盒中取出一个火柴,现在两盒火柴中都各有N个火柴,那么请问他第一次发现其中一个盒子已经空了的时候,另一盒恰好有k根火柴的概率有多大?

分析:首先我们需要讨论的一个点是,这个火柴位于哪个口袋的火柴盒是空的,显然是左是右具有对称性,我们分析一种情况,进行平方即可。

假设左口袋为空,那么这个过程的最后一个步骤显然是在数学家第2N-k次取火柴的时候,必然取走了右口袋中的一根火柴,这是一位他拿走左口袋的最后一根火柴的时候,我们就可以默认理性的数学家不会再去拿左口袋的火柴盒,因此我们就可以将其与负二项分布联系起来:在2N-k次重复实验当中,恰好有N次从左口袋取出的概率。

当然,这道问题的最终结果是将这个概率平方。

负二项分布的期望:

直接推导是难以给出E[X]有关负二项分布的参数r、p的联系的,因此这里我们考虑建立递推关系。

结合之前复合随机变量的计算法则,我们在这里容易得到如下的等式。

从二项分布结合级数推导而来的泊松分布:

对于二项分布我们很熟悉,在生活当中我们也很常用,但是其计算公式不免显得有点繁琐,我们现进行如下的简化推导:

设某个二项分布的参数是(n,p),设置参数λ=np.随机变量为X.

同时结合几种极限求法,我们能够看到,当n趋近于无穷的时候,有:

因此我们得到:

这便是泊松分布列。容易看到,n趋近于无穷的二项分布可以与泊松分布等价,如果基于n趋近于无穷,我们可以验证泊松分布的作为分布列的一个性质:

泊松分布的数字特征:

下面讨论泊松分布的期望和方差。

Ps:推导过程用到了泰勒级数的展开式,具体的内容笔者在《托马斯大学微积分》的专栏中会给出。

《A First Course in Probability》-chape4-离散型随机变量-几种典型分布列的更多相关文章

  1. 【概率论与数理统计】小结3 - 一维离散型随机变量及其Python实现

    注:上一小节对随机变量做了一个概述,这一节主要记录一维离散型随机变量以及关于它们的一些性质.对于概率论与数理统计方面的计算及可视化,主要的Python包有scipy, numpy和matplotlib ...

  2. 开始讨论离散型随机变量吧!《考研概率论学习之我见》 -by zobol

    上一文中,笔者给出了随机变量的基本定义:一个可测映射,从结果空间到实数集,我们的目的是为了引入函数这个数学工具到考研概率论中,但是我们在现实中面对的一些事情结果,映射而成的随机变量和其对应的概率值,并 ...

  3. 今天来学习一下MySQl的 临时表,变量,行转列,预处理的一些相关技术的使用!

    先来简单了解一下MySQL数据库有意思的简介 MySQL这个名字,起源不是很明确.一个比较有影响的说法是,基本指南和大量的库和工具带有前缀“my”已经有10年以上, 而且不管怎样,MySQL AB创始 ...

  4. 概率的基本概念&离散型随机变量

    使用excel可以直接计算二项分布和超几何分布:

  5. IOS基础——实例变量四种范围类型

    1.为了强制一个对象隐藏其数据,编译器限制实例变量范围以限制其在程序中的可见性. 但是为了提供灵活性,苹果也让开发者显示设置范围(四选一). 2.四种编译指令如下: @private 实例变量只能被声 ...

  6. 微软BI 之SSIS 系列 - 变量查询语句引起列输出顺序不一致的解决方法

    开篇介绍 这个问题来自于 天善BI社区,看了一下比较有意思,因为我自己认为在 SSIS中处理各种类型文件的经验还比较丰富(有一年的时间几乎所有ETL都跟文件相关),但是这个问题确实之前没有特别考虑过. ...

  7. Java学习笔记之linux配置java环境变量(三种环境变量)

    0x00 压安装jdk 在shell终端下进入jdk-6u14-linux-i586.bin文件所在目录, 执行命令 ./jdk-6u14-linux-i586.bin 这时会出现一段协议,连继敲回车 ...

  8. C结构体变量2种运算(比如链表的结点)(区别与java)

    a结构体变量,只能做两种运算, 整体引用(赋值,参数传递) 或访问成员(点运算—地址方式简化,地址方式)(见最后的图片) case万: 结论:java里面的class Node : Node p; p ...

  9. 如何在sed中使用变量,两种方法

    第一 在sed条件中是不认识变量取值的 sed '/$x/d' test 所以要想它能够识别变量 sed "/$x/d/" test 方法简单就是把"单引号"变 ...

随机推荐

  1. C程序的构成及动态内存分配

    对一个程序,通常的理解就是,源码编译成机器代码,然后通过机器解释运行.不过是怎样编译成机器代码,和怎样运行的,无疑是个值得探讨的问题.怎样编译成机器代码,过程就是源码的编译.链接,编译器做了这些事.而 ...

  2. HTTP协议-标签简介

    这个系列的文章要讨论的是如何通过ASP.net服务器端技术来优化客户端缓存策略,而且让这种策略变得可配置和可扩展.我们要了解的知识从HTTP协议中相关属性对客户端缓存的影响,到ASP.NET如何控制这 ...

  3. jquery中onclick="fn"中$(this)所代表的对象

    jquery中onclick="fn"中$(this)所代表的对象 js方法 function qiehuan(){ var src = $(this).attr("da ...

  4. django 自定义标签

    Context和RequestContext都能被Template 进行render RequestContext类接受reqest,字典,processors 实例化.并被TEMPLATE_CONT ...

  5. windows2003网络负载平衡设置

    问题 随着计算机技术的不断发展,单台计算机的性能和可靠性越来越高.但现实中还是有许多应用是单台计算机难以达到,例如: 1.银行存储用户数据的数据库服务器必须保证24小时不间断的运转,并在发生严重硬件故 ...

  6. 一个简单的makefile,一次性编译本文件夹下所有的cpp文件

    代码: CXX := g++ CFLAGS := -g TARGET := xxx.exe SRCS := $(wildcard *.cpp) OBJS := $(patsubst %cpp,%o,$ ...

  7. OC中格式化输出符号

    定义 说明 %@ Objective-C object, printed as the string returned by descriptionWithLocale: if available, ...

  8. 用Cornerstone配置SVN

    iOS 用CornerStone配置SVN,HTTP及svn简单使用说明 分类: iOS / OC2014-11-11 11:19 3149人阅读 评论(0) 收藏 举报   目录(?)[+]   转 ...

  9. 3G? 2G? 2.5G? 4G? 与 WIFI, GPRS,CDMA 3G无线上网

    首先说说无线上网有哪几种形式? WIFI, GPRS, CDMA 3G无线上网 1>wifi全称wireless fidelity,是当今使用最广的一种无线网络传输技术.实际上就是把有线网络信号 ...

  10. 【BZOJ1901】 Zju2112 Dynamic Rankings(树套树)

    [题意] 给定一个含有n个数的序列a[1],a[2],a[3]--a[n], 程序必须回答这样的询问:对于给定的i,j,k,在a[i],a[i+1],a[i+2]--a[j]中第k小的数是多少(1≤k ...