概率与统计推断第一讲homework

1. 假设在考试的多项选择中，考生知道正确答案的概率为$p$，猜测答案的概率为$1-p$，并且假设考生知道正确答案答对题的概率为1，猜中正确答案的概率为$\frac{1}{m}$，其中$m$为多选项的数目。那么已知考生答对题目，求他知道正确答案的概率。

记事件$A$为考生答对题，事件$B$为考生知道正确答案。则有：

考生知道正确答案的概率 $P(B) = p$

考生在知道正确答案的情况下答对题的概率 $P(A|B) = 1$

考生在不知道正确答案的情况下猜中答案的概率 $P(A|\bar{B}) = \frac{1}{m}$

根据贝叶斯公式：

\begin{align*}
P(B|A) &= \frac{P(B)\cdot P(A|B)}{P(B)\cdot P(A|B)+P(\bar{B})\cdot P(A|\bar{B})} \\
&= \frac{p}{p+(1-p)\cdot \frac{1}{m}}
\end{align*}

2. 假设硬币正面向上的概率为$p$。我们抛掷硬币$N$次，令$X$表示正面向上的次数，则$X$为一个二项分布的随机变量。我们直观感觉$X$应该和$N_{p}$很接近。为了验证该结论是否正确，我们重复多次试验，取$X$的平均值，比较$X$的平均值和$N_{p}$的接近程度。比较$p=0.3,N=10,100,1000$和$p=0.03,N=10,100,1000$。给出试验次数$N$与正面向上比率的函数图。

这道题先不做了

4、理解抽样分布（sampling distribution）。令$X_{1},\cdots X_{N}$为独立同分布样本（IID），其均值和方差分别为$\mu $和$\sigma ^{2}$。则样本均值为

$\bar{X}_{N} = \frac{1}{N}\sum_{N}^{i=1}X_{i}$为一统计量，是数据的函数。由于$\bar{X}_{N}$也是随机变量，因此也可对其进行分布进行描述，该分布称为统计量的抽样分布。请不要将$X_{i}$的分布函数$p_{X}$与$\bar{X}_{N}$的分布$p_{\bar{X}_{N}}$混淆。为了更清楚地认识到这一点，我们假设$X_{1},\cdots ,X_{N} \sim Unif[0,1]$，画出$p_{X}$。

(1) 计算理论的$E(\bar{X}_{N})$和$V(\bar{X}_{N})$，分析并画出当N 变化时二者的变化。

(2) 模拟得到$\bar{X}_{N}$的分布。取$N = 5, 10, 25, 50, 100$，从$X_{1},\cdots ,X_{N} \sim Unif[0,1]$得到$N$个样本，计算$\bar{X}_{N} = \frac{1}{N}\sum_{N}^{i=1}X_{i}$得到$\bar{X}_{N}$的一个样本。上述过程重复100 次，可得到$\bar{X}_{N}$的100 个样本。计算100 个$\bar{X}_{N}$样本的样本均值$\hat{\mu }_{\bar{X}_{N}} = \frac{1}{100}\sum_{i=1}^{100}\bar{X}_{Ni}$作为$E(\bar{X}_{N})$的估计，100 个$\bar{X}_{N}$样本的样本方差${\hat{\sigma }_{\bar{X}_{N}}}^{2} = \frac{1}{100}\left \{ \sum_{i=1}^{100}\bar{X}_{Ni} - \hat{\mu }_{\bar{X}_{N}} \right \}^{2}$作为 $V(\bar{X}_{N})$的估计，观察该估计值与(1)中理论值的差异。当N 变化时，该差异有何变化规律？

（1）、

\begin{align*}
E(\bar{X}) &= E(\frac{1}{n}\sum X_{i}) &\cdots\cdots\cdots (1) \\
&= \frac{1}{n}E(\sum X_{i}) &\cdots\cdots\cdots (2) \\
&= \frac{1}{n}\sum E(X_{i}) &\cdots\cdots\cdots (3) \\
&= (\frac{1}{n})n\mu &\cdots\cdots\cdots (4) \\
&= \mu &\cdots\cdots\cdots (5)
\end{align*}

其中，(2)由期望的性质可得。(3)由多维随机变量期望的性质可得（可参考茆诗松版《概率论与数理统计》167页）。

\begin{align*}
V(\bar{X}) &= V(\frac{1}{n}\sum X_{i}) &\cdots\cdots\cdots (1) \\
&= \frac{1}{n^{2}}V(\sum X_{i}) &\cdots\cdots\cdots (2) \\
&= \frac{1}{n^{2}}\sum V(X_{i}) &\cdots\cdots\cdots (3) \\
&= (\frac{1}{n^{2}})n\sigma ^{2} &\cdots\cdots\cdots (4) \\
&= \frac{\sigma ^{2}}{n} &\cdots\cdots\cdots (5)
\end{align*}

其中，(2)由方差的性质可得。(3)由相互独立的多维随机变量的方差计算性质可得（可参考茆诗松版《概率论与数理统计》168页）。

（2）、

在python中取随机数来模拟均匀分布，完成题目要求的实验，代码如下：

from numpy import random

import numpy as np

# 获取独立同均匀分布样本的均值

# para size 样本数量

def get_sample_average(size):

    sample = random.rand(size)

    return sample.sum()/size

for N in [5, 10, 25, 50, 100, 200, 500, 800, 1000]:

    # 定义均值的样本空间

    averageSample = []

    # 按照题目要求，实验重复100次

    for i in range(0, 100):

        averageSample.append(get_sample_average(N))

    averageSample = np.array(averageSample)

    print("N = %d，expectation = %f，variance = %f" % (N, averageSample.mean(), averageSample.var()))

　　运行结果：　　

N = 5，expectation = 0.503940，variance = 0.015760
N = 10，expectation = 0.496493，variance = 0.010882
N = 25，expectation = 0.502530，variance = 0.003558
N = 50，expectation = 0.501409，variance = 0.001528
N = 100，expectation = 0.501081，variance = 0.000786
N = 200，expectation = 0.500667，variance = 0.000415
N = 500，expectation = 0.501198，variance = 0.000164
N = 800，expectation = 0.500096，variance = 0.000118

由运行结果可知，随着N的增大，$E(\bar{X}_{N})$在0.5附近浮动。由于N相差没有足够的大，并没做到$E(\bar{X}_{N})$越来越接近于0.5。但方差是越来越小，趋近于0

概率与统计推断第一讲homework的更多相关文章

概率与统计推断第二讲homework
作业目的: 体会条件独立 1.现需要设计一个根据一个人是否是学生$S$(布尔变量)和其体重$W$(连续变量)判断该人的性别$G$(布尔变量).假设在给定$G$的情况下$S$和$W$独立,且假设概率分布 ...
Stanford概率图模型：第一讲有向图-贝叶斯网络
原文链接(系列):http://blog.csdn.net/yangliuy/article/details/8067261 概率图模型(Probabilistic Graphical Model)系 ...
干货|漫画算法：LRU从实现到应用层层剖析（第一讲）
今天为大家分享很出名的LRU算法,第一讲共包括4节. LRU概述 LRU使用 LRU实现 Redis近LRU概述第一部分:LRU概述 LRU是Least Recently Used的缩写,译为最近最 ...
CS193P - 2016年秋第一讲课程简介
Stanford 的 CS193P 课程可能是最好的 ios 入门开发视频了.iOS 更新很快,这个课程的最新内容也通常是一年以内发布的. 最新的课程发布于2016年春季.目前可以通过 iTunes ...
POI教程之第一讲：创建新工作簿， Sheet 页，创建单元格
第一讲 Poi 简介 Apache POI 是Apache 软件基金会的开放源码函数库,Poi提供API给java程序对Microsoft Office格式档案读和写的功能. 1.创建新工作簿,并给工 ...
《ArcGIS Engine+C#实例开发教程》第一讲桌面GIS应用程序框架的建立
原文:<ArcGIS Engine+C#实例开发教程>第一讲桌面GIS应用程序框架的建立摘要:本讲主要是使用MapControl.PageLayoutControl.ToolbarCon ...
32位汇编第一讲x86和8086的区别,以及OllyDbg调试器的使用
32位汇编第一讲x86和8086的区别,以及OllyDbg调试器的使用一丶32位(x86也称为80386)与8086(16位)汇编的区别 1.寄存器的改变 AX 变为 EAX 可以这样想,16位通 ...
异常处理第一讲(SEH),筛选器异常,以及__asm的扩展,寄存器注入简介
异常处理第一讲(SSH),筛选器异常,以及__asm的扩展博客园IBinary原创博客连接:http://www.cnblogs.com/iBinary/ 转载请注明出处,谢谢一丶__Asm的 ...
常见注入手法第一讲EIP寄存器注入
常见注入手法第一讲EIP寄存器注入博客园IBinary原创博客连接:http://www.cnblogs.com/iBinary/ 转载请注明出处,谢谢鉴于注入手法太多,所以这里自己整理一下, ...

随机推荐

cocos2d-x 游戏开发之有限状态机(FSM) (二)
cocos2d-x 游戏开发之有限状态机(FSM) (二) 1 状态模式
saiku应用的调试
ubuntu下解压saiku包后使用: 运行.sh命令(.bat是windows命令).运行时注意权限.可以先chmod a+x *.sh 提示,catali?.sh出错. 这是tomcat的一个文件 ...
android查看源码的时候看不了
原因:未关联android中jar包源码解决方案:导入sdk---->>resource---->>api 这样就可以在代码中查看源码了.
Android NFC开发（一）——初探NFC，了解当前前沿技术
Android NFC开发(一)--初探NFC,了解当前前沿技术官方文档:http://developer.android.com/guide/topics/connectivity/nfc/ind ...
Android开发技巧——使用Dialog实现仿QQ的ActionSheet菜单
最近看到有人用Dialog来实现QQ的仿ActionSheet的自定义菜单,对于自己没实现过的一些控件,看着也想实现一下.于是动手了一下,发现也不难,和大家分享一下. 本文原创,转载请注明出处:htt ...
XMPP系列(五）---文件传输
xmpp中发送文件和接收文件的处理有些不太一样,接收文件处理比较简单,发送稍微复杂一些. 首先需要在XMPPFramework.h中添加文件传输类 //文件传输 //接收文件 #import &quo ...
11个超棒的iOS开发学习网站
原文:11 Insanely Great iOS Developers Sites 永不止步地向他人学习我相信,要想从一个"还不错"的人变成一个卓越的人,我们需要不停地向他人学习 ...
存储引擎-Bitcast
Bitcast是一种日志型的基于hash表结构的健值对的存储系统,最早追溯于Riak分布式数据库. 目前,Berkeley DB,Tokyo Cabinet,Innostore都使用了这种存储引擎.使 ...
Xcode使用心得01:断点中断问题和调整编译目标
在obj-c系列博文里,我们粗浅的介绍了obj-c的一些语法以及F库中的一些标准类的使用,但是实际编写拿得出手的APP还是得老老实实在os x上用Xcode写啊!最近上网无意中发现还有支持os x和i ...
ruby读取源代码自身的一种方法
我们知道ruby中如果源代码中一行开头(必须在行的开头)有__END__标示,则表示下面的都是数据行,可以用IO对象DATA来访问这些行.但是如果我们用DATA.rewind一下的话,就可以将文件流指 ...

概率与统计推断第一讲homework

概率与统计推断第一讲homework的更多相关文章

随机推荐

热门专题