1. 假设在考试的多项选择中,考生知道正确答案的概率为$p$,猜测答案的概率为$1-p$,并且假设考生知道正确答案答对题的概率为1,猜中正确答案的概率为$\frac{1}{m}$,其中$m$为多选项的数目。那么已知考生答对题目,求他知道正确答案的概率。

记事件$A$为考生答对题,事件$B$为考生知道正确答案。则有:

考生知道正确答案的概率 $P(B) = p$

考生在知道正确答案的情况下答对题的概率 $P(A|B) = 1$

考生在不知道正确答案的情况下猜中答案的概率 $P(A|\bar{B}) = \frac{1}{m}$

根据贝叶斯公式:

\begin{align*}
P(B|A) &= \frac{P(B)\cdot P(A|B)}{P(B)\cdot P(A|B)+P(\bar{B})\cdot P(A|\bar{B})} \\
&= \frac{p}{p+(1-p)\cdot \frac{1}{m}}
\end{align*}

2. 假设硬币正面向上的概率为$p$。我们抛掷硬币$N$次,令$X$表示正面向上的次数,则$X$为一个二项分布的随机变量。我们直观感觉$X$应该和$N_{p}$很接近。为了验证该结论是否正确,我们重复多次试验,取$X$的平均值,比较$X$的平均值和$N_{p}$的接近程度。比较$p=0.3,N=10,100,1000$和$p=0.03,N=10,100,1000$。给出试验次数$N$与正面向上比率的函数图。

这道题先不做了

4、 理解抽样分布(sampling distribution)。令$X_{1},\cdots X_{N}$为独立同分布样本(IID),其均值和方差分别为$\mu $和$\sigma ^{2}$。则样本均值为

$\bar{X}_{N} = \frac{1}{N}\sum_{N}^{i=1}X_{i}$为一统计量,是数据的函数。由于$\bar{X}_{N}$也是随机变量,因此也可对其进行分布进行描述,该分布称为统计量的抽样分布。请不要将$X_{i}$的分布函数$p_{X}$与$\bar{X}_{N}$的分布$p_{\bar{X}_{N}}$混淆。为了更清楚地认识到这一点,我们假设$X_{1},\cdots ,X_{N} \sim Unif[0,1]$,画出$p_{X}$。

(1) 计算理论的$E(\bar{X}_{N})$和$V(\bar{X}_{N})$,分析并画出当N 变化时二者的变化。

(2) 模拟得到$\bar{X}_{N}$的分布。取$N = 5, 10, 25, 50, 100$,从$X_{1},\cdots ,X_{N} \sim Unif[0,1]$得到$N$个样本,计算$\bar{X}_{N} = \frac{1}{N}\sum_{N}^{i=1}X_{i}$得到$\bar{X}_{N}$的一个样本。上述过程重复100 次,可得到$\bar{X}_{N}$的100 个样本。计算100 个$\bar{X}_{N}$样本的样本均值$\hat{\mu }_{\bar{X}_{N}} = \frac{1}{100}\sum_{i=1}^{100}\bar{X}_{Ni}$作为$E(\bar{X}_{N})$的估计,100 个$\bar{X}_{N}$样本的样本方差${\hat{\sigma }_{\bar{X}_{N}}}^{2} = \frac{1}{100}\left \{ \sum_{i=1}^{100}\bar{X}_{Ni} - \hat{\mu }_{\bar{X}_{N}} \right \}^{2}$作为 $V(\bar{X}_{N})$的估计,观察该估计值与(1)中理论值的差异。当N 变化时,该差异有何变化规律?

(1)、

\begin{align*}
E(\bar{X}) &= E(\frac{1}{n}\sum X_{i}) &\cdots\cdots\cdots (1) \\
&= \frac{1}{n}E(\sum X_{i}) &\cdots\cdots\cdots (2) \\
&= \frac{1}{n}\sum E(X_{i}) &\cdots\cdots\cdots (3) \\
&= (\frac{1}{n})n\mu &\cdots\cdots\cdots (4) \\
&= \mu &\cdots\cdots\cdots (5)
\end{align*}

其中,(2)由期望的性质可得。(3)由多维随机变量期望的性质可得(可参考茆诗松版《概率论与数理统计》167页)。

\begin{align*}
V(\bar{X}) &= V(\frac{1}{n}\sum X_{i}) &\cdots\cdots\cdots (1) \\
&= \frac{1}{n^{2}}V(\sum X_{i}) &\cdots\cdots\cdots (2) \\
&= \frac{1}{n^{2}}\sum V(X_{i}) &\cdots\cdots\cdots (3) \\
&= (\frac{1}{n^{2}})n\sigma ^{2} &\cdots\cdots\cdots (4) \\
&= \frac{\sigma ^{2}}{n} &\cdots\cdots\cdots (5)
\end{align*}

其中,(2)由方差的性质可得。(3)由相互独立的多维随机变量的方差计算性质可得(可参考茆诗松版《概率论与数理统计》168页)。

(2)、

在python中取随机数来模拟均匀分布,完成题目要求的实验,代码如下:

from numpy import random
import numpy as np # 获取独立同均匀分布样本的均值
# para size 样本数量
def get_sample_average(size):
sample = random.rand(size)
return sample.sum()/size for N in [5, 10, 25, 50, 100, 200, 500, 800, 1000]:
# 定义均值的样本空间
averageSample = []
# 按照题目要求,实验重复100次
for i in range(0, 100):
averageSample.append(get_sample_average(N))
averageSample = np.array(averageSample)
print("N = %d,expectation = %f,variance = %f" % (N, averageSample.mean(), averageSample.var()))

  运行结果:  

N = 5,expectation = 0.503940,variance = 0.015760
N = 10,expectation = 0.496493,variance = 0.010882
N = 25,expectation = 0.502530,variance = 0.003558
N = 50,expectation = 0.501409,variance = 0.001528
N = 100,expectation = 0.501081,variance = 0.000786
N = 200,expectation = 0.500667,variance = 0.000415
N = 500,expectation = 0.501198,variance = 0.000164
N = 800,expectation = 0.500096,variance = 0.000118

由运行结果可知,随着N的增大,$E(\bar{X}_{N})$在0.5附近浮动。由于N相差没有足够的大,并没做到$E(\bar{X}_{N})$越来越接近于0.5。但方差是越来越小,趋近于0

概率与统计推断第一讲homework的更多相关文章

  1. 概率与统计推断第二讲homework

    作业目的: 体会条件独立 1.现需要设计一个根据一个人是否是学生$S$(布尔变量)和其体重$W$(连续变量)判断该人的性别$G$(布尔变量).假设在给定$G$的情况下$S$和$W$独立,且假设概率分布 ...

  2. Stanford概率图模型: 第一讲 有向图-贝叶斯网络

    原文链接(系列):http://blog.csdn.net/yangliuy/article/details/8067261 概率图模型(Probabilistic Graphical Model)系 ...

  3. 干货|漫画算法:LRU从实现到应用层层剖析(第一讲)

    今天为大家分享很出名的LRU算法,第一讲共包括4节. LRU概述 LRU使用 LRU实现 Redis近LRU概述 第一部分:LRU概述 LRU是Least Recently Used的缩写,译为最近最 ...

  4. CS193P - 2016年秋 第一讲 课程简介

    Stanford 的 CS193P 课程可能是最好的 ios 入门开发视频了.iOS 更新很快,这个课程的最新内容也通常是一年以内发布的. 最新的课程发布于2016年春季.目前可以通过 iTunes ...

  5. POI教程之第一讲:创建新工作簿, Sheet 页,创建单元格

    第一讲 Poi 简介 Apache POI 是Apache 软件基金会的开放源码函数库,Poi提供API给java程序对Microsoft Office格式档案读和写的功能. 1.创建新工作簿,并给工 ...

  6. 《ArcGIS Engine+C#实例开发教程》第一讲桌面GIS应用程序框架的建立

    原文:<ArcGIS Engine+C#实例开发教程>第一讲桌面GIS应用程序框架的建立 摘要:本讲主要是使用MapControl.PageLayoutControl.ToolbarCon ...

  7. 32位汇编第一讲x86和8086的区别,以及OllyDbg调试器的使用

    32位汇编第一讲x86和8086的区别,以及OllyDbg调试器的使用 一丶32位(x86也称为80386)与8086(16位)汇编的区别 1.寄存器的改变 AX 变为 EAX  可以这样想,16位通 ...

  8. 异常处理第一讲(SEH),筛选器异常,以及__asm的扩展,寄存器注入简介

    异常处理第一讲(SSH),筛选器异常,以及__asm的扩展 博客园IBinary原创  博客连接:http://www.cnblogs.com/iBinary/ 转载请注明出处,谢谢 一丶__Asm的 ...

  9. 常见注入手法第一讲EIP寄存器注入

    常见注入手法第一讲EIP寄存器注入 博客园IBinary原创  博客连接:http://www.cnblogs.com/iBinary/ 转载请注明出处,谢谢 鉴于注入手法太多,所以这里自己整理一下, ...

随机推荐

  1. java数据类型易错点简单总结,欢迎大神前辈补充!谢谢

    数据类型那这边看似简单,花了我很长时间也就是才练到几成"功力"吧.还希望路过的大神在下面补充,菜鸟的我深受感谢! 首先看两个思考题 思考题1:请问下面这个有没有问题 double ...

  2. Android高级控件(四)——VideoView 实现引导页播放视频欢迎效果,超级简单却十分的炫酷

    Android高级控件(四)--VideoView 实现引导页播放视频欢迎效果,超级简单却十分的炫酷 是不是感觉QQ空间什么的每次新版本更新那炫炫的引导页就特别的激动,哈哈,其实他实现起来真的很简单很 ...

  3. Unix - ls命令的简要实现

    #include <dirent.h> 是POSIX.1标准定义的unix类目录操作的头文件,包含了许多UNIX系统服务的函数原型,例如opendir函数.readdir函数. opend ...

  4. 链路层 - SLIP,PPP,

    最常使用的封装格式是RFC 894定义的格式.图2 - 1显示了两种不同形式的封装格式.图中每个方框下面的数字是它们的字节长度. 两种帧格式都采用48 bit(6字节)的目的地址和源地址( 8 0 2 ...

  5. 安卓笔记--intent传值不更新问题

    今天在学习安卓的过程中,遇到一个问题,就是用intent进行多次传值的话, 他永远是第一次的值 后来发现,intent接收数据被写到了onCreat();方法中,这时候finish();到上一个Act ...

  6. Linux之ulimit详解(整理)

    修改:一般可以通过ulimit命令或编辑/etc/security/limits.conf重新加载的方式使之生效通过ulimit比较直接,但只在当前的session有效,limits.conf中可以根 ...

  7. ruby:借助第三方类名如何查找第三方gem名称(zlib为例)

    rubygem中含有成千上万的第三方gem,网上书上扩展教程中都有指导如何使用第三方gem的例子.但是如果不幸这些例子都没有提及gem名称的话,如何只凭第三方类名或require名查找gem名称呢?换 ...

  8. LeetCode - 验证二叉搜索树

    给定一个二叉树,判断其是否是一个有效的二叉搜索树. 一个二叉搜索树具有如下特征: 节点的左子树只包含小于当前节点的数. 节点的右子树只包含大于当前节点的数. 所有左子树和右子树自身必须也是二叉搜索树. ...

  9. 通过jQuery源码学习javascript(三)

    承接上两篇继续写下去.我尽量把我明白的地方给大家说清楚.有些大家的提问我也有点搞不明白,如果有人能解答,再好不过了 疑问  第一篇中有位博友提出了以下的问题,我也不太明白,如果有明白的,能否告知一.二 ...

  10. python3 数据科学基础

    第一章 1.Anaconda(最著名的python数据科学平台) 下面小伙伴们咱们来初初识下Anaconda吧 What is Anaconda???? 回答: (1).科学计算的平台 (2).有很多 ...