Stat2.3x Inference(统计推断)课程由加州大学伯克利分校(University of California, Berkeley)于2014年在edX平台讲授. PDF笔记下载(Academia.edu) Summary Test of Hypotheses $$\text{Null}: H_0$$ $$\text{Alternative}: H_A$$ Assuming the null is true, the chance of getting data like the d…
样本是统计推断的依据: 统计推断的基本问题可以分为两大类: 估计问题 点估计, 区间估计 假设检验 1. 点估计 设总体 X 的分布函数 F(x;θ) 的形式已知,θ 是待估参数.X1,X2,-,Xn 是 X 的一个样本,x1,x2,-,xn 是相应的一个样本值.点估计问题就是要构造一个适当的统计量,θ^(X1,X2,-,Xn),用它的观察值 θ^(x1,x2,-,xn) 作为未知参数 θ 的近似值. 称 θ^(X1,X2,-,Xn) 为 θ 的估计量: 称 θ^(x1,x2,-,xn) 为 θ…
Part 1: Moments Definition 1 For each integer $n$, the nth moment of $X$, $\mu_n^{'}$ is \[\mu_{n}^{'} = EX^n.\] The nth central moment of $X$, $\mu_n$, is \[ \mu_n = E(X-\mu)^n,\] where $\mu=\mu_{1}^{'}=EX$. Definition 2 The variance of a random var…
在外行眼里统计学家经常做的一件事就是把一大堆杂七杂八的数据放在一起,算出几个莫名其妙的数字,然后再通过这些数字推理出貌似很靠谱的结论,简直就像是炼金术士用“贤者之石”把一堆石头炼成了金矿.第六章,应该是全书最抽象的一章,就是介绍统计学中的“贤者之石”——数据简化原理.从蕴含信息的角度看,样本全体蕴含了所有的信息,但是这些信息过于分散,研究起来无从下手,必须有简化样本的手段,把分散在每一个样本的信息聚集起来.这里的聚集是一对矛盾的对立统一体,即样本简化和信息损失的对立统一,这一章便从理论的高度探讨…
有了前四章知识的铺垫,第五章进入了统计研究的正题——样本的研究.样本可以说是统计学研究中最基本的对象,样本的数学性质也是最重要的研究课题,统计学的一大任务就是从一大堆样本中提取出有价值的知识,正如对原子和分子的研究之于化学一样.下面是这一章的思维导图,…
数据分析工作中最常和多维随机变量打交道,第四章介绍了多维随机变量的基本知识,其中核心概念是条件分布和条件概率.条件分布和条件概率可以抽象出条件期望的概念,在随机分析的研究中,理解随机积分和鞅理论和关键词正是“条件期望”.下面是这一章的思维导图,…
在科学研究中最重要的两种思维范式是“简化”和“还原”,所谓“简化”是指人依据不太复杂的,可理解的规律认识世界:所谓“还原”是指任何复杂的现象归根结底可以由若干简单的机制解释.各种统计分布族就是统计学中“简化”思维抽象的结果,统计学家用特定的统计分布和统计分布的组合近似地解释现实中复杂的随机现象. 第三章从不同的角度介绍了几大类常见的统计分布族,下面是这一章的思维导图,…
第二章引入了两个重要问题,随机变量的期望和随机变量的变换.期望又引申出“矩”的概念,矩是统计学理论分析的一个重要关键词,而随机变量的变换是研究复杂统计现象的重要工具.下面是这一章的思维导图…
第一章介绍了基本的概率论知识,以下是这一章的思维导图…
Stat2.3x Inference(统计推断)课程由加州大学伯克利分校(University of California, Berkeley)于2014年在edX平台讲授. PDF笔记下载(Academia.edu) Summary One-sample $t$ test Test for a population mean (unknown SD); sample size $n$. That is, known sample mean and SD but unknown populati…