伯努利实验: 如果无穷随机变量序列  是独立同分布(i.i.d.)的,而且每个随机变量  都服从参数为p的伯努利分布,那么随机变量  就形成参数为p的一系列伯努利试验.同样,如果n个随机变量  独立同分布,并且都服从参数为p的伯努利分布,则随机变量  形成参数为p的n重伯努利试验. 伯努利试验是只有两种可能结果的单次随机试验. 如果试验E是一个伯努利试验,将E独立重复地进行n次,则称这一串重复的独立试验为n重伯努利试验. 一.伯努利分布: 伯努利分布亦称“零一分布”.“两点分布”.称随机变量X有…
正态分布是如何被高斯推导出来的, 我感觉高斯更像是猜出了正态分布. 详见这篇文章:<正态分布的前世今生> http://songshuhui.NET/archives/76501 说一说理解高斯推导过程中的难点: 1. log函数的出现:log函数的出现能把连乘化为求和方便计算,而且log是一对一的函数,不会损失信息量(推导中的log即 ln). 2. 为了求极大似然, 高斯其实做了一个逆向的假设L(θ;x1,x2,x3....xn)在 θ = 所有x的算数平均 处取到最大值,则此时其导数必定…
Z就是正态分布,X^2分布是一个正态分布的平方,t分布是一个正态分布除以(一个X^2分布除以它的自由度然后开根号),F分布是两个卡方分布分布除以他们各自的自由度再相除 比如X是一个Z分布,Y(n)=X1^2+X2^2+……+Xn^2,这里每个Xn都是一个Z分布,t(n)=X/根号(Y/n),F(m,n)=(Y1/m)/(Y2/N) 各个分布的应用如下:方差已知情况下求均值是Z检验.方差未知求均值是t检验(样本标准差s代替总体标准差R,由样本平均数推断总体平均数)均值方差都未知求方差是X^2检验两…
生物统计学 抽样分布:n个样本会得到n个统计量,将这n个统计量作为总体,该总体的分布即是抽样分布 根据辛钦大数定律,从一个非正态分布的总体中抽取的含量主n的样本,当n充分大时,样本平均数渐近服从正态分布.因此平均数的抽样分布对正态性的要求并不是十分严格,但方差的抽样分布,对总体的正态性的要求是十分严格的. 样本平均值的分布: 基于正态总体(两个参数都知道)的抽样分布: eg':总体n=3, 因为n=2有放回抽样,有9种可能性: n=4有放回抽样,有81种可能性 统计量与总体参数不完全一样,但是满…
神奇的gamma函数(上) 神奇的gamma函数(下) gamma函数的定义及重要性质 \[\Gamma(x)=\int_0^{\infty}t^{x-1}e^{-t}dt\] \[\Gamma(x+1) = x \Gamma(x)\] \[\Gamma(n) = (n-1)! \] \[\Gamma(0) = 1\] \[\Gamma({1\over 2}) = 2\int_0^{+\infty}e^{-u^2}du = \sqrt\pi\] gamma函数的图像 在matlib中,我们可以方…
基于我们最为熟悉的离散型分布——二项分布,我们能够衍生出很多别的分布列,对于之前介绍过的几何分布,我们赋予其的含义是:某个事件成功的概率是p,在n次独立重复实验中恰好成功一次的概率是多少.顺着这层含义,我们把1次编程r次,便得到了所谓的负二项分布.设负二项分布的随机变量是X表示独立重复试验成功恰好成功r次需要总共实验的次数,独立事件成功的概率是p: 其中n=r,r+1,…… 较之二项分布,我们能够看到,基于基本的二次分布的n次独立实验,二项分布是在实验次数n确定的情况下,随机变量是独立实验成功的…
超几何分布: 超几何分布基于这样一个模型,一个坛子中有N个球,其中m个白球,N-m个黑球,从中随机取n(不放回),令X表示取出来的白球数,那么: 我们称随机变量X满足参数为(n,m,M)的超几何分布. 考察其期望的求法: 几何分布: 在独立重复实验当中,每一次实验成功的概率是p,我们关注使得实验成功一次所需要重复的实验次数n及其对应的概率,很容易看到,我们有如下的分布列: 验证其作为分布列的性质: 几何分布的期望: 根据期望的定义,并在这里设q = 1-p 二项分布: 基于最基础的一个离散型随机…
Logistic Regression 之前我们讨论过回归问题,并且讨论了线性回归模型.现在我们来看看分类问题,分类问题与回归问题类似,只不过输出变量一个是离散的,一个是连续的.我们先关注二分类问题,假设 输出变量 y 只能取 0 或者 1 两个值,直观上,对于所有的输入变量,我们都希望可以映射到 [0-1] 的范围内, 为此,我们可以建立如下的函数: hθ(x)=g(θTx)=11+e−θTx 其中, g(z)=11+e−z 称之为 logistic 函数 或者 sigmoid 函数. 很容易…
指数分布族 我们称一类分布属于指数分布族(exponential family distribution),如果它的分布函数可以写成以下的形式: \[ \begin{equation} p(y;\eta) = b(y) \exp(\eta^{T}T(y) - a(\eta)) \tag{*} \end{equation} \] 其中,\(\eta\)被称为自然参数(natural parameter),\(T(y)\)被称为充分统计量(sufficient statistic),\(a(\eta…
sysbench是一款开源的多线程性能测试工具,可以执行CPU/内存/线程/IO/数据库等方面的性能测试. 项目主页: http://sysbench.sourceforge.net/ 安装文档http://sysbench.sourceforge.net/docs/#install 但是好像这两天打不开,在这儿提供一个0.4.12版的下载:sysbench-0.4.12.tar.gz 一.安装三步骤: 1.configure ./configure --prefix=/u01/sysbench…