注:上一小节总结了离散型随机变量,这个小节总结连续型随机变量.离散型随机变量的可能取值只有有限多个或是无限可数的(可以与自然数一一对应),连续型随机变量的可能取值则是一段连续的区域或是整个实数轴,是不可数的.最常见的一维连续型随机变量有三种:均匀分布,指数分布和正态分布.下面还是主要从概述.定义.主要用途和Python的实现几个方面逐一描述. 以下所有Python代码示例,均默认已经导入上面的这几个包,导入代码如下: import numpy as np from scipy import st…
在利用基本的概率论模型解决实际问题的时候,我们很容易发现一些随机变量的连续分布的,例如火车进站的时间.台灯的寿命等一些和时间相关的随机变量,此时我们发现我们难以求出某个点的概率了,因为随机变量是连续的,基本事件空间是一个无穷的空间,而与无限.连续这些字眼相关,很自然的想到,这里我们要借助积分的工具. 现在我们面临的问题是,如何用上积分这个工具呢?我们假想一条曲线f(x)和连续随机变量的取值区间[a,b]围成了一个面积为1的曲边梯形,(之所以控制面积为1,是为了满足分布列的基本性质),那么对于P(…
在讨论连续型随机变量函数的分布时,我们从一般的情况中(讨论正态分布的文章中提及),能够得到简化版模型. 回忆利用分布函数和概率密度的关系求解随机变量函数分布的过程,有Y=g(x),如果g(x)是严格单调的,那么在我们就能够利用反函数直接得到X的范围(如果不是单调的,需要考虑的事情就要多一点),由此将Y的分布函数和X的分布函数建立了联系,定理的具体形式如下:…
在关于离散型随机变量函数的期望的讨论中,我们很容易就得到了如下的等式: 那么推广到连续型随机变量,是否也存在类似的规律呢? 即对于连续型随机变量函数的期望,有: 这里给出一个局部的证明过程,完整的证明过程书中留在了理论习题当中.…
古典统计学问题一开始起源于赌博,让我们看这样一道有关赌博的问题. Q:A.B两人进行n局赌博,A胜的概率是p,现在设置随机变量X表示A赢的局数,当X>np,A给赌场X-np元,否则B给赌场np-X元,那么求解赌场挣钱的期望值? 这个问题中明显有二项分布(伯努利分布)的身影,但是我们面临的困境是,这里是基于二项分布的一个求解随机变量X落在某个范围的概率,如果我们利用二项分布逐项乘开,会得到一个异常繁琐的式子,也是极其不利于计算的. 为了解决这个问题,数学家想到了一个方法:众所周知在连续型随机变量中…
连续型变量的推断性分析方法主要有t检验和方差分析两种,这两种方法可以解决一些实际的分析问题,下面我们分别来介绍一下这两种方法 一.t检验(Student's t test) t检验也称student t检验(Student's t test),由Gosset提出,主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料.我们在介绍连续变量分布时讲过t分布,t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著. 介绍t检验之前,先说一下Z检验,假设我们已知一个样本…
常用连续型分布介绍及R语言实现 R的极客理想系列文章,涵盖了R的思想,使用,工具,创新等的一系列要点,以我个人的学习和体验去诠释R的强大. R语言作为统计学一门语言,一直在小众领域闪耀着光芒.直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器.随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长.现在已不仅仅是统计领域,教育,银行,电商,互联网….都在使用R语言. 要成为有理想的极客,我们不能停留在语法上,要掌握牢固的数学,概率,统计知识,同时还要有创新精神,把R语言发挥到各个领…
一.综述 Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,图像也更加美观,本文基于seaborn官方API还有自己的一些理解.   1.1.样式控制:axes_style() and set_style() seaborn提供了5个主题: darkgrid 黑色网格(默认) whitegrid 白色网格 dark 黑色背景 white 白色背景 ticks 带刻度线 一个简单的小例子: import numpy as npsns.set_styl…
转发:https://blog.csdn.net/lujiandong1/article/details/49448051 处理离散型特征和连续型特征并存的情况,如何做归一化.参考博客进行了总结:https://www.quora.com/What-are-good-ways-to-handle-discrete-and-continuous-inputs-together总结如下:1.拿到获取的原始特征,必须对每一特征分别进行归一化,比如,特征A的取值范围是[-1000,1000],特征B的取…
第四章 χ2检验 χ2检验与连续型资料假设检验的区别? 卡方检验的假设检验是什么? 理论值等于实际值 何条件下卡方检验的需要矫正?如何矫正? 卡方检验的自由度如何计算? Df=k-1而不是n-1 卡方检验的分类? 两组比例简式: 多组比例简式: 2 × 2列联表的χ2检验可利用以下简式而不必计算理论次数 T为总样本数 2×c列联表的独立性检验简式? 二者选其一…