1、概率vs统计】的更多相关文章

作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/83 本文地址:http://www.showmeai.tech/article-detail/163 声明:版权所有,转载请联系平台与作者并注明出处 1.概率论及在AI中的使用 概率(Probability),反映随机事件出现的可能性大小.事件\(A\)出现的概率,用\(P(A)\)表示. 概率论(Probability Theory),是研究随机现象数量规律的数学分支,度量事物的不…
这一篇比较简单,就不展开记录了,方差和标准差的计算方法记住了就可以. 计算mean 计算每个样本与mean的差值的平方,将其累加后除以(样本数-1)[注:这里的除数可以是n-1也可以是n],即得到方差 方差开根号,即得到标准差 另外,记得标准差和方差都是衡量样本集中程度的,方差或标准差越大,样本越向两边离散:方差或标准差越小,样本越向mean集中. 标准差在对称分布下面,有几个在统计学上非常有用的数字:68%,95%,99.7%,意思是: 用median和标准差stdDev(下面简称SD)的1倍…
介绍箱线图之前,需要先介绍若干个其需要的术语 min:整个样本的最小值 max:整个样本的最大值 Range:即整个样本的取值范围,Range = max - min Inter-Quartile Range (IQR):四分之一range,即通过取3次中位数(median),将整个range分成四等份,其中间的两份就是IQR,下面图示说明一下: 计算方法: 1. 先对整个样本值集合计算median,将数据分为两等份: 2. 分别对前后两份数据再次计算median: 3. 则Q3 - Q1 =…
茎叶图的只做方法如下: 将每个数字分成茎和叶 对所有茎排序,并纵向从小到大放置好 对相同茎下的叶归到一起并排序,垂直于茎的排列方向放置好 举个例子:我们有一份奥斯卡影后的年龄集合: 34 34 27 37 42 41 36 32 41 33 31 74 33 49 38 61 21 41 26 80 42 29 33 36 45 49 39 34 26 25 33 35 35 28 30 29 61 32 33 45 29 62 22 44 按照上述方法做出茎叶图: 上图中,先分析了一下年龄的数…
单个定量变量的直方图表示 大家知道,定量变量是连续型变量,即不会像分类变量那样有明显的分类,那么如何将其画成直方图呢?一般来说,会将其按照某个维度来将其分组(group),举个例子. 我们有15个学生的考试成绩:88, 48, 60, 51, 57, 85, 69, 75, 97, 72, 71, 79, 65, 63, 73 如果要画成直方图,X轴是成绩,Y轴是对应的人数,那么X轴可以考虑按“每10分”作为一个group,即[0, 10), [10, 20), [20, 30), ... ,[…
探索性数据分析(Exploratory Data Analysis) 本节课程先从统计分析四步骤中的第二步:EDA开始. 课程定义了若干个术语,如果学习过机器学习的同学,应该很容易类比理解: population:上节课说过,整体数据集合被称作population individual:其中每个个体,课程里称之为individual,注意不仅仅指个人,也可以泛指其他集合的其中一条数据 variable:变量,即描述个体的某个特点,类比机器学习中的特征 dataset:从population中圈定…
1. 随机试验,样本点,样本空间 若试验具有下列特点: 在相同条件下可重复进行 每次试验的可能结果不止一个,且所有可能结果在实验前是已知的 实验前不能确定哪一个结果会发生 则称该试验为随机试验,常记为 E .  随机试验的每一个可能的结果称为样本点,常用 $\omega$ 表示. 样本点的全体组成的集合称为样本空间,常用$\Omega$表示. 注:样本空间,样本点即中学所学的集合和集合里的点:只不过在概率论学科里,我们习惯称为样本空间和样本点.下面的随机事件,随机事件的运算和关系即子集合,集合的…
在认识客观世界的过程中,统计学的思想和方法经常起着不可替代的作用.在许多工程及自然科学的专业领域中,包括可靠性分析.质量控制.生物信息.脑科学.心理分析.经济分析.金融风险管理.社会科学推断.行为科学等,统计分析方法已经成为基本的数据分析与信息分析工具. 在科学研究和实际问题的处理过程中,往往需要面对数据的分析和处理.这些数据虽然包含了大量的信息,但对所关心的问题而言,还需要对数据进行一定的处理才能从中提炼出有用的信息.那么如何从这些收集到的数据中获取所关心的信息呢?统计学提供相应的思想和方法,…
概率基础和R语言 R的极客理想系列文章,涵盖了R的思想,使用,工具,创新等的一系列要点,以我个人的学习和体验去诠释R的强大. R语言作为统计学一门语言,一直在小众领域闪耀着光芒.直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器.随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长.现在已不仅仅是统计领域,教育,银行,电商,互联网….都在使用R语言. 要成为有理想的极客,我们不能停留在语法上,要掌握牢固的数学,概率,统计知识,同时还要有创新精神,把R语言发挥到各个领域.让我们一起…