本节内容:

1:t分布存在的意义是什么

2:t分布的置信区间

3:t分布检验

一、t分布存在的意义是什么

数据分析中有一块很大的版图是属于均值对比的,应用广泛。

例如:对比试验前后病人的症状,证明某种药是否有效;
对比某个班级两次语文成绩,验证是否有提高;
对比某个产品在投放广告前后的销量,看广告是否有效。这些都属于两均值对比的应用。

均值对比的假设检验方法主要有Z检验和T检验:

它们的区别在于Z检验面向总体数据和大样本数据,而T检验适用于小规模抽样样本。

有判断了均值就可以做很多的事情了

二、t分布的置信区间

和计算正态分布的置信区间一样,将正态统计量变成了t分布统计量

relevel(sleep$group,2)
##将group变成factor类型,2的level最大

得出一下结果:

Paired t-test

data:  extra by relevel(sleep$group, 2)
t = 4.0621, df = 9, p-value = 0.002833
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
0.7001142 2.4598858
sample estimates:
mean of the differences
1.58

三、t分布检验

T检验在使用前有三个应用的注意点:

1、分析的数据对象需要满足正态分布,T检验前需判断样本是否正态分布;
2、分析对比的统计量是均值;
3、对比对象是两个,可以是两个样本;也可以是一个样本和一个常数;

T检验有四种类别:

1、配对样本的T检验--》另类的单样本
独立性检验
2、等方差的独立样本T检验;
3、异方差的独立样本T检验;
4、单样本的T检验。 单样本常用:总体均值跟样本均值的差异
双样本常用:两样本之间的差异

对1跟4的原假设H0 = 总体均值跟样本均值的无差异
对2跟3的原假设H0 = 两样本之间的无差异,即x1=x2 T检验与Z检验不同,需要考虑样本方差是否相同,这是因为自由度决定了T分布曲线,同时,自由度也影响样本方差。

如:匹配样本检验栗子:

所谓配对样本的T检验,是指参与对比的两列数据都是满足正态分布,
而且两列数据之间存在一一对应关系。要想判断这种数据序列之间的差异是否显著,就可以使用配对样本T检验。
处于待检验状态的两列配对样本,应该具有相同的数据个数,而且两列数据在语义上有一一对应关系。
例如对同一个班级的两次考试成绩,这两次成绩都按照学号顺序存放,具有明确的对应关系。

栗子:

采用R自带的sleep为数据集 -> 显示两种催眠药(与对照组相比睡眠时间增加)对10名患者的疗效的数据。

相要知道这个两种药是否有显著性差异?

H0:两种无显著性差异  也集是x1-x2的 d均值为0 -》mu=0 

H1:两种有显著性差异

由于配对样本检验本质是一种单样本T检验,如下:
t.test(sleep$extra[1:10]-sleep$extra[11:20],mu=0)

One Sample t-test

data:  sleep$extra[1:10] - sleep$extra[11:20]
t = -4.0621, df = 9, p-value = 0.002833
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
-2.4598858 -0.7001142
sample estimates:
mean of x
-1.58

结论:p>0.05二者具有显著性差异,拒绝原假设。

如:单样本检验栗子:

全班有52名学生,若学校想知道某个班的英语成绩与全市平均成绩相比是否有差异。

班级μ=79

原假设:平均值=79

备择假设:平均值≠79

H0:79是该市英语平均分,如果结果是接收原假设,那么证明该班的平均分与该市是无差异的。

t.test(data$英语成绩,mu=79)

在该检验结果中,观测到p=2.122*10-11<0.05,拒绝原假设。也就是说,该班的成绩跟全市平均成绩是有显著性差异的。:

如:独立性样本检验

独立样本是两个没有对应关系的独立正态分布数据集合,可以有不同的数据个数,
例如,对同一学校的某次考试,如果需要检验男生与女生的成绩之间有无显著性差异在总体成绩满足正态分布的情况下,
则都可以使用独立样本的T检验,但是在进行T检验之前,需要明确两个样本的方差是否相同,然后根据方差齐性与否选择相应的计算方法。

独立性检验
  同方差独立T检验
    比如说我们比较城东的房价增长率跟城西的,他们都是来自北京的同个标准差的总体。
    他们之间的差异性只是由于抽样存在的差异
  异方差独立T检验
    假设样本来自两个不同的总体,就是说是异方差
    他们之间的差异性不止由于抽样存在的差异,还有来自总体的原因。
我们算他们的置信区间,其实是一样的,只不过对于自由度,标准误我们需要取套用各自的公式。

t的独立性样本检验用于检验两样本的均值是否是显著,常用于某二分类变量区间下的连续变量是否有显著性

栗子:

其中。var.equal= T 是两样本的方差一样,关于如何判断是否方差一样我们可以对数据做

方差齐性检验:var.test(avg_exp~gender,data=cre) 得出p为:0.67 不能拒绝原假设

最后得出:

p > 0.05不能拒绝原假设,也就是两样本之间是无显著的。

  

R-3 t分布--t置信区间--t检验的更多相关文章

  1. R学习

    R内容: R-1 基础 R-2 基础绘图 R-3 t分布--t置信区间--t检验 R-4 方差分析 R-5 相关分析-卡方分析 R-6 线性回归模型分析流程 R实战第7章 线性回归 逻辑回归 主成分分 ...

  2. R语言绘制正太分布图,并进行正太分布检验

    正态分布 判断一样本所代表的背景总体与理论正态分布是否没有显著差异的检验.   方法一概率密度曲线比较法 看样本与正太分布概率密度曲线的拟合程度,R代码如下: #画样本概率密度图s-rnorm(100 ...

  3. KS-检验(Kolmogorov-Smirnov test) -- 检验数据是否符合某种分布

    Kolmogorov-Smirnov是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法.其原假设H0:两个数据分布一致或者数据符合理论分布.D=max| f(x)- g(x)|, ...

  4. R代码展示各种统计学分布 | 生物信息学举例

    二项分布 | Binomial distribution 泊松分布 | Poisson Distribution 正态分布 | Normal Distribution | Gaussian distr ...

  5. 估计量|估计值|矩估计|最大似然估计|无偏性|无偏化|有效性|置信区间|枢轴量|似然函数|伯努利大数定理|t分布|单侧置信区间|抽样函数|

    第二章 置信区间估计 估计量和估计值的写法? 估计值希腊字母上边有一个hat 点估计中矩估计的原理? 用样本矩来估计总体矩,用样本矩的连续函数来估计总体矩的连续函数,这种估计法称为矩估计法.Eg:如果 ...

  6. 使用R进行空间自相关检验

    「全局溢出」当一个区域的特征变化影响到所有区域的结果时,就会产生全局溢出效应.这甚至适用于区域本身,因为影响可以传递到邻居并返回到自己的区域(反馈).具体来说,全球溢出效应影响到邻居.邻居到邻居.邻居 ...

  7. T检验与F检验的区别_f检验和t检验的关系

    1,T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定. 通过把所得到的统计检定值,与统计学家建立了一 ...

  8. R语言基础

    一.扩展包的基本操作语句R安装好之后,默认自带了"stats" "graphics"  "grDevices" "utils&qu ...

  9. 通俗理解T检验和F检验

    来源: http://blog.sina.com.cn/s/blog_4ee13c2c01016div.html   1,T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总 ...

随机推荐

  1. GO汇总

    1.基础 GO语言介绍以及开发环境配置 Go-包 Go-数据类型以及变量,常量 Go-获取变量数据类型 GO-数组与切片 GO-切片拷贝以及赋值 Go-函数 Go-闭包 GO-逻辑判断(if,else ...

  2. JS---DOM---总结获取元素的方式

    总结获取元素的方式 1. 根据id属性的值获取元素,返回来的是一个元素对象 document.getElementById("id属性的值"); document.getEleme ...

  3. 关于for循环中使用setTimeout的四种解决方案

    我们先来简单了解一下setTimeout延时器的运行机制.setTimeout会先将回调函数放到等待队列中,等待区域内其他主程序执行完毕后,按时间顺序先进先出执行回调函数.本质上是作用域的问题. 因此 ...

  4. LRC歌词原理和实现高仿Android网易云音乐

    大家好,我们是爱学啊,今天给大家带来一篇关于LRC歌词原理和在Android上如何实现歌词逐行滚动的效果,本文来自[Android开发项目实战我的云音乐]课程:逐字滚动下一篇文章讲解. 效果图 相信大 ...

  5. Linux(Centos7)下redis5集群搭建和使用

    1.简要说明 2018年十月 Redis 发布了稳定版本的 5.0 版本,推出了各种新特性,其中一点是放弃 Ruby的集群方式,改为 使用 C语言编写的 redis-cli的方式,是集群的构建方式复杂 ...

  6. 对于文本生成类4种评价指标的的计算BLEU METEOR ROUGE CIDEr

    github下载链接:https://github.com/Maluuba/nlg-eval 将下载的文件放到工程目录,而后使用如下代码计算结果 具体的写作格式如下: from nlgeval imp ...

  7. [译]Vulkan教程(16)图形管道基础之总结

    [译]Vulkan教程(16)图形管道基础之总结 Conclusion 总结 We can now combine all of the structures and objects from the ...

  8. jQuery-跨域问题的处理

    调用登录接口时,后端一般会在调用登录接口成功后,在response中设置cookie,之后前端的每次请求都会自动地在请求头上加上后端设置好的cookie,这对前端来说是透明的. 当登录接口与登录后调用 ...

  9. Git终端命令行的常用操作

    一.git源代码管理的优点 方便多人协同开发.工作 降低代码的管理成本 良好的分支管理机制 二.结构分析 服务端和客户端都有版本控制能力,都能进行代码的提交.合并 结构一: 结构二: 三.工作区的创建 ...

  10. NLP入门(九)词义消岐(WSD)的简介与实现

    词义消岐简介   词义消岐,英文名称为Word Sense Disambiguation,英语缩写为WSD,是自然语言处理(NLP)中一个非常有趣的基本任务.   那么,什么是词义消岐呢?通常,在我们 ...