数据分析 - 斯特鲁普效应(Stroop effect)

Reinhard得到了一份斯特鲁普效应试验的数据,我们来分析下,文字的颜色,是否会影响受试者的反应。
这里先看看什么是斯特鲁普效应:

斯特鲁普效应(Stroop effect)是指在心理学中干扰对反应时间影响的实验。这是1935年实验心理学家史楚普(John Ridley Stroop)所提出的著名的发现之一,指出环境刺激物理的各项特征,如果相融,则会使辨识加速,反应时间缩短;但若互不相融,则会造成干扰,使反应时间拉长。例如当测试者被要求说出某个颜色和其字面意义不符的词语时,被测者往往会反应速度下降,出错率上升。

我们再来来看看下面这个例子:
尽可能以最快的速度说出下面两组文字的颜色
- - -
绿色 红色 蓝色
黄色 蓝色 黄色
- - -
蓝色 黄色 红色
绿色 黄色 绿色
- - -

参考文献

Stroop Effect - Wikipedia

变量

  • 自变量是文字与颜色是否匹配
  • 因变量是受试者的反应时间

假设

适当的假设是,当文字和颜色匹配时,受试者所花费的反应时间要更少。

这里,零假设是,文字和颜色的匹配与不匹配,对受试者而言在反应时间上没有差别。
对立假设是,文字和颜色匹配时,受试者的反应时间上比不匹配时更少。

这里,用\(H_0\)表示零假设,用\(H_A\)表示对立假设。用\(\mu_C\)表示文字与颜色匹配的总体的均值。用\(\mu_I\)表示文字与颜色不匹配的总体的均值。

\(H_0:\mu_C=\mu_I\)
\(H_A:\mu_C<\mu_I\)

统计测试类型

z-test适用于知道总体参数(如\(\mu,\sigma\))的情况。
这里,我们并不知道总体参数。我们只有样本,需要比较两个样本之间的区别,并以此来推断总体的情况,所以需要使用t-test。

由数据集的描述可以得知,这是一组受试者参加两次测试所得到的两个样本,也就是相依样本。
在相依样本t检验的测试类型中,有一种叫做重复衡量设计,是在试验中对同一名受试者进行不同的测试。

这里,将采用负方向的单尾检验。
因为我们的对立假设是文字和颜色匹配时,受试者的反应时间少。所以检验必须具有方向行,不能使用双尾检验,只能使用单尾检验。从我们对立假设\(\mu_C-\mu_I<0\)可以得知,检测的方向是负方向。

样本数据可视化

直方图

从两个样本数据的直方图上我们可以看出,
文字与颜色匹配的反应时间,大多集中在11到18之间。
文字与颜色不匹配的反应时间,大多集中在17到23之间。

箱线图

从箱线图中可以看出,
文字与颜色匹配的样本中,最大值和最小值差较大,但是四分位差较小。
文字与颜色不匹配的样本中,最大和最小值差较小,但是四分位差较大,而且有异常点存在。

数据集的统计描述

反应前后二者平均值之间的差别

\(\bar{x}=\bar{x}_C-\bar{x}_I=-7.96\)

标准偏差

\(S_D=\sqrt{\frac{\sum{(x_i-\bar{x})^2}}{n-1}}=4.86\)

标准误差

\(SEM=\frac{S_D}{\sqrt{n}}=\frac{4.86}{\sqrt{24}}=0.99\)

t统计量

\(t-statistic=\frac{\bar{x}_C-\bar{x}_I}{SEM}=\frac{-7.96}{0.99}=-8.04\)

t临界值

这里使用\(\alpha级别为0.05\)的单尾检验,自由度是23,t临界值是-1.714

效应量\(r^2\)

\(r^2=\frac{t^2}{t^2+df}=0.74\)

\(r^2=.74\)
也就是74%的差异,是由文字和颜色匹配与不匹配所造成的。

置信区间

自由度是23,95%置信区间的t临界值是2.069,误差界限是\(t-critical * SEM=2.069 * 0.99=2.05\)
置信区间\(CI:\bar{x}_D\pm 2.05=-7.96\pm 2.05=(-10.01,-5.91)\)

关于均值差异的置信区间;95% CI=(-10.01,-5.91)

决策

\(t(23)=-8.04,P<.05,one-tailed\)
根据t统计量和t临界值,Reinhard认为结果有统计上的显著性。
因为P<0.05,所以Reinhard拒绝零假设。
试验证明在文字和颜色匹配时,受试者的反应时间比不匹配时更少。

数据分析 - 斯特鲁普效应(Stroop effect)的更多相关文章

  1. Survey Report on Data Skew in Big Data

    1 Introduction 信息时代产生了大量的数据,运用和使用数据已经成为一个公司乃至一个国家核心实力的重要组成部分.当代大数据一般指的是:数据量巨大,需要运用新处理模式才能具有更强的决策力.洞察 ...

  2. P2P公司是如何进行风险管理的

    关于P2P的风控很多人仍然是一知半解,甚至不少长期P2P圈内的资深玩家对此也是“既没吃过猪肉,也没见过猪跑”.   但是不可否认的是,作为一种跳过银行间接贷款融资模式的.一种在借款人和出借人之间直接发 ...

  3. JAVA开发搞了一年多的大数据,究竟干了点啥

    JAVA开发搞了一年多大数据的总结 ​ 2021年7月份加入了当前项目组,以一个原汁原味的Java开发工程师的身份进来的,来了没多久,项目组唯一一名大数据开发工程师要离职了,一时间一大堆的数据需求急需 ...

  4. 使用limma、Glimma和edgeR,RNA-seq数据分析易如反掌

    使用limma.Glimma和edgeR,RNA-seq数据分析易如反掌 Charity Law1, Monther Alhamdoosh2, Shian Su3, Xueyi Dong3, Luyi ...

  5. Python——气象数据分析

    将对意大利北部沿海地区的气象数据进行分析与可视化.我们在实验过程中先会运用 Python 中 matplotlib 库的对数据进行图表化处理,然后调用 scikit-learn 库当中的的 SVM 库 ...

  6. 使用Kylin构建企业大数据分析平台的4种部署方式

    本篇博客重点介绍如何使用Kylin来构建大数据分析平台.根据官网介绍,其实部署Kylin非常简单,称为非侵入式安装,也就是不需要去修改已有的 Hadoop大数据平台.你只需要根据的环境下载适合的Kyl ...

  7. 【转帖】Python在大数据分析及机器学习中的兵器谱

    Flask:Python系的轻量级Web框架. 1. 网页爬虫工具集 Scrapy 推荐大牛pluskid早年的一篇文章:<Scrapy 轻松定制网络爬虫> Beautiful Soup ...

  8. 0-Spark高级数据分析-读书笔记

    学完了<Spark快速大数据分析>,对Spark有了一些了解,计划更近一步,开始学习<Spark高级数据分析>.这本书是用Scala写的,在学习的过程中想把其中的代码转换成Ja ...

  9. 【转】使用Apache Kylin搭建企业级开源大数据分析平台

    http://www.thebigdata.cn/JieJueFangAn/30143.html 本篇文章整理自史少锋4月23日在『1024大数据技术峰会』上的分享实录:使用Apache Kylin搭 ...

随机推荐

  1. cocos2dx中的ScrollView

    ScrollView由视窗区域(裁剪区域)和内容区域组成,内容区域叫innerContainer. 视窗区域范围:get/setContentSize 内容区域:get/setInnerContain ...

  2. sublime work flow

    Tools -> Developer -> New Snippet <snippet> <content><![CDATA[ }() { ${} } ]]&g ...

  3. LoadRunner - 001

    lr_eval_string():函数的主要作用:返回脚本中的一个参数当前的值,返回值类型:char一般多用在调试脚本时输出参数的值.具体用法如下:lr_output_message("Th ...

  4. easyui datagrid 编辑模式详解

       一,建立编辑器 从api得知,扩展一种新的编辑器类型,需要提供以上几个方法.项目中正好需要一个checkbox 类型编辑器,但在easyui中并没提供这样的编辑器,那我们可以通过扩展编辑器来解决 ...

  5. Flink – window operator

      参考, http://wuchong.me/blog/2016/05/25/flink-internals-window-mechanism/ http://wuchong.me/blog/201 ...

  6. input checkbox属性-Indeterminate状态

    我们在使用input标签,多选框时,通常会看到两种状态,即选中(checked)和被选中(unchecked). // 选中状态也可写成checked="checked" chec ...

  7. FDCT变换 公式法

    // 对亮度信号进行FDCT变换// @param   data    亮度信号的存储数组void CompressEncode::standardFDCT(BYTE data[MATRIXSIZE] ...

  8. Oracle 遇到的问题 (1)

    1.ORA-01502:索引'DBEPMS.SYS_C009390'或这类索引的分区处于不可用状态 解决方法:[注 索引命名规则 IX_表名简称_列名简称/IX_表名简称_序号(索引长度在30字符以内 ...

  9. magento目录结构说明,Magento文件夹结构说明,Magento folder structure

    /app – 程序根目录     /app/etc – 全局配置文件目录     /app/code – 所有模块安装其模型和控制器的目录     /app/code/core – 核心代码或经过认证 ...

  10. ios枚举规范