python做单因素方差分析

方差分析的主要功能就是验证两组样本，或者两组以上的样本均值是否有显著性差异，即均值是否一样。

这里有两个大点需要注意：①方差分析的原假设是：样本不存在显著性差异（即，均值完全相等）；②两样本数据无交互作用（即，样本数据独立）这一点在双因素方差分析中判断两因素是否独立时用。

原理：

方差分析的原理就一个方程：SST=SS组间+SSR组内 (全部平方和=组间平方和+组内平方和)

说明：方差分析本质上对总变异的解释。

组间平方和=每一组的均值减去样本均值
组内平方和=个体减去每组平方和

方差分析看的最终结果看的统计量是：F统计量、R²。

其中：g为组别个数，n为每个组内数据长度。

python实现：

from scipy import stats

from statsmodels.formula.api import ols

from statsmodels.stats.anova import anova_lm

from statsmodels.stats.multicomp import pairwise_tukeyhsd

import warnings

warnings.filterwarnings("ignore")

import itertools

df2=pd.DataFrame()

df2['group']=list(itertools.repeat(-1.,9))+ list(itertools.repeat(0.,9))+list(itertools.repeat(1.,9))

df2['noise_A']=0.0

for i in data['A'].unique():

    df2.loc[df2['group']==i,'noise_A']=data.loc[data['A']==i,['','','']].values.flatten()

df2['noise_B']=0.0

for i in data['B'].unique():

    df2.loc[df2['group']==i,'noise_B']=data.loc[data['B']==i,['','','']].values.flatten()  

df2['noise_C']=0.0

for i in data['C'].unique():

    df2.loc[df2['group']==i,'noise_C']=data.loc[data['C']==i,['','','']].values.flatten()  

df2

# for A

anova_reA= anova_lm(ols('noise_A~C(group)',data=df2[['group','noise_A']]).fit())

print(anova_reA)

#B

anova_reB= anova_lm(ols('noise_B~C(group)',data=df2[['group','noise_B']]).fit())

print(anova_reB)

#C

anova_reC= anova_lm(ols('noise_C~C(group)',data=df2[['group','noise_C']]).fit())

print(anova_reC)

　　从结果可以看出，A、B两样本，在每个组间均值显著无差异，C样本的组间均值是有差异的。

python做单因素方差分析的更多相关文章

用Python学分析 - 单因素方差分析
单因素方差分析(One-Way Analysis of Variance) 判断控制变量是否对观测变量产生了显著影响分析步骤 1. 建立检验假设 - H0:不同因子水平间的均值无差异 - H1:不同 ...
Python爬取《你好李焕英》豆瓣短评并基于SnowNLP做情感分析
爬取过程在这里: Python爬取你好李焕英豆瓣短评并利用stylecloud制作更酷炫的词云图本文基于前文爬取生成的douban.txt,基于SnowNLP做情感分析. 依赖库: 豆瓣镜像比较快: ...
Python：用pyinstrument做性能分析
导引在计算密集型计算或一些Web应用中,我们常常需要对代码做性能分析.在Python中,最原始的方法即是使用time包中的time函数(该函数以秒为计时单位): from time import s ...
Python文章相关性分析---金庸武侠小说分析
百度到<金庸小说全集 14部>全(TXT)作者:金庸下载下来,然后读取内容with open('names.txt') as f: data = [line.strip() for li ...
使用Python做简单的字符串匹配
由于需要在半结构化的文本数据中提取一些特定格式的字段.数据辅助挖掘分析工作,以往都是使用Matlab工具进行结构化数据处理的建模,matlab擅长矩阵处理.结构化数据的计算,Python具有与matl ...
一步一步教你如何用Python做词云
前言在大数据时代,你竟然会在网上看到的词云,例如这样的. 看到之后你是什么感觉?想不想自己做一个? 如果你的答案是正确的,那就不要拖延了,现在我们就开始,做一个词云分析图,Python是一个当下很流 ...
用python探索和分析网络数据
Edited by Markdown Refered from: John Ladd, Jessica Otis, Christopher N. Warren, and Scott Weingart, ...
What exactly can you do with Python? Here are Python’s 3 main applications._你能用Python做什么?下面是Python的3个主要应用程序。
原文链接 Github地址一.陈述 1,我到底能用Python做什么? 我观察注意到Python三个主要流行的应用: 网站开发: 数据科学——包括机器学习,数据分析和数据可视化: 做脚本语言. 二. ...
[转]使用 mitmproxy + python 做拦截代理
使用 mitmproxy + python 做拦截代理本文是一个较为完整的 mitmproxy 教程,侧重于介绍如何开发拦截脚本,帮助读者能够快速得到一个自定义的代理工具. 本文假设读者有基本的 ...

随机推荐

MySql——使用where子句过滤数据
示例使用的数据表在上一个博客中创建的https://www.cnblogs.com/lbhym/p/11895968.html 参考资料:<Mysql必知必会> 1.使用where子句示 ...
pat 1046 Shortest Distance（20 分） (线段树)
1046 Shortest Distance(20 分) The task is really simple: given N exits on a highway which forms a sim ...
suseoj 1209: 独立任务最优调度问题(动态规划)
1209: 独立任务最优调度问题时间限制: 1 Sec 内存限制: 128 MB提交: 3 解决: 2[提交][状态][讨论版][命题人:liyuansong] 题目描述用2台处理机A和B处理 ...
Windows平台LoadLibrary加载动态库搜索路径的问题
一.背景在给Adobe Premiere/After Effects等后期制作软件开发第三方插件的时候,我们总希望插件依赖的动态库能够脱离插件的位置,单独存储到另外一个地方.这样一方面可以与其他程序 ...
将Swagger2文档导出为HTML或markdown等格式离线阅读
网上有很多<使用swagger2构建API文档>的文章,该文档是一个在线文档,需要使用HTTP访问.但是在我们日常使用swagger接口文档的时候,有的时候需要接口文档离线访问,如将文档导 ...
SpringBoot 源码解析（十）----- Spring Boot的核心能力 - 集成AOP
本篇主要集成Sping一个重要功能AOP 我们还是先回顾一下以前Spring中是如何使用AOP的,大家可以看看我这篇文章spring5 源码深度解析----- AOP的使用及AOP自定义标签 Spri ...
🔥《手把手教你》系列基础篇之4-python+ selenium自动化测试-xpath使用（详细教程）
1. 简介俗话说:磨刀不误砍柴工,因此在我们要开始写自动化脚本之前,我们先来学习和了解几个基本概念,在完全掌握了这几个概念之后,有助于我们快速上手,如何去编写自动化测试脚本. 元素,在这个教程系列, ...
读懂JWT的使用，你就会用PHP如何实现了
要如何用php实现JWT认证,那我们首先就来认识一下什么是JWT.什么是JWTJWT(json web token)是为了在网络应用环境间传递声明而执行的一种基于JSON的开放标准.JWT的声明一般被 ...
mysql通俗易懂的数据库连接池原理及模拟实现
什么是数据库连接池? 当系统使用JDBC技术访问数据库时会创建一个connection对象,而该对象的创建过程是非常消耗资源的,并且创建对象的时间也特别长,假设系统一天有1万次的访问量,那么一天就会有 ...
python logger日志通用配置文件
阅读须知⚠️ 1.示例代码可直接放在项目py文件中即可使用 2.project_name,logfile_name变量需根据你的项目进行修改 3.日志输出格式format选择(可根据你的需要替换或修改 ...

python做单因素方差分析

python做单因素方差分析的更多相关文章

随机推荐

热门专题