以下内容摘自:公众号- SPSS生活统计学 保存做复习之用. 峰度(Kurtosis) 峰度是描述总体(样本)中所有取值分布形态陡缓程度的统计量.通过计算可以得到峰度系数,峰度系数与分布形态的关系是: 峰度系数=3,扁平程度适中: 峰度系数<3,为扁平分布: 峰度系数>3,为尖峰分布: 正态分布的峰度系数为3.用SPSS计算峰度系数时,显示的结果是减去3后得到的数字,也就是与正态分布对比.所以SPSS的峰度系数与分布形态的关系是: 峰度系数=0,数据分布与正态分布的陡缓程度相同: 峰度系数&l…
SPSS学习笔记之--Kaplan-Meier生存分析 一.概述 关于生存分析的相关概念,Kaplan-Meier用于估计生存函数,允许有一个分组变量进行生存率的组间比较,还容许一个分层变量.若不考虑其他混杂因素下生存分析的常用方法. 二.实例 要研究某种新药治疗相对于常规药物治疗对生存率有无改善,收集以下数据: months:生存时间(单位月),为连续变量. group:1=治疗组,2=对照组 status:0=出现结局,1=失访,2=实验结束时仍存活 三.操作步骤 菜单选择: 主对话框:按图…
目的:检验两个有联系的正态总体的均值是否存在显著差异. 适用条件:有联系,正态总体,样本量要一样.一般可以分为一下四种: ①同一受试对象处理前后的对比:如对于糖尿病人,对同一组病人在使用新治疗方法前测量血糖含量,在使用后再次测量血糖含量,形成两组对比样本:一般是为了说明是否有作用. ②同一受试对象不同的部位数据 ③同一样品用两种方法(仪器等)检验的结果: ④配对的两个受试对象分别接受两种处理后的数据:糖尿病人按照体重进行配对(60岁的两个配对,65岁的两个配对……)然后对配对的病人采用不同的治疗…
目的:利用来自两个总体的独立样本,推断两个总体的均值是否存在差异. 适用条件: (1)样本来自的总体应服从或近似服从正态分布: (2)两样本相互独立,两样本的样本量可以不等: 案例分析: 案例描述:评价两位老师的教学质量,试比较其分别任教的甲.乙两班(设甲.乙两班 原成绩相近,不存在差别)考试后的成绩是否存在差异? (数据来源:<统计分析基础教程>张文彤 第十一章) 题目分析:该问题涉及是两个独立样本(教学质量和班级)总体,进行总体均值检验,同时总体近似服从正态分布,因此用两独立样本t检验.…
单样本t检验 目的:利用来自总体的样本数据,推断该总体的均值是否与指定的检验值存在差异. 适用条件:样本来自的总体应服从或者近似服从正态分布. 注:当样本量n比较大时:由中心极限定理得知,即使原数据不服从正态分布,但是样本量足够大,他的样本均数抽样分布仍然是正态的,因此,在样本量很大的情况下很少考虑单样本t检验的适用条件: 当样本量n比较小时,总体应服从正态分布: 总结:只要数据没有很强烈的偏态,单样本t检验的分析结果都是稳定的. 案例分析: 案例描述:推断信用卡刷卡金额的平均值是否不低于300…
多IDC数据分布--MySQL多机房部署 - 学习笔记 - 51CTO技术博客 多IDC数据分布--MySQL多机房部署…
DIGITS: Deep Learning GPU Training System1,是由英伟达(NVIDIA)公司开发的第一个交互式深度学习GPU训练系统.目的在于整合现有的Deep Learning开发工具,实现深度神经网络(Deep Neural Network,DNN)设计.训练和可视化等任务变得简单化.DIGITS是基于浏览器的接口,因而通过实时的网络行为的可视化,可以快速设计最优的DNN.DIGITS是开源软件,可在GitHub上找到,因而开发人员可以扩展和自定义DIGITS. Gi…
看过一些人写的学习笔记,完全按书一字不漏照抄,内容很多,真不能叫笔记.遂自己整理了一份,取其精要. 更多笔记请访问@个人简书 [toc] 索引概述 索引即key 在存储引擎层实现,不同引擎工作方式不同 索引优化--最好的查询优化手段,可提效几个数量级 两步查找数据: 磁盘查找索引节点(页),将其调入内存: 内存内业内查找数据 一. 索引类型 B-Tree Hash R-Tree空间数据索引 全文索引 1. B-tree索引 支持引擎:InnoDB,MyISAM,Memory 所有叶子值顺序存储,…
学习利用python进行数据分析的笔记&下星期二内部交流会要讲的内容,一并分享给大家.博主粗心大意,有什么不对的地方欢迎指正~还有许多尚待完善的地方,待我一边学习一边完善~ 前言:各种和数据分析相关python库的介绍(前言1~4摘抄自<利用python进行数据分析>) 1.Numpy: Numpy是python科学计算的基础包,它提供以下功能(不限于此): (1)快速高效的多维数组对象naarray (2)用于对数组执行元素级计算以及直接对数组执行数学运算的函数 (3)用于读写硬盘上…
一.进行误差分析 很多时候我们发现训练出来的模型有误差后,就会一股脑的想着法子去减少误差.想法固然好,但是有点headlong~ 这节视频中吴大大介绍了一个比较科学的方法,具体的看下面的例子 还是以猫分类器为例,假设我们的模型表现的还不错,但是依旧存在误差,预测后错误标记的数据中有一部分狗图片被错误的标记成了猫.这个时候按照一般的思路可能是想通过训练出狗分类器模型来提高猫分类器,或者其他的办法,反正就是要让分类器更好地区分狗和猫. 但是现在的问题是,假如错误分类的100个样本中,只有5个狗样本被…