能够用来做统计分析的软件和程序很多,目前应用比较广泛的包括:SPSS, SAS、R语言,Matlab,S-PLUS,S-Miner等。下面我们来看一下各应用的特点:

SPSS: 最简单的,都是菜单操作,不过不利于二次程序开发。

SAS: 需要购买,该软件录入语言要非常精确,不能出错,难操作。

R语言:免费软件,可以菜单操作,不过一般要编程的,二次程序开发。

Matlab:基本是程序操作,和R语言差不多,不过功能比较强大。

S-PLUS: 需要购买,基本也是菜单操作,和SPSS差不多。

R与SPSS、SAS相比较,拥有非常突出的优势:

1)产品线齐全。在功能与产品线齐全上已经远远超出SPSS,而与SAS不相上下。有些R的包,比如基因分析常用的Bioconductor在在线基因数据库连接等众多功能上甚至已经远远超出商业软件。

2)免费。请注意,标记为TM或者®符号的软件均需要在SPSS、SAS的基础模块基础之上另行购买,费用往往在千元美元以上。而R的一切功能均是免费。

3)开放。由于R本身是一个统计语言环境,再新的统计模型也很快能实现,所以在结构方程模型、项目反应理论、认知诊断等众多心理测量所使用的功能上,没有现成的统计软件包,使用R则完全可以自己编写算法。同样,由于R是完全开源,我们可以很快地基于研究者已经开发出的算法编写更适合自己情况的算法。

表:R与SAS、SPSS之比较

主题

SAS产品线

SPSS产品线

R语言相关包

高级模块

SAS/STAT®

SPSS Advanced Models™

stat, MASS及众多扩展包

基础模块

SAS®

SPSS Base™

R

联合分析

SAS/STAT®: Transreg

SPSS Conjoint™

homals, psychoR , bayesm

对应分析

SAS/STAT®: Corresp

SPSS Categories™

homals, MASS, FactoMineR ade4, PTAk, cocorresp, vegan, made4, PsychoR

自定义表格

SAS Base® Report、SQL, Tabulate

SPSS Custom Tables™

reshape

数据接口

SAS/ACCESS®

SPSS Data Access Pack™

DBI, foreign, RODBC

数据挖掘

Enterprise Miner™

Clementine®

rattle, arules, FactoMineR

数据校验

Various procedures

Various procedures, SPSS Data Preparation™

dprep, various functions

Exact Tests

SAS/STAT®: various

SPSS Exact Tests™

coin, elrm, exactLoglinTest, exactmaxsel, exactRankTests,及其他许多包

基因分析

SAS/Genetics®, SAS/Microarray® Solution®, JMP Genomics®

Bioconductor

GIS

SAS/GIS®, SAS/Graph®

SPSS Maps™

maps, mapdata, mapproj, GRASS via spgrass6, RColorBrewer及其他包的部分功能

交互图

Enterprise Guide®

SPSS Base™

JGR, R Commander, pmg, Sciviews

SAS/INSIGHT®

GGobi via rggobi iPlots, Mondrian via Rserve

统计图

SAS/GRAPH®

SPSS Base™

ggplot, gplots, graphics, grid, gridBase, hexbin, lattice, plotrix, scatterplot3d, vcd, lot, geneplotter, Rgraphics

分析向导

SAS/LAB®

矩阵数学

SAS/IML®, SAS/IML

SPSS Matrix™

R, matlab, Matrix, sparseM

缺省值分析

SAS/STAT®: MI

SPSS Missing Values Analysis™

aregImpute (Hmisc), EMV, fit.mult.impute (Design), mice, mitools, mvnmle

统筹研究

SAS/OR®

glpk, linprog, LowRankQP, TSP

统计效力检验

SAS® Power and Sample Size Application, SAS/STAT: Power, GLM Power

SamplePower™

asypow, powerpkg, pwr, MBESS

品质控制

SAS/QC®

SPSS Base™

qcc, spc

回归模型

SAS/BASE®

SPSS Regression Models™

R, Hmisc, Design, lasso, VGAM, pda

抽样及调查

SAS/STAT®: surveymeans,等

SPSS Complex Samples™

pps, sampfling, sampling, spsurvey, survey

结构方程模型

SAS/STAT®: Calis

Amos™

sem

文本分析

Text Miner

SPSS Text Analysis for Surveys™, Text Miner for Clementine®

Rstem, lsa, tm

时间序列

SAS/ETS®

SPSS Trends™ Expert Modeler

大量的包可完成

决策树

Enterprise Miner™

SPSS Classification Trees™, AnswerTree™

ada, adabag, BayesTree, boost, GAMboost, gbev, gbm, maptree, mboost, mvpart, party, pinktoe, quantregForest, rpart, rpart.permutation, randomForest, randomForests, tree

R语言统计分析应用与SAS、SPSS的比较的更多相关文章

  1. R语言统计分析技术研究 特征值选择技术要点

    特征值选择技术要点                          作者:王立敏 文章来源:  网络 1.特征值 特征值是线性代数中的一个重要概念.在数学,物理学,化学,计算机等领域有着广泛的应用. ...

  2. 石头剪刀布 R语言统计分析

    关于石头剪刀布,做出了详细的分析,具体ppt见地址 http://files.cnblogs.com/files/GMGHZ971322/R%E8%AF%AD%E8%A8%80.pptx 16级电商三 ...

  3. R语言统计分析技术研究——卡方检验的思想和实现

    卡方检验的思想和实现 作者:李雪丽 材料摘自:百度

  4. R语言统计分析技术研究——岭回归技术的原理和应用

    岭回归技术的原理和应用 作者马文敏 岭回归分析是一种专用于共线性分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息,降低精度为代价获得回归系数更为符合 ...

  5. 统计编程的框架与R语言统计分析基础——摘(2)统计分析之线性回归

    一.线性回归 1.简单线性回归 a. > x = women > x height weight 1 58 115 2 59 117 3 60 120 4 61 123 5 62 126 ...

  6. 统计编程的框架与R语言统计分析基础——摘(1)

    清屏命令ctrl+L 一.基础 1.产生数据结构 a.直接输入 b.冒号,1:10 c.seq函数 d.rep函数 > 1:10 [1] 1 2 3 4 5 6 7 8 9 10 > 10 ...

  7. 统计计算与R语言的资料汇总(截止2016年12月)

    本文在Creative Commons许可证下发布. 在fedora Linux上断断续续使用R语言过了9年后,发现R语言在国内用的人逐渐多了起来.由于工作原因,直到今年暑假一个赴京工作的机会与一位统 ...

  8. R语言重要数据集分析研究——需要整理分析阐明理念

    1.R语言重要数据集分析研究需要整理分析阐明理念? 上一节讲了R语言作图,本节来讲讲当你拿到一个数据集的时候如何下手分析,数据分析的第一步,探索性数据分析. 统计量,即统计学里面关注的数据集的几个指标 ...

  9. 《R语言实战》读书笔记 第七章--基本统计分析

    在导入数据并且将数据进行组织和初步可视化以后,需要对数据进行分布探索和两两关系分析等.主要内容有描述性统计分析.频数表和列联表.相关系数和协方差.t检验.非参数统计. 7.1描述性统计分析 7.1.1 ...

随机推荐

  1. HDU 4585 Shaolin (STL)

    Shaolin Time Limit: 3000/1000 MS (Java/Others)    Memory Limit: 65535/32768 K (Java/Others)Total Sub ...

  2. Nginx对某个目录或整个网站进行登录认证的方法

    比如要对 网站目录下的 test 文件夹 进行加密认证 首先需要在opt 的主目录中 /opt/ 创建一个新文件 htpasswd此文件的书写格式是用户名:密码每行一个账户并且 密码必须使用函数 cr ...

  3. 【Oracle】Oracle索引

    在关系数据库中,索引是一种与表有关的数据库结构,它可以使对应于表的SQL语句执行得更快.索引的作用相当于图书的目录,可以根据目录中的页码快速找到所需的内容. 对于数据库来说,索引是一个必选项,但对于现 ...

  4. 算法中的 log 到底是什么?

    之前一直不解为何算法中经常会看到 log 今天看<数据结构与算法分析 Java 语言描述>(第 3 版)2.4.3 节 求最大子序列和的分治算法实现时才注意到原因 翻看第 29 页的最后一 ...

  5. mysql升级5.5

    对付Linux的问题,其实很多都是权限问题,细心想一下即可. centos6.4默认装的是mysql5.1,使用 yum update 也update不了.google了一下,找到个yum安装的方法: ...

  6. 一步一步掌握线程机制(六)---Atomic变量和Thread局部变量

    前面我们已经讲过如何让对象具有Thread安全性,让它们能够在同一时间在两个或以上的Thread中使用.Thread的安全性在多线程设计中非常重要,因为race condition是非常难以重现和修正 ...

  7. Oracle 12C -- CDB的启动过程

    以启动DB12为例子 $ sqlplus '/as sysdba' SQL*Plus: Release Production on Sun Nov :: Copyright (c) , , Oracl ...

  8. PHP基本的语法以及和Java的差别

    .表示字符串相加 ->同Java中的. $作为变量的前缀,除此之外.变量名称定义规则同Java 參数传递和方法返回时传引用须要加前缀& 演示样例代码: function f(&$ ...

  9. 使用GDI+进行图片处理时要注意的问题

    原文链接: http://blog.csdn.net/chenlycly/article/details/24112955 与GDI相比,GDI+要强大很多.对于Windows应用程序来说,用GDI是 ...

  10. gcc cc1: all warnings being treated as errors

    cc1: all warnings being treated as errors 在Makefile中找到 -Werror项,删除即可.删除后重新编译. 或设置环境变量 c工程设置 export C ...