R语言数据集的字段含义

作者:马文敏

选择一种数据结构来储存数据

将数据输入或导入到这个数据结构中

数据集的概念

数据集通常是有数据结构的一个矩形数组,行表示规则,列表示变量。

不同的行业对数据集的行和列的叫法不同

统计学家称他们为观测和变量

数据库分析为记录和字段

示例分析者叫他们示例

R语言可以处理的数据类型有很多种包括数据型,字符型,逻辑性,原生性。

2.数据结构

R语拥有很多用于储存数据的对象类型,包括标量,向量,矩阵,数组,数据框和列表。

向量

向量数据必须要有相同的类型和模式的数据,通过给定的元素数值可以访问向量中的元素,用函数c()可创建向量。

myymatrix<-

Matrix(vector.nrow=number

其中vector包含了矩阵的元素,nrow和ncol用于指定的行和列的维数,dimnames包含了可选的,以字符型的向量表示行名和列名,选型byrows则表明矩阵应当按行填充。

矩阵

矩阵是一个二维数组,他通过函数matrix()创建,每一个元素都拥有相同的模式(数值型,字符型,逻辑型)

提取矩阵中的元素时用[.],其中逗号前后分辨率是,行数和列数。

两行的矩阵。

X #查看矩阵内容

数组

数组和矩阵比较类似,但是维度可以大于2。但是他是一个数值型向量,可通过函数ayyay来创建,形式为myarry<-array(vector,dimensions,dimnames0000)其中vector包含了数组中的数据,dimensions是一个数值型向量,给出了各个维度下标的最大值,而dimnames是可选的,各维度名称标签的列表。

数据框

数据框是在R语中比较常见的数据结构。他的作用是当数据有多种模式而无法将这些数据放在一个矩阵中时,这时候就可以选择数据框,同一行列的数据模式必须相同,可通过data,frame()来创建。

使用¥来提取数据库中的特定元素,但是每次输入数据框名,有点麻烦。

列表

列表是R的数据类型中最为复杂的一种,列表就是一些对象的有序集合。列表允许整合若干的对象到单个对象名下。例如,某个列表中可能是若干向量,矩阵,数据框,甚至其他列表组合。可以使用函数list()创建列表。

列表是R中重要的数据结构

列表允许以一种简单的方式组织和重新调用不相干的信息

许多R函数的运行结果都是以列表的形式返回的。

3.数据输入

数据输入可以使用read.table()文本文件中导入数据。

算数表达式。他是直接输入的,输入完成之后按下回车键显示结果,如果想保存输入结果,直接将其命名一个变量即可。

样本数据输入。最常使用的是c()函数,括号内的内容可以是数字或文本,也可以是储存结果的变量,内容间用逗号分隔,如果既有文本也有数字,那么数字将会被强制转换为文本。

数据导入。当数据量较大时,使用c函数和scan函数就会不太方便,虽然scan函数也可以进行文件导输但是主要针对一维数据,当遇到复杂一些数据时,需要使用其他的函数。

参考文献:

百度---E书联盟

火狐---科普中国百科科学词条

火狐---CSDN博客

R语言重要数据集分析研究——R语言数据集的字段含义的更多相关文章

  1. R语言重要数据集分析研究——需要整理分析阐明理念

    1.R语言重要数据集分析研究需要整理分析阐明理念? 上一节讲了R语言作图,本节来讲讲当你拿到一个数据集的时候如何下手分析,数据分析的第一步,探索性数据分析. 统计量,即统计学里面关注的数据集的几个指标 ...

  2. R语言重要数据集分析研究——  数据集本身的分析技巧

    数据集本身的分析技巧           作者:王立敏           文章来源:网络 1.数据集 数据集,又称为资料集.数据集合或资料集合,是一种由数据所组成的集合. Data set(或dat ...

  3. R语言重要数据集分析研究——搞清数据的由来

    搞清数据的由来 作者:李雪丽 资料来源:百度百科

  4. 利用R语言打造量化分析平台

    利用R语言打造量化分析平台 具体利用quantmod包实现对股票的量化分析 1.#1.API读取在线行情2.#加载quantmod包3.if(!require(quantmod)){4. instal ...

  5. R语言实现分层抽样(Stratified Sampling)以iris数据集为例

    R语言实现分层抽样(Stratified Sampling)以iris数据集为例 1.观察数据集 head(iris) Sampling)以iris数据集为例">  选取数据集中前6个 ...

  6. R语言︱SNA-社会关系网络 R语言实现专题(基础篇)(一)

    每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 笔者寄语:这里所有的应用代码都来自与igrap ...

  7. R是用于统计分析、绘图的语言和操作环境

    R是一套完整的数据处理.计算和制图软件系统.其功能包括:数据存储和处理系统:数组运算工具(其向量.矩阵运算方面功能尤其强大):完整连贯的统计分析工具:优秀的统计制图功能:简便而强大的编程语言:可操纵数 ...

  8. R语言中的线性判别分析_r语言 线性判别分析

    R语言中的线性判别分析_r语言 线性判别分析 在R语言中,线性判别分析(Liner Discriminant Analysis,简称LDA),依靠软件包MASS中有线性判别函数lqa()来实现.该函数 ...

  9. R语言学习笔记:小试R环境

    买了三本R语言的书,同时使用来学习R语言,粗略翻下来感觉第一本最好: <R语言编程艺术>The Art of R Programming <R语言初学者使用>A Beginne ...

随机推荐

  1. Net分布式系统之五:微服务架构

    因工作较忙,抽时间将框架遇到的问题和框架升级设计进行记录. 一.背景&问题 之前框架是一个基于SOA思想设计的分布式框架.各应用通过服务方式提供使用,服务之间通信是RPC方式调用,具体实现基于 ...

  2. vue.js2.0 自定义组件初体验

    理解 组件(Component)是 Vue.js 最强大的功能之一.组件可以扩展 HTML 元素,封装可重用的代码.在较高层面上,组件是自定义元素, Vue.js 的编译器为它添加特殊功能.在有些情况 ...

  3. zen coding一个牛的不行的html和css开发工具

    zen coding 是一种仿css选择器的语法来快速开发html和css的开源项目.现已更名为Emmet.可以到github上下载拜读.在这个都想偷懒的世界里,此方法可以极大的缩短开发人员的开发时间 ...

  4. myeclipse10.7安装git插件

    如果想把github上的一些开源项目导入到myeclipse中,一种方法是从github网站上将开源项目下载下来,另一种是使用myeclipse的egit插件直接从github网站上down下来,下面 ...

  5. Linux:PS命令详解与使用

    要对进程进行监测和控制,首先必须要了解当前进程的情况,也就是需要查看当前进程,ps命令就是最基本进程查看命令.使用该命令可以确定有哪些进程正在运行和运行的状态.进程是否结束.进程有没有僵尸.哪些进程占 ...

  6. [大数据]-Elasticsearch5.3.1 IK分词,同义词/联想搜索设置

    --题外话:最近发现了一些问题,一些高搜索量的东西相当一部分没有价值.发现大部分是一些问题的错误日志.而我是个比较爱贴图的.搜索引擎的检索会将我们的博文文本分词.所以图片内容一般是检索不到的,也就是说 ...

  7. 分布式缓存技术redis学习—— 深入理解Spring Redis的使用

    关于spring redis框架的使用,网上的例子很多很多.但是在自己最近一段时间的使用中,发现这些教程都是入门教程,包括很多的使用方法,与spring redis丰富的api大相径庭,真是浪费了这么 ...

  8. 编写第一个python selenium程序(二)

    上节介绍了如何搭建selenium 系统环境,那么本节来讲一下如何开始编写第一个自动化测试脚本. Selenium2.x 将浏览器原生的API封装成WebDriver API,可以直接操作浏览器页面里 ...

  9. 关于web程序快速开发个人见解以及经历

    由于在之前公司业务的发展,需要在基于核心业务的基础上开发其他较为独立的业务系统,所以就有了这个基于Dapper,DDD概念的基础框架,由于个人基于这个框架已经经历过两个系统的开发,也因为其他项目团队需 ...

  10. .net 企业管理系统快熟搭建框架

          简言   本人在博客园注册也2年多了,一直没有写自己的博客,因为才疏学浅一直跟着园子里的大哥们学习这.net技术.一年之前跳槽到现在的公司工作,由于公司没有自己一套的开发框架,每次都要重新 ...