1 tibble包简介

包名: tibble
编码: UTF-
最新版本: 1.2
标题: 简单数据框
描述: 构建一个 'tbl_df' 类，可以比传统的R数据框提供更好的检查和打印功能。
作者: Hadley Wickham , Romain Francois ,Kirill Müller, RStudio
URL: https://github.com/hadley/tibble
要求: R (>= )
Github: https://github.com/hadley/tibble

　　tibble包是一个轻量级的包，它实现的data.frame的重新塑造，保留了data.frame中经过实践证明有效的部分，吸取了专注于数据操作的dplyr包的基本思想。tibble包提供了更优于data.frame的性能，包括：打印，提取子集和因子操作。

tibble包内提供的主要函数：

名称	功能
as_tibble	强制转换lists和matrices为数据框(data.frame)
tibble	创建数据框(data.frame)或列表(list)
tribble	智能行(Row-wise)创建tibble
obj_sum/ type_sum/ tbl_sum	给出对象的简明摘要：对象类型和数据框大小
rownames	行名的操作工具（非常有用）：可以提取行名为列或列为行名
has_name	检查命名元素的存在has_name(iris, "Species")
repair_names	修复对象的名称（如果没有命名则用V+i代替）
all_equal	数据框相等的柔性比较，忽略行和列的排列顺序
glimpse	有点像str()，主要是查看数据集的结构
enframe	将向量变为数据框
print.tbl_df	print(x,n)打印数据集x的前n行，默认为10行，有点像head()
add_column	给数据框添加列
add_row	给数据框添加行
is.tibble	检测对象是否为tibble
knit_print.trunc_mat	截断显示

2 安装和使用

2.1 安装

从CRAN安装：

install.packages("tibble")

从github安装：

# install.packages("devtools")
devtools::install_github("hadley/tibble")

2.2 创建tibbles对象

可以利用as_tibble()函数将已经存在的对象（data.frame,list,matrix,or table）强制转为tibble对象：

library(tibble)
as_tibble(iris)
#> # A tibble:  ×
#>    Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#>           <dbl>       <dbl>        <dbl>       <dbl>  <fctr>
#>            5.1         3.5          1.4         0.2  setosa
#>            4.9         3.0          1.4         0.2  setosa
#>            4.7         3.2          1.3         0.2  setosa
#>            4.6         3.1          1.5         0.2  setosa
#>            5.0         3.6          1.4         0.2  setosa
#>            5.4         3.9          1.7         0.4  setosa
#>            4.6         3.4          1.4         0.3  setosa
#>            5.0         3.4          1.5         0.2  setosa
#>            4.4         2.9          1.4         0.2  setosa
#>           4.9         3.1          1.5         0.1  setosa
#> # ... with  more rows

也可以利用tibble()函数创建：

tibble(x = :, y = , z = x ^  + y)
#> # A tibble:  ×
#>       x     y     z
#>   <int> <dbl> <dbl>
#>
#>
#>
#>
#>               

a <- :
tibble(a, b = a * )
## # A tibble:  ×
##       a     b
##    <int> <dbl>
##
##
##
##
##          

tibble(a, b = a * , c = )
## # A tibble:  ×
##       a     b     c
##     <int> <dbl> <dbl>
##
##
##
##
##               

tibble(x = runif(), y = x * )
# # A tibble:  ×
#        x         y
#      <dbl>     <dbl>
#   0.7098188 1.4196377
#   0.2790267 0.5580533
#   0.2655437 0.5310874
#   0.1237294 0.2474587
#   0.9018147 1.8036293
#   0.1594413 0.3188827
#   0.2592028 0.5184056
#   0.6570324 1.3140648
#   0.8955551 1.7911102
#  0.1940897 0.3881794

tibble(x = letters)
# # A tibble:  ×
#        x
#      <chr>
#       a
#       b
#       c
#       d
#       e
#       f
#       g
#       h
#       i
#      j
# # ... with  more rows

tibble(x = :, y = list(:, :, :))
#> # A tibble:  ×
#>       x          y
#>   <int>     <list>
#>        <]>
#>       <]>
#>       <]>

也可以使用tribble()函数一行一行的定义一个tibble对象：

tribble(
  ~x, ~y,  ~z,
  ,  3.6,
  ,  8.5
)
#> # A tibble:  ×
#>       x     y     z
#>   <chr> <dbl> <dbl>
#>      a        3.6
#>      b        8.5

查看类型，最底层还是data.frame：

class(as_tibble(iris))
#> [] "tbl_df"     "tbl"        "data.frame"

2.3 添加行和列

### 添加行
add_row(.data, ..., .before = NULL, .after = NULL)
.data 要添加的数据框
.before , .after  在哪行之前或之后添加该数据
df <- tibble(x = :, y = :)
df
#> # A tibble:  ×
#>       x     y
#>   <int> <int>
#>
#>
#>           1

library(dplyr)
df %>% add_row(x = 4, y = 0, .before = 2)
#> # A tibble: 4 × 2
#>       x     y
#>   <dbl> <dbl>
#> 1     1     3
#> 2     4     0
#> 3     2     2
#> 4     3     1

df %>% add_row(x = 4:5, y = 0:-1)
#> # A tibble: 5 × 2
#>       x     y
#>   <int> <int>
#> 1     1     3
#> 2     2     2
#> 3     3     1
#> 4     4     0
#> 5     5    -1

add_row(df, x = 4)
#> # A tibble: 4 <U+00D7> 2
#>       x     y
#>   <dbl> <int>
#> 1     1     3
#> 2     2     2
#> 3     3     1
#> 4     4    NA

### 添加列
add_column(.data, ..., .before = NULL, .after = NULL)
.data 要添加的数据框
.before , .after  在哪行=列之前或之后添加该数据

df %>%
  add_column(z = -:, w = )
#> # A tibble:  ×
#>       x     y     z     w
#>   <int> <int> <int> <dbl>
#>               -
#>
#>                     

df %>%
  add_column(z = -:, .after = )
#> # A tibble:  ×
#>       x     z     y
#>   <int> <int> <int>
#>          -
#>
#>                

df %>%
  add_column(w = :, .before = "x")
#> # A tibble:  ×
#>       w     x     y
#>   <int> <int> <int>
#>
#>
#>

2.4 命名操作

2.4.1 rownames 行名的操作工具

　　df 数据框

　　var 用于rownames的列的名称

　　has_rownames(df) 确定数据框是否有行名

　　remove_rownames(df) 删除数据框的行名

library(tibble)
head(mtcars)
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4
## Mazda RX4 Wag
## Datsun
## Hornet  Drive
## Hornet Sportabout
## Valiant                         

head(iris)
##    Sepal.Length Sepal.Width Petal.Length Petal.Width Species
##           5.1         3.5          1.4         0.2  setosa
##           4.9         3.0          1.4         0.2  setosa
##           4.7         3.2          1.3         0.2  setosa
##           4.6         3.1          1.5         0.2  setosa
##           5.0         3.6          1.4         0.2  setosa
##           5.4         3.9          1.7         0.4  setosa

has_rownames(mtcars)
## [] TRUE

has_rownames(iris)
## [] FALSE

has_rownames(remove_rownames(mtcars))
## [] FALSE

head(remove_rownames(mtcars))
##    mpg cyl disp  hp drat    wt  qsec vs am gear carb
##
##
##
##
##
##

　　rownames_to_column(df, var = "rowname") 数据框的行名作为数据框的列，列名为rowname

　　column_to_rownames(df, var = "rowname") 数据框的某列作为行名

head(rownames_to_column(mtcars,"row2col"))
##             row2col  mpg cyl disp  hp drat    wt  qsec vs am gear carb
##          Mazda RX4
##      Mazda RX4 Wag
##         Datsun
##     Hornet  Drive
##  Hornet Sportabout
##            Valiant               

mtcars_tbl <- as_tibble(rownames_to_column(mtcars))
mtcars_tbl
# # A tibble:  ×
#              rowname   mpg   cyl  disp    hp  drat    wt  qsec    vs    am
#                <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#           Mazda RX4
#       Mazda RX4 Wag
#          Datsun
#      Hornet  Drive
#   Hornet Sportabout
#             Valiant
#          Duster
#           Merc 240D
#            Merc
#           Merc
# # ... with  more rows, and  more variables: gear <dbl>, carb <dbl>

head(column_to_rownames(as.data.frame(mtcars_tbl)))
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4
## Mazda RX4 Wag
## Datsun
## Hornet  Drive
## Hornet Sportabout
## Valiant                         

df <- rownames_to_column(mtcars,"row2col")
column_to_rownames(df,"row2col")

2.4.2 has_name 检查数据框或者其他对象中是否存在指定命名元素，返回逻辑值（TRUE or FALSE）

has_name(x, name)
x  数据框或其他命名对象
name  需检查的元素

has_name(iris, "Species")
## [] TRUE

has_name(mtcars, "gears")
## [] FALSE

2.4.3 repair_names 修复对象的名称（如果没有命名则用V+i代替）

repair_names(x, prefix = "V", sep = "")
x  命名的向量
prefix  字符串，前缀，该前缀用于新列名
sep  分隔符

list(, , )
# [[]]
# []
#
# [[]]
# []
#
# [[]]
# [] 

repair_names(list(, , )) # works for lists, too
# $V1
# []
#
# $V2
# []
#
# $V3
# [] 

tbl <- as_tibble(structure(list(, , ), class = "data.frame"),validate = FALSE)
tbl
# A tibble:  ×
# ... with  variables:  <dbl>,  <dbl>,  <dbl>
repair_names(tbl)
# A tibble:  <U+00D7>
# ... with  variables: V1 <dbl>, V2 <dbl>, V3 <dbl>

repair_names(list(,,),prefix = "new",sep = "-")
# $``
# []
#
# $``
# []
#
# $``
# []

2.5 其他函数

2.5.1 obj_sum/ type_sum/ tbl_sum 给出对象的简明摘要：对象类型和数据框大小

obj_sum(x)
# 如果is_s3_vector值为TRUE，也就是是S3类型的向量，同时返回对象的尺寸的对象数据类型

type_sum(x)
# 给出对象类型简短摘要

tbl_sum(x)
# 给出一个类似于表对象的简短的文字描述，包括维数，数据源，可能的组（for dplyr）

is_vector_s3(x)

> obj_sum(:)
# [] "int [10]"

> obj_sum(matrix(:))
# [] "int [10 <U+00D7> 1]"

> obj_sum(Sys.Date())
# [] "date [1]"

> obj_sum(Sys.time())
# [] "dttm [1]"

> obj_sum(mean)
# [] "fun"

2.5.2 all_equal 数据框柔性比较，忽略行和列的排列顺序

　　当使用all.equal比较两个tbl_df，默认情况下行和列的顺序是被忽略的，并且类型也不是强制要求。

all_equal(target, current, ignore_col_order = TRUE, ignore_row_order = TRUE, convert = FALSE, ...)
"all.equal"(target, current, ignore_col_order = TRUE, ignore_row_order = TRUE, convert = FALSE, ...)

参数：
target, current 要比较的两个数据框
ignore_col_order 是否需要忽略列顺序，默认为TRUE
ignore_row_order 是否需要忽略行顺序，默认为TRUE
convert  是否需要转换为相似的类型，默认为FALSE，如果为TRUE，会将因子factor转为字符character，整型integer double转为双精度浮点型
...

# 对行号和列号进行采样，打乱行列顺序
scramble <- function(x) x[sample(nrow(x)), sample(ncol(x))]

#　转为tbl-df类型
mtcars_df <- as_tibble(mtcars)

# 默认情况下行列顺序是忽略的
all.equal(mtcars_df, scramble(mtcars_df))
# [] TRUE

# 修改默认行列顺序不被忽略
all.equal(mtcars_df, scramble(mtcars_df), ignore_col_order = FALSE)
# [] TRUE

all.equal(mtcars_df, scramble(mtcars_df), ignore_row_order = FALSE)
# [] "Component “mpg”: Mean relative difference: 0.3503521"
# [] "Component “cyl”: Mean relative difference: 0.4912281"
# [] "Component “disp”: Mean relative difference: 0.5690846"
# [] "Component “hp”: Mean relative difference: 0.5386953"
# [] "Component “drat”: Mean relative difference: 0.1387415"
# [] "Component “wt”: Mean relative difference: 0.3286861"
# [] "Component “qsec”: Mean relative difference: 0.1222072"
# [] "Component “vs”: Mean relative difference: 2"
# [] "Component “am”: Mean relative difference: 2"
# [] "Component “gear”: Mean relative difference: 0.32"
# [] "Component “carb”: Mean relative difference: 0.8"

# 默认情况下all.equal对变量的差异很敏感
df1 <- tibble(x = "a")
df2 <- tibble(x = factor("a"))
all.equal(df1, df2)
# [] "Incompatible type for column x: x character, y factor"

all.equal(df1, df2,convert = TRUE)
# [] "Factor levels not equal for column x"
# Warning message:
#   Incompatible type for column x: x character, y factor

2.5.3 glimpse 有点像str()，主要是查看数据集的结构

glimpse(x, width = NULL, ...)
x glimpse的对象
width 输出宽度：默认为tibble.width设定的宽度（如果有限）或者是控制台显示的宽度

glimpse(mtcars)

# Observations:
# Variables:
# $ mpg  <dbl> ...
# $ cyl  <dbl> , , , , , , , , , , , , , , , , , , , , ,...
# $ disp <dbl> 160.0, 160.0, 108.0, 258.0, 360.0, 225.0, 360.0, 146.7, 140.8,...
# $ hp   <dbl> , , , , , , , , , , , , , ...
# $ drat <dbl> ....
# $ wt   <dbl> 2.620, 2.875, 2.320, 3.215, 3.440, 3.460, 3.570, 3.190, 3.150,...
# $ qsec <dbl> 16.46, 17.02, 18.61, 19.44, 17.02, 20.22, 15.84, 20.00, 22.90,...
# $ vs   <dbl> , , , , , , , , , , , , , , , , , , , , ,...
# $ am   <dbl> , , , , , , , , , , , , , , , , , , , , ,...
# $ gear <dbl> , , , , , , , , , , , , , , , , , , , , ,...
# $ carb <dbl> , , , , , , , , , , , , , , , , , , , , ,...

if (!requireNamespace("nycflights13", quietly = TRUE))
  stop("Please install the nycflights13 package to run the rest of this example")

# install.packages("nycflights13")

glimpse(nycflights13::flights)

# Observations: ,
# Variables:
# $ year           <, , , , , , , , ...
# $ month          <, , , , , , , , , , , , , , , , , ...
# $ day            <, , , , , , , , , , , , , , , , , ...
# $ dep_time       <, , , , , , , , , , ...
# $ sched_dep_time <, , , , , , , , , , ...
# $ dep_delay      <dbl> , , , -, -, -, -, -, -, -, -, -, -, -,...
# $ arr_time       <, , , , , , , , , , ...
# $ sched_arr_time <, , , , , , , , , , ...
# $ arr_delay      <dbl> , , , -, -, , , -, -, , -, -, ,...
# $ carrier        <chr> "UA", "UA", "AA", "B6", "DL", "UA", "B6", "EV", "B6"...
# $ flight         <, , , , , , , , , ...
# $ tailnum        <chr> "N14228", "N24211", "N619AA", "N804JB", "N668DN", "N...
# $ origin         <chr> "EWR", "LGA", "JFK", "JFK", "LGA", "EWR", "EWR", "LG...
# $ dest           <chr> "IAH", "IAH", "MIA", "BQN", "ATL", "ORD", "FLL", "IA...
# $ air_time       <dbl> , , , , , , , , , , ...
# $ distance       <dbl> , , , , , , , , , ...
# $ hour           <dbl> , , , , , , , , , , , , , , , , , ...
# $ minute         <dbl> , , , , , , , , , , , , , , , ...
# $ time_hour      <dttm> -- ::, -- ::, --...

2.5.4 enframe 将向量变为数据框

　　将元向量或者列表转为两列的数据框，如果元向量没有命名，使用自然序列命名列。

enframe(x, name = "name", value = "value")
x 元向量
name,value  两列命名，默认分别为name和value

enframe(:)
# # A tibble:  ×
#   name value
#   <int> <int>
#
#
#           

enframe(c(a = , b = ))
# # A tibble:  ×
#    name value
#   <chr> <dbl>
#      a
#      b

2.5.5 print.tbl_df

　　print(x,n)打印数据集x的前n行，默认为10行，有点像head()

　　描述矩阵的工具

"print"(x, ..., n = NULL, width = NULL, n_extra = NULL)

trunc_mat(x, n = NULL, width = NULL, n_extra = NULL)

x 展示的对象
n 要显示的行，如果为NULL(默认)并且行数小于tibble.print_max设定的值则会打印所有的行，否则会打印tibble.print_max设定的函数
width 生成的文本的宽度默认为NULL，此种情况下和使用getOption("tibble.width")或者getOption("width")设定值；后者只显示适应屏幕的列。也可以设定options(tibble.width = Inf)来显示所有的列
n_extra 整个tibble的宽度太小而打印的额外的信息，默认为NULL，会打印tibble.max_extra_cols作为额外的列信息

trunc_mat(mtcars)
# # data.frame [ × ]
#      mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
# *  <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#
#
#
#
#
#
#
#
#
#
# ... with  more rows

print(as_tibble(mtcars))
# # A tibble:  ×
#      mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
# *  <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#
#
#
#
#
#
#
#
#
#
# ... with  more rows

print(as_tibble(mtcars), n = )
# # A tibble:  ×
#     mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
# * <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#
# # ... with  more rows
print(as_tibble(mtcars), n = )
# # A tibble:  ×
#      mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
# * <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#
#
#
# # ... with  more rows
print(as_tibble(mtcars), n = )
# 全部打印

if (!requireNamespace("nycflights13", quietly = TRUE))
  stop("Please install the nycflights13 package to run the rest of this example")

print(nycflights13::flights, n_extra = )
print(nycflights13::flights, width = Inf)

2.5.6 is.tibble 检测对象是否为tibble

is.tibble(x)
is_tibble(x)

参考链接：http://www.rdocumentation.org/packages/tibble/versions/1.2

本文链接：http://www.cnblogs.com/homewch/p/5827928.html

tibble包：高效显示表格数据的结构的更多相关文章

接收Android数据递归显示表格数据
<html> <head> <title>展示</title> <script type="text/javascript" ...
MySQL在控制台上以竖行显示表格数据
直接在SQL语句后面加\G即可,如: select * from user limit 10\G; 如果想要知道这些参数可以直接在命令行后面加入\?
jxl读取Excel表格数据
调用jxl包实现Excel表格数据的读取,代码如下: import java.io.File; import java.io.IOException; import java.util.ArrayLi ...
SSM_CRUD新手练习（9）显示分页数据
我们已经做好了用来显示数据的分页模板,现在只需要将我们从后台取出的数据填充好,显示出来. 我们使用<c:forEach>标签循环取出数据,所以需要先导入JSTL标签库 <%@ tag ...
easyui学习笔记7—在手风琴中显示表格
在这一篇中我们看看如何在手风琴里面显示表格数据的. 1.先看看引用的资源 <link rel="stylesheet" type="text/css" h ...
如何在iOS地图上高效的显示大量数据
2016-01-13 / 23:02:13 刚才在微信上看到这篇由cocoachina翻译小组成员翻译的文章,觉得还是挺值得参考的,因此转载至此,原文请移步:http://robots.thought ...
[ios3-地图] 如何在iOS地图上高效的显示大量数据 [转]
[转至:http://blog.csdn.net/pjk1129/article/details/17358337] 原文:How To Efficiently Display Large Amoun ...
R语言数据分析利器data.table包 —— 数据框结构处理精讲
R语言data.table包是自带包data.frame的升级版,用于数据框格式数据的处理,最大的特点快.包括两个方面,一方面是写的快,代码简洁,只要一行命令就可以完成诸多任务,另一方面是处理 ...
DT包 -- R语言中自定义表格数据
DT 包提供了 JavaScript 库 DataTables 的一个R接口,它使得R对象(矩阵或数据框)可以在HTML页面上显示为表格. 该包的DataTables函数生成的表格提供了数据的筛选.分 ...

随机推荐

ztree.js的使用整理
/** 配置:知识点管理 */ var setting = { view: { showIcon: false, addDiyDom: addPrevDom, addHoverDom: addHove ...
我的SqlHelper类！
using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Threa ...
Redis总结（四）Redis 的持久化
前面已经总结了Redis 的安装和使用今天讲下Redis 的持久化. redis跟memcached类似,都是内存数据库,不过redis支持数据持久化,也就是说redis可以将内存中的数据同步到磁盘来 ...
js中解决函数中使用外部函数局部变量的问题（闭包问题）
如果要取得外部for循环中i的值则必须使用闭包才能解决如果不使用闭包,直接使用变量 i 的值是无效的,因为 i 已经在函数调用之前被回收了,所以你是调用不到它的!
PhpStorm 8.x/9.x 快捷键设置/个性化设置，如何多项目共存？如何更换主题？
1."自定义"常用快捷键(设置成跟Eclipse差不多) 按照路径:File -> Settings -> Appearance & Behavior -> ...
js跨域解决方案（转载）
1.什么是跨域我们经常会在页面上使用ajax请求访问其他服务器的数据,此时,客户端会出现跨域问题. 跨域问题是由于javascript语言安全限制中的同源策略造成的. 简单来说,同源策略是指一段脚本 ...
[PHP][位转换积累]之pack和unpack
一.前面的话 PHP的pack和unpack提供了为一系列数据打包(pack)和解包(unpack)成2进制流的功能,这个功能在面向字节的字符串处理和套接字的编程环境中尤为适用. 在了解这两个函数之前 ...
Angular2 管道
1. 说明管道用来转换模板显示的内容,应用程序中经常出现获取数据,转换数据,显示数据的逻辑.管道就是用来在转换数据阶段起作用的.主要存在两种类型的管道,pure pipe和impure pipe 2 ...
linux 使用 nvidia 的 gpu
第一种方法: [Wizard@Wizard ~]$ nvidia-detect kmod-nvidiaOptimus hardware detected: An Intel display contr ...
eclipse配置jdk的src.zip源代码步骤
MyEclipse配置JDK的源代码的src.zip包很简单.只需要简单的几个步骤. 1.点 “window”-> “Preferences” -> “Java” -> “Insta ...

tibble包：高效显示表格数据的结构