主要用到了 xlsxrJava 包,打开 Excel 文件,读取各表格数据,再写入到汇总表。

下图为处理前的原始数据表格:

下图为处理后的数据:

代码实现

安装&加载包的函数实现installed.packages() 函数获取所有已安装的包,用以排除已安装的包。install.packages() 函数安装指定的包。library() 加载引入包。

loadLibrary <- function(pkgs) {
uninstalledPkgs <- pkgs[!(pkgs %in% installed.packages()[, "Package"])] if (length(uninstalledPkgs)) {
install.packages(uninstalledPkgs)
} for (pkg in pkgs) {
library(pkg, character.only = TRUE, quietly = TRUE)
}
}

自定义设置。涉及表格文件路径、汇总表名等。

setwd("/path/to/work/dir")            # 工作目录
fileName = "summary_sheet_demo.xlsx" # 处理的表格文件
summaryName = "汇总" # 汇总的 sheet 表名
summarySheet = FALSE # 对象变量、忽略
startRow = 2 # 汇总表中操作起始行

设置 CRAN 源。官方默认源可能比较慢,所以选择国内的源很重要。此处选择了清华 CRAN 源,其他的可参考 CRAN Mirrors

options(repos = "https://mirrors.tuna.tsinghua.edu.cn/CRAN/")

加载依赖包。用到了上述写的安装加载包的函数。

loadLibrary(c("xlsx", "rJava"))

打开工作表loadWorkbook() 打开指定路径的表格文件,并加载到工作簿对象中。

wb <- loadWorkbook(fileName)

遍历查询&汇总数据

# 获取所有表格
sheets <- getSheets(wb) # 循环所有表格,找出需要写入的表
for (sheet in sheets) {
sheetName <- sheet$getSheetName()
if (sheetName == summaryName) {
summarySheet <- sheet
}
} if (summarySheet == FALSE) {
stop(paste("表:", summaryName, "未找到"))
} # 指定Date格式(此处可忽略)
# options(xlsx.date.format='yyyy/MM/dd') # 遍历所有表格
for (sheet in sheets) {
# 过滤掉需写入的表
sheetName <- sheet$getSheetName()
if (sheetName == summaryName) {
next
} # 获取表格【内容行数】
rowNum <- sheet$getLastRowNum()
print(paste("表名:", sheetName, "总共:", rowNum, "行,", sep = " ")) # 读取表格内容 参数 colClasses 指定每列的类型(实际是指定处理该列的类/对象)
data <- read.xlsx2(fileName, sheetName = sheetName, header = FALSE, startRow = 2, colClasses = c("character",
"Date", "integer", "integer", rep("numeric", 2), "integer"))
print(data) # 将表格内容写入汇总的那张表
addDataFrame(data, summarySheet, col.names = FALSE, row.names = FALSE, startRow = startRow) # 累加行数
startRow <- startRow + rowNum
}

把对象内容写入文件中保存

saveWorkbook(wb, fileName)

完整代码

# 包加载/安装包
loadLibrary <- function(pkgs) {
uninstalledPkgs <- pkgs[!(pkgs %in% installed.packages()[, "Package"])] if (length(uninstalledPkgs)) {
install.packages(uninstalledPkgs)
} for (pkg in pkgs) {
library(pkg, character.only = TRUE, quietly = TRUE)
}
} # 自定义配置
setwd("/path/to/work/dir") # 工作目录
fileName = "summary_sheet_demo.xlsx" # 处理的表格文件
summaryName = "汇总" # 汇总的 sheet 表名
summarySheet = FALSE # 对象变量、忽略
startRow = 2 # 汇总表中操作起始行 # 设置CRAN
options(repos = "https://mirrors.tuna.tsinghua.edu.cn/CRAN/") # 加载依赖包
loadLibrary(c("xlsx", "rJava")) # 打开Excel表格
wb <- loadWorkbook(fileName)
# 获取所有表格
sheets <- getSheets(wb) # 循环所有表格,找出需要写入的表
for (sheet in sheets) {
sheetName <- sheet$getSheetName()
if (sheetName == summaryName) {
summarySheet <- sheet
}
} if (summarySheet == FALSE) {
stop(paste("表:", summaryName, "未找到"))
} # 指定Date格式(此处可忽略)
# options(xlsx.date.format='yyyy/MM/dd') # 遍历所有表格
for (sheet in sheets) {
# 过滤掉需写入的表
sheetName <- sheet$getSheetName()
if (sheetName == summaryName) {
next
} # 获取表格【内容行数】
rowNum <- sheet$getLastRowNum()
print(paste("表名:", sheetName, "总共:", rowNum, "行,", sep = " ")) # 读取表格内容 参数 colClasses 指定每列的类型(实际是指定处理该列的类/对象)
data <- read.xlsx2(fileName, sheetName = sheetName, header = FALSE, startRow = 2, colClasses = c("character",
"Date", "integer", "integer", rep("numeric", 2), "integer"))
print(data) # 将表格内容写入汇总的那张表
addDataFrame(data, summarySheet, col.names = FALSE, row.names = FALSE, startRow = startRow) # 累加行数
startRow <- startRow + rowNum
} # 最后需要把对象内容写入文件中
saveWorkbook(wb, fileName)

表格附件

summary_sheet_demo.xlsx


原文地址: https://shockerli.net/post/r-script-to-read-summary-excel/

更多文章请访问我的个人博客: https://shockerli.net

R 脚本读取汇总 Excel 表格数据的更多相关文章

  1. JXL读取写入excel表格数据

    问题描述: 使用java的jxl包创建.写入excel表格数据 问题解决: (1)说明 (2)写入execel数据 注: 以上是写入数据需要调用的函数接口 注: 具体接口调用过程,如上所示 (3)读取 ...

  2. jxl读取Excel表格数据

    调用jxl包实现Excel表格数据的读取,代码如下: import java.io.File; import java.io.IOException; import java.util.ArrayLi ...

  3. C#调用NPOI组件读取excel表格数据转为datatable写入word表格中并向word中插入图片/文字/书签 获得书签列表

    调用word的com组件将400条数据导入word表格中耗时10分钟简直不能忍受,使用NPOI组件耗时4秒钟.但是NPOI中替换书签内容的功能不知道是不支持还是没找到. 辅助类 Excel表格数据与D ...

  4. 利用 pandas库读取excel表格数据

    利用 pandas库读取excel表格数据 初入IT行业,愿与大家一起学习,共同进步,有问题请指出!! 还在为数据读取而头疼呢,请看下方简洁介绍: 数据来源为国家统计局网站下载: 具体方法 代码: i ...

  5. go读取excel表格数据

    go读取excel表格数据 使用工具 github.com/Luxurioust/excelize 百度到的都是使用这个 实际上已经改名了 github.com/360EntSecGroup-Skyl ...

  6. 用多线程优化Excel表格数据导入校验的接口

    公司的需求,当前某个Excel导入功能,流程是:读取Excel数据,传入后台校验每一条数据,判断是否符合导入要求,返回给前端,导入预览展示.(前端等待响应,难点).用户再点击导入按钮,进行异步导入(前 ...

  7. Java操作Jxl实现导出数据生成Excel表格数据文件

    实现:前台用的框架是Easyui+Bootstrap结合使用,需要引入相应的Js.Css文件.页面:Jsp.拦截请求:Servlet.逻辑处理:ClassBean.数据库:SQLserver. 注意: ...

  8. Vue3实现动态导入Excel表格数据

    1.  前言 在开发工作过程中,我们会遇到各种各样的表格数据导入,大部分我们的解决方案:提供一个模板前端进行下载,然后按照这个模板要求进行数据填充,最后上传导入,这是其中一种解决方案.个人认为还有另外 ...

  9. Visual Studio 2010利用libxl读写excel表格数据

    C++读写数据,一般通过txt文件,但是随着数据量的增大,采集数据时运用excel表格的优势得以逐步体现.本文主要介绍一下运用第三方库libxl,对excel表格数据进行读写.分为三个部分,第一部分是 ...

随机推荐

  1. 一. IntelliJ IDEA详细配置文档之初始环境搭建

    前言 对于用惯了eclipse的同学来说, 突然切换为idea不是一件那么容易的事情, 所以我会发布一系列只讲解idea使用技巧的文章, 请大家多多关注.  本系列文章的配置参考网上某教程的讲解, 本 ...

  2. REdis MASTER aborted replication NOAUTH Authentication required

    对于REdis集群,如果设置了requirepass,则一定要设置masterauth,否则从节点无法正常工作,查看从节点日志可以看到哪下内容:19213:S 22 Apr 2019 10:52:17 ...

  3. js打断点

    F12打开调试器         资源sources     找到就是文件    选中需要打断点的行 获得段短点的值:将断点向后执行一步(页面提示的桥状小图标),然后选中上一步需要打断点的值,悬浮在上 ...

  4. 怎么取cxgrid某一列的合计值

    怎么取cxgrid某一列的合计值   1.cxGrid1DBTableView1->optionsview->Footer 设为True 2.cxGrid1DBTableView1-> ...

  5. Monad Explained in One Picture

    The point of Monad is composability. In the green category, T -> Monad<U> and U -> Monad ...

  6. 站在JAVA数据结构的视角看待简单表结构

    1.前言: 我们提到程序中的集合的时候,往往脑海中会浮现出, 如ArrayList和LinkedList以及和HashMap.当然在提到ArrayList和LinkedList的时候,我们大多数的人都 ...

  7. Javascript高级编程学习笔记(26)—— 函数表达式(4)私有变量

    私有变量 严格来讲,JS中没有私有成员的概念,所有对象属性都是公有的. 但是JS中有私有变量的概念 所有在函数中定义的变量都可以认为是私有变量,因为不能在函数外部进行访问 私有变量包括 1.函数参数 ...

  8. MyBatis 的动态 SQL 使用说明

    动态SQL简介 参考文档地址:http://www.mybatis.org/mybatis-3/zh/dynamic-sql.html MyBatis 的强大特性之一便是它的动态 SQL.如果你有使用 ...

  9. Aseprite入门:第一个gif动图

    前言:Aseprite入门教程 1.新建图片: 选择新建文件,然后选定宽高和颜色及背景类型,点击OK进行图片的创建: 2.绘制一个基础图形,为了方便还是选用球形: 填充上颜色: 美化(添加阴影增加小球 ...

  10. java中根据key获取resource下properties资源文件中对应的参数

    properties资源文件是放在resource目录下的: 新建工具类: package com.demo.utils; import java.io.InputStream; import jav ...