R 脚本读取汇总 Excel 表格数据
主要用到了
xlsx
和rJava
包,打开 Excel 文件,读取各表格数据,再写入到汇总表。
下图为处理前的原始数据表格:
下图为处理后的数据:
代码实现
安装&加载包的函数实现。installed.packages()
函数获取所有已安装的包,用以排除已安装的包。install.packages()
函数安装指定的包。library()
加载引入包。
loadLibrary <- function(pkgs) {
uninstalledPkgs <- pkgs[!(pkgs %in% installed.packages()[, "Package"])]
if (length(uninstalledPkgs)) {
install.packages(uninstalledPkgs)
}
for (pkg in pkgs) {
library(pkg, character.only = TRUE, quietly = TRUE)
}
}
自定义设置。涉及表格文件路径、汇总表名等。
setwd("/path/to/work/dir") # 工作目录
fileName = "summary_sheet_demo.xlsx" # 处理的表格文件
summaryName = "汇总" # 汇总的 sheet 表名
summarySheet = FALSE # 对象变量、忽略
startRow = 2 # 汇总表中操作起始行
设置 CRAN 源。官方默认源可能比较慢,所以选择国内的源很重要。此处选择了清华 CRAN 源,其他的可参考 CRAN Mirrors。
options(repos = "https://mirrors.tuna.tsinghua.edu.cn/CRAN/")
加载依赖包。用到了上述写的安装加载包的函数。
loadLibrary(c("xlsx", "rJava"))
打开工作表。loadWorkbook()
打开指定路径的表格文件,并加载到工作簿对象中。
wb <- loadWorkbook(fileName)
遍历查询&汇总数据。
# 获取所有表格
sheets <- getSheets(wb)
# 循环所有表格,找出需要写入的表
for (sheet in sheets) {
sheetName <- sheet$getSheetName()
if (sheetName == summaryName) {
summarySheet <- sheet
}
}
if (summarySheet == FALSE) {
stop(paste("表:", summaryName, "未找到"))
}
# 指定Date格式(此处可忽略)
# options(xlsx.date.format='yyyy/MM/dd')
# 遍历所有表格
for (sheet in sheets) {
# 过滤掉需写入的表
sheetName <- sheet$getSheetName()
if (sheetName == summaryName) {
next
}
# 获取表格【内容行数】
rowNum <- sheet$getLastRowNum()
print(paste("表名:", sheetName, "总共:", rowNum, "行,", sep = " "))
# 读取表格内容 参数 colClasses 指定每列的类型(实际是指定处理该列的类/对象)
data <- read.xlsx2(fileName, sheetName = sheetName, header = FALSE, startRow = 2, colClasses = c("character",
"Date", "integer", "integer", rep("numeric", 2), "integer"))
print(data)
# 将表格内容写入汇总的那张表
addDataFrame(data, summarySheet, col.names = FALSE, row.names = FALSE, startRow = startRow)
# 累加行数
startRow <- startRow + rowNum
}
把对象内容写入文件中保存。
saveWorkbook(wb, fileName)
完整代码
# 包加载/安装包
loadLibrary <- function(pkgs) {
uninstalledPkgs <- pkgs[!(pkgs %in% installed.packages()[, "Package"])]
if (length(uninstalledPkgs)) {
install.packages(uninstalledPkgs)
}
for (pkg in pkgs) {
library(pkg, character.only = TRUE, quietly = TRUE)
}
}
# 自定义配置
setwd("/path/to/work/dir") # 工作目录
fileName = "summary_sheet_demo.xlsx" # 处理的表格文件
summaryName = "汇总" # 汇总的 sheet 表名
summarySheet = FALSE # 对象变量、忽略
startRow = 2 # 汇总表中操作起始行
# 设置CRAN
options(repos = "https://mirrors.tuna.tsinghua.edu.cn/CRAN/")
# 加载依赖包
loadLibrary(c("xlsx", "rJava"))
# 打开Excel表格
wb <- loadWorkbook(fileName)
# 获取所有表格
sheets <- getSheets(wb)
# 循环所有表格,找出需要写入的表
for (sheet in sheets) {
sheetName <- sheet$getSheetName()
if (sheetName == summaryName) {
summarySheet <- sheet
}
}
if (summarySheet == FALSE) {
stop(paste("表:", summaryName, "未找到"))
}
# 指定Date格式(此处可忽略)
# options(xlsx.date.format='yyyy/MM/dd')
# 遍历所有表格
for (sheet in sheets) {
# 过滤掉需写入的表
sheetName <- sheet$getSheetName()
if (sheetName == summaryName) {
next
}
# 获取表格【内容行数】
rowNum <- sheet$getLastRowNum()
print(paste("表名:", sheetName, "总共:", rowNum, "行,", sep = " "))
# 读取表格内容 参数 colClasses 指定每列的类型(实际是指定处理该列的类/对象)
data <- read.xlsx2(fileName, sheetName = sheetName, header = FALSE, startRow = 2, colClasses = c("character",
"Date", "integer", "integer", rep("numeric", 2), "integer"))
print(data)
# 将表格内容写入汇总的那张表
addDataFrame(data, summarySheet, col.names = FALSE, row.names = FALSE, startRow = startRow)
# 累加行数
startRow <- startRow + rowNum
}
# 最后需要把对象内容写入文件中
saveWorkbook(wb, fileName)
表格附件
原文地址: https://shockerli.net/post/r-script-to-read-summary-excel/
更多文章请访问我的个人博客: https://shockerli.net
R 脚本读取汇总 Excel 表格数据的更多相关文章
- JXL读取写入excel表格数据
问题描述: 使用java的jxl包创建.写入excel表格数据 问题解决: (1)说明 (2)写入execel数据 注: 以上是写入数据需要调用的函数接口 注: 具体接口调用过程,如上所示 (3)读取 ...
- jxl读取Excel表格数据
调用jxl包实现Excel表格数据的读取,代码如下: import java.io.File; import java.io.IOException; import java.util.ArrayLi ...
- C#调用NPOI组件读取excel表格数据转为datatable写入word表格中并向word中插入图片/文字/书签 获得书签列表
调用word的com组件将400条数据导入word表格中耗时10分钟简直不能忍受,使用NPOI组件耗时4秒钟.但是NPOI中替换书签内容的功能不知道是不支持还是没找到. 辅助类 Excel表格数据与D ...
- 利用 pandas库读取excel表格数据
利用 pandas库读取excel表格数据 初入IT行业,愿与大家一起学习,共同进步,有问题请指出!! 还在为数据读取而头疼呢,请看下方简洁介绍: 数据来源为国家统计局网站下载: 具体方法 代码: i ...
- go读取excel表格数据
go读取excel表格数据 使用工具 github.com/Luxurioust/excelize 百度到的都是使用这个 实际上已经改名了 github.com/360EntSecGroup-Skyl ...
- 用多线程优化Excel表格数据导入校验的接口
公司的需求,当前某个Excel导入功能,流程是:读取Excel数据,传入后台校验每一条数据,判断是否符合导入要求,返回给前端,导入预览展示.(前端等待响应,难点).用户再点击导入按钮,进行异步导入(前 ...
- Java操作Jxl实现导出数据生成Excel表格数据文件
实现:前台用的框架是Easyui+Bootstrap结合使用,需要引入相应的Js.Css文件.页面:Jsp.拦截请求:Servlet.逻辑处理:ClassBean.数据库:SQLserver. 注意: ...
- Vue3实现动态导入Excel表格数据
1. 前言 在开发工作过程中,我们会遇到各种各样的表格数据导入,大部分我们的解决方案:提供一个模板前端进行下载,然后按照这个模板要求进行数据填充,最后上传导入,这是其中一种解决方案.个人认为还有另外 ...
- Visual Studio 2010利用libxl读写excel表格数据
C++读写数据,一般通过txt文件,但是随着数据量的增大,采集数据时运用excel表格的优势得以逐步体现.本文主要介绍一下运用第三方库libxl,对excel表格数据进行读写.分为三个部分,第一部分是 ...
随机推荐
- mathematic语法基础
1. 注释,用 (*这是注释*) 2.清除空间变量 Clear["`*"] 3. 求方程组.这个方程组比较特殊,有五个方程,六个变量,求其中五个变量(因变量)用另外一个变量(自 ...
- 效果监控js源码
function _bxmPlatformFn(e, t) { var n, o, i = ""; try { i = localStorage.getItem("lis ...
- [swarthmore cs75] Compiler 1 – Adder
课程回顾 Swarthmore学院16年开的编译系统课,总共10次大作业.本随笔记录了相关的课堂笔记以及第3次大作业. 编译的过程:首先解析(parse)源代码,然后成抽象语法树(AST),再生成汇编 ...
- jasperreports实现pdf文档的生成
1.导入jar包(pom.xml构建) <dependencies> <dependency> <groupId>com.lowagie</groupId&g ...
- 【pycharm】pycharm修改文件名快捷键
shift+F6 修改文件名 --------------------------------------------------
- -实现 LFU 缓存算法
-实现 LFU 缓存算法, 设计一个类 LFUCache,实现下面三个函数 + 构造函数: 传入 Cache 内最多能存储的 key 的数量 + get(key):如果 Cache 中存在该 key, ...
- 自兴人工智能 python特点了解
计算机语言从语言执行分类来看,大概可分为编译型语言(如Java.c++)和解释型语言(如python.javascript) 1.编译型语言 java c++ 编写源代码.java ---> ...
- 浅析http缓存
1.什么是缓存 将服务器上的静态资源,保存在本地,当发送web请求的时候,如果本地有“已缓存”的静态资源,则从使用本地保存的静态资源,而不是从源原服务器再次请求. 2.缓存的优点 缓存减少冗余的数据传 ...
- Asp.Net WebApi核心对象解析(二)
在接着写Asp.Net WebApi核心对象解析(下篇)之前,还是一如既往的扯扯淡,元旦刚过,整个人还是处于晕的状态,一大早就来处理系统BUG,简直是坑爹(好在没让我元旦赶过来该BUG),队友挖的坑, ...
- 前端开发JS白板编程题目若干
在前端开发参加面试的时候,无论是校招还是社招,往往都会碰到让我们直接在白纸或者白板上手撸代码的题目.由于是手撸代码,这些题目肯定不会过于复杂和冗长,否则面试那么一小会时间根本写不完.本文总结了几个我本 ...