Excel:使用powerquery进行多表合并
注:本文原创为:https://www.cnblogs.com/fanyu2019/p/11175827.html,本文在原创的基础上添加修改了一点内容
工作中常遇到需汇总多张表进行分析的情况,本文以某公司销售数据(数据为虚构数据)为例介绍使用powerquery合并excel表的方法。
本文中所使用数据格式相同,且工作表中第一行为标题行,数据不规范可能使合并汇总数据存在问题或合并不成功,注意事项请移至文末进行查看。同时本文操作工具为office365。
多表合并存在多种情况:
一. 单工作簿多工作表合并
原始数据中存在多sheet页,进行单工作簿的多工作表合并,先看原始数据及处理之后的数据:
原始数据▼
最终数据▼
第一步:新建查询(进入powerquery编辑器)
点击【数据】>【获取数据】>【来自文件】>【从工作簿】,选择原始数据,导入
第二步:追加查询
点击【主页】>【追加查询】>【追加查询】,选择“三个或更多表”,依次添加工作表,得到合并后的数据
第三步:关闭并上载
点击【关闭并上载】>【关闭并上载】,可在excel中查看汇总后的数据
第四步:excel中对数据进行最后处理
在excel中对数据进行简单处理,得到最终汇总数据
二. 多工作簿单工作表合并
原始数据含有多个工作簿,但每个工作簿中只有一个工作表**(注意:这里的单工作表是指每个工作簿中的工作表只有一个,且工作表的名称需要一致!!如果每个工作簿中只有一个工作表,但是表名不一致,需要按照本文稍后提供的第三种方法即多工作簿多工作表的方法进行合并)**,进行多工作簿的单工作表合并,先看原始数据及处理之后的数据:
原始数据▼
最终数据▼
第一步:新建查询(进入powerquery编辑器),合并
点击【数据】>【获取数据】>【来自文件】>【从文件夹】,选择原始数据,导入,点击【组合】>【合并和编辑】,选择工作表,点击【确定】,在powerquery中可查看到已合并的数据
第二步:关闭并上载
查看合并后的数据,点击【关闭并上载】
注:由于第三个工作表中存在编辑过的空行,合并时空行也进入到合并的数据中,可在合并之前对工作表数据进行处理
第三步:excel中对数据进行最后处理
在excel中对数据进行简单处理,得到最终汇总数据
三. 多工作簿多工作表合并
实际工作中常常存在需要合并文件夹中的excel数据,且每个工作簿中含有多张工作表,进行多工作簿的多工作表合并,先看原始数据及处理之后的数据:
原始数据▼
最终数据▼
第一步:新建查询(进入powerquery编辑器)
点击【数据】>【获取数据】>【来自文件】>【从文件夹】,选择原始数据,导入,点击【转换数据】
第二步:删除其他信息,保留content及name列
保留content及name列,点击【主页】>【删除列】>【删除其他列】。这些删除的列一般我们都是用不到的,所以我们直接删除提高效率
第三步:自定义列,返回工作表记录
点击【添加列】>【自定义列】,输入新列名及公式:Excel.Workbook([Content],true)
注:
公式Excel.Workbook([Content],true)需区分大小写
公式解析:
- 功能:从Excel工作簿返回工作表的记录
- 参数:Excel.Workbook( workbook as binary, optional useHeaders as nullable logical, optional delayTypes as nullable logical) as table
第一个参数是要解析的字段,返回一个table,第二个是可选参数逻辑值,参数使用true,就是指定数据使用第一行做为标题。
第四步:展开数据并删除多余数据
选中第三步中返回的table列及name列,点击【主页】>【删除列】>【删除其他列】
注:保留name列为保留数据来源,若不需要可以删除
点击table列,进行展开
展开的数据中,选中table列及数据源列,点击【主页】>【删除列】>【删除其他列】
展开table列
注:若需保留数据来源(工作簿名、工作表名),在数据处理中对数据来源列进行保留即可
第五步:关闭并上载
点击【关闭并上载】>【关闭并上载】,可在excel中查看到已合并的数据
第六步:excel中对数据进行最后处理
在excel中对数据进行简单处理,得到最终汇总数据
注:当文件夹中的数据改变中,可右键进行【刷新】即可更新数据
注意事项:
数据格式:此方法仅适用于数据格式相同的数据表合并
合并单元格:工作表中应避免出现合并单元格
空行:若工作表中存在编辑过或有格式的空行,合并时空行也会保留,需在合并之前对工作表数据进行处理:Ctrl+shift+↓选中所有空行,Ctrl±删除所有空行
筛选很多的下拉值时只会显示前1000个值,如果想要筛选1000后的值可以考虑在原始数据中改变一下值的位置
Excel:使用powerquery进行多表合并的更多相关文章
- vba实现excel多表合并
Excel多表合并之vba实现 需求 保留列名,复制每一个excel里的数据,合并到一个excel 操作步骤 将要合并的文件放在同一文件夹下,复制过来就好(ps:最好不要直接操作原数据文件,避免操作失 ...
- 合并Excel工作薄中成绩表的VBA代码,非常适合教育一线的朋友_python
这时候还需要把各个工作表合并到一起来形成一个汇总表.这时候比较麻烦也比较容易出错,因为各个表的学号不一定都是一致的.对齐的.因为可能会有人缺考,有人会考号涂错等等.特奉献以下代码,用于合并学生成绩表或 ...
- C#合并选中EXCEL中的各个工作表
合并选中EXCEL中的各个工作表,以第一个选中的EXCEL文件里的工作表进行匹配,遍历后面的每个EXCEL文件,有相同的工作表就合并: private void button1_Click(objec ...
- 20171113xlVba指定文件夹多簿多表分表合并150
'2017年11月13日 'Next_Seven '功能:文件夹对话框指定文件夹下,合并(复制粘贴)每个Excel文件内的指定子表内容, '在名为"设置"的工作表A列 输入汇总子表 ...
- 数据可视化之PowerQuery篇(十)如何将Excel的PowerQuery查询导入到Power BI中?
https://zhuanlan.zhihu.com/p/78537828 最近碰到星友的一个问题,他是在Excel的PowerQuery中已经把数据处理好了,但是处理后的数据又想用PowerBI来分 ...
- SQL多表合并查询结果
两表合并查询,并同时展示及分页SELECT a.* FROM ( ( SELECT punycode, `domain`, 'Success' AS state, add_time, AS refun ...
- MapReduce案例:统计共同好友+订单表多表合并+求每个订单中最贵的商品
案例三: 统计共同好友 任务需求: 如下的文本, A:B,C,D,F,E,OB:A,C,E,KC:F,A,D,ID:A,E,F,LE:B,C,D,M,LF:A,B,C,D,E,O,MG:A,C,D,E ...
- oracle的多表合并查询-工作心得
本随笔文章,由个人博客(鸟不拉屎)转移至博客园 发布时间: 2018 年 11 月 29 日 原地址:https://niaobulashi.com/archives/oracle-select-al ...
- EXCEL中如何删除透视表的多余汇总
EXCEL中如何删除透视表的多余汇总 1)如下图,选中字段列,单击鼠标右键,在弹出的菜单中选择[字段设置]选项. 2)弹出[字段设置]对话框. 3)选择“分类汇总和筛选”选项卡,然后勾选“无”选项,单 ...
- Hadoop案例(七)MapReduce中多表合并
MapReduce中多表合并案例 一.案例需求 订单数据表t_order: id pid amount 1001 01 1 1002 02 2 1003 03 3 订单数据order.txt 商品信息 ...
随机推荐
- 探秘Transformer系列之(24)--- KV Cache优化
探秘Transformer系列之(24)--- KV Cache优化 目录 探秘Transformer系列之(24)--- KV Cache优化 0x00 前言 0x01 背景知识 1.1 度量指标 ...
- 一、Java语言介绍
1.硬件知识介绍 2.常用dos命令以及快捷键 1 /** 2 *@desc: 复习 3 *@Description: 4 * dir:列出当前文件目录下的所有文件; 5 * md:创建一个新目录; ...
- DIY钢铁侠方舟反应堆第二期—第一代电路板展示
经历一个周的时间,终于把方舟反应堆的电路画了出来,简单画了一个USB口加LED灯的电路,先简单测试一下 原理图展示 PCB展示 实物如下 这里出了一点意外,LED被发错了,本来计划的是蓝灯,但是发来的 ...
- MaxKB中如何选择向量模型?
MaxKB内置的向量模型不足? 在MaxKB中知识文档Emdeding是很重要的一环,而这个过程就必须依赖向量模型.目前MaxKB内置的向量模型为text2vec-base-Chinese,一个针对中 ...
- SpringBoot配置@ConfigurationProperties(prefix = "pig")时中文乱码
问题出现 通过@ConfigurationProperties(prefix = "pig")注解进行属性绑定的时候,application.properties文件中出现中文,从 ...
- mysql8.0.16 设置远程主机访问
新版的的mysql版本已经将创建账户和赋予权限的方式分开了 1.创建账户 create user 'root'@'%' identified by '123456'; 注意密码是否符合要求,我用的阿里 ...
- servlet @WebServlet注解
web开发中可以通过web.xml写servlet标签表明一个类是Servlet,servlet3.0后可以使用@WebServlet表示一个类为Servlet. @WebServlet 参数 说明 ...
- 信息资源管理综合题之“什么是CA 和 什么是数字证书 和 CA实施认证服务的技术基础是什么 和 补全CA签名加密流程图”
一.公钥密码体系和RSA算法是密钥管理.身份认证.防抵赖篡改等安全问题的理论基础和技术保障.题图是运用RSA算法用户A向用户B传送加密信息并进行数学签名的过程.其中A.B的公钥分别为GA.GB,A.B ...
- 『Plotly实战指南』--Plotly与Streamlit结合实战
关于Streamlit的介绍,可参考<玩转Streamlit>系列 在当今数据驱动的时代,快速构建交互式工具并直观地将数据分析结果交付给用户,已成为数据应用开发的核心需求. 无论是企业内部 ...
- C# 定时器 Timer 如何精确到 1-2 毫秒以内
最近在排查项目OTA的一个问题,触发了一毫秒或者2毫秒执行一次进程间通信的,导致通信阻塞的问题.这样就需要用到模拟触发1ms或者2ms触发事件.这让我第一时间想到了C#的定时器.由于我们项目用到的框架 ...