小爬之前的文章 【Excel VBA中写SQL,这些问题你一定为此头痛过】中详细讲诉了一些常见的VBA 中使用SQL遇到的问题,这里再补充两个常见的问题场景及对应的解决方案,希望你们看了后能够思路开阔些,少走些弯路。

一、数据源Excel文件的工作表有些列的列名相同

  我们知道,在商业数据库中创建表时,同一个表名下是不允许创建相同的字段的,且字段名要遵从一定规范。但在Excel文件中则无此限制,同一个工作表下,支持多列的列名相同。那么当我们用SQL来操作这类头疼的Excel文件时,该如何区分不同字段呢?

  假设小爬有这样一个Excel表(数据样本通过python的第三方库faker来生成),【源数据】表中,A列和C列的列名都为【公司】,但其实一个指代【公司名称】,另一个指代【公司代码】,这样不规范的excel模板例子在现实工作中很常见。我们该如何区分它俩呢?

  小爬试着先输出recordSet中所有字段名,看VBA的sql引擎是如何贴心处理这个问题的,示例代码如下:

 1 Sub myQuery()
2 Dim conn As Object, rs As Object, rs1 As Object, sht1 As Worksheet, sht2 As Worksheet, sql As String
3 Set conn = CreateObject("ADODB.Connection")
4 Set rs = CreateObject("ADODB.recordset")
5 Set sht1 = ThisWorkbook.Sheets("源数据")
6 Set sht2 = ThisWorkbook.Sheets("结果")
7 conn.Open "provider=Microsoft.ACE.OLEDB.12.0;extended properties=excel 12.0;data source=" & ThisWorkbook.FullName
8 sql = "SELECT * FROM [源数据$]"
9 Set rs = conn.Execute(sql)
10 For i = 0 To rs.Fields.Count - 1 '输出recordset字段名到【结果】表
11 sht2.Cells(1, i + 1) = rs.Fields(i).Name
12 Next
13 sht2.Cells(2, 1).CopyFromRecordset rs '输出recordset结果到【结果】表
14 conn.Close
15 Set conn = Nothing
16
17 End Sub

  输出的结果如下图所示:

  可以看到,重名后的列名被sql解析成字段名后,默认跟上阿拉伯数字1,2,3……知道了sql 引擎的解析规则,我们就可以直接根据解析后的列名 如【公司】【公司1】来操作不同的字段了,没输出所有字段名前就可以做到心中有数。

二、Excel“表格”不是真正的表格文件格式

  有的时候,我们从ERP系统导出的报表Excel文件,虽然是xls(xlsx)后缀,可出于种种原因,他们并非真正的Excel表格格式,可能底层依然是txt文件,小爬在工作中就没少遇到过这种奇葩问题。

  解决思路如下:先利用sql的方法获取当前数据库的所有表名,如果表名是乱码,如("?????"),则该Excel文件可能底层是txt文件,至少不是规范格式的Excel文件。此时,我们可以用VBA原生的workbooks.open方法来显式打开该工作簿,自动保存,然后用SQL引擎来重新连接该工作簿即可。示例代码如下:

Const adSchemaTables = 20 '这句很重要,一定要提前定义adSchemaTables常量的值
Sub myQuery()
Dim conn As Object, rs As Object, rs1 As Object, sht1 As Worksheet, sht2 As Worksheet, sql As String, sourceFileName As String Set conn = CreateObject("ADODB.Connection")
Set rs = CreateObject("ADODB.recordset")
sourceFileName = ThisWorkbook.Path & "\数据源\" & "测试.xls"
conn.Open "provider=Microsoft.ACE.OLEDB.12.0;extended properties=excel 12.0;data source=" & sourceFileName
Set rs = conn.openschema(adSchemaTables)
TableName = rs.Fields(2).Value
If TableName <> "源数据" Then '假定当工作簿格式规范时,工作表名为【源数据】
conn.Close
Set wb = Workbooks.Open(sourceFileName)
wb.Save
wb.Close
conn.Open "provider=Microsoft.Ace.oledb.12.0;Extended Properties=Excel 12.0;data source=" & sourceFileName
Set rs = conn.openschema(adSchemaTables)
TableName = rs.Fields(2).Value
End If
End Sub

  这里面包含两个技巧:

    1、当小爬用wb.save时,Excel会自动将不规范的xls文件(本质是txt)保存为规范的xls文件;

    2、利用conn.openschema(adSchemaTables)输出该数据库下所有的表名,代码如下:

CONN.Open "provider=Microsoft.Ace.oledb.12.0;Extended Properties=Excel 12.0;data source=" & sourceFullName
Set rs = CONN.openschema(adSchemaTables)
Do While Not rs.EOF
tableName = rs.Fields(2).Value Debug.Print rs.Fields(2).Value '表名,对于Excel中的表或(工作表名)后面会自动加一个$
rs.MoveNext
Loop

  至于上面的例子中,为啥不每次默认用VBA语法打开某个工作簿,再保存为xls文件,再用CONN来连接,自然是为了改善脚本的性能,毕竟workbooks.open相比较于CONN来连接表格,速度太慢了。

  

欢迎扫码关注我的公众号 获取更多爬虫、数据分析的知识!

Excel VBA中写SQL,这些问题的方法你一定要牢记的更多相关文章

  1. 在Excel VBA中写SQL,是一种什么体验

    每每提到Excel办公自动化,我们脑海里能想到的就是公式.数据透视表.宏.VBA,这也是我们大部分人数据分析的进阶之路.当我们对于常用VBA技巧已经相当熟练后,往往会有一种"我的VBA知识够 ...

  2. 在Excel VBA中使用SQL到底优势在哪儿

    小爬在之前的博文中多次提到,可以在VBA中写SQL来操作Excel文件,实现各类数据处理和分析需求.那么,你可能有这样的疑问:Excel原生的VBA,数据透视表,数据分析功能不够吗,为啥一定要用SQL ...

  3. 在mybatis中写sql语句的一些体会

    本文会使用一个案例,就mybatis的一些基础语法进行讲解.案例中使用到的数据库表和对象如下: article表:这个表存放的是文章的基础信息 -- ------------------------- ...

  4. 浅谈Excel开发:九 Excel 开发中遇到的常见问题及解决方法

    Excel开发过程中有时候会遇到各种奇怪的问题,下面就列出一些本人在开发中遇到的一些比较典型的问题,并给出了解决方法,希望对大家有所帮助. 一 插件调试不了以及错误导致崩溃的问题 在开发机器上,有时可 ...

  5. Excel 2013中单元格添加下拉列表的方法

    使用Excel录入数据的时候我们通常使用下拉列表来限定输入的数据,这样录入数据就很少发生错误了.Excel 2013较以前的版本发生了很大的变化,那么在Excel 2013是如何添加下拉列表的呢? 下 ...

  6. Excel vba中访问ASP.NET MVC项目,记录访问时间,文件名称

    每30秒连接一次服务器,连接成功单元格变绿色,连接失败变红色,状态单元格为17行,2列 1,打开excel文件,进入vba编辑器,新建一个modules模块,在里面先写一个每30秒执行一次ConnSe ...

  7. 关于在Java代码中写Sql语句需要注意的问题

    最近做程序,时不时需要自己去手动将sql语句直接写入到Java代码中,写入sql语句时,需要注意几个小问题. 先看我之前写的几句简单的sql语句,自以为没有问题,但是编译直接报错. String st ...

  8. SSM框架中写sql在xml文件中

    第一种(用Mapper.xml映射文件中定义了操作数据库sql) 注意点: 1.#{}与${} #{}表示一个占位符,使用占位符可以防止sql注入, ${}通过${}可以将parameterType传 ...

  9. SSM框架中写sql在dao文件中以注解的方式

    1以注解方式 //两个参数其中一个是对象需写,对象.属性 @Update("update delivery_address set consignee = #{address.consign ...

随机推荐

  1. Java 基础02

    参照:https://www.cnblogs.com/ZXF6/p/11530009.html 类和对象 /** * java 中的类和对象 * * 一.局部变量的作用域. * * 二.面向对象的概述 ...

  2. 分页方法需要参数(当前页数,总数据量,拿到query的值)

    class Pagination: def __init__(self, page_num, all_count ,params=None,per_num=10,max_show=11): " ...

  3. 计算机网络再次整理————UDP例子[六]

    前言 简单的说,UDP 没有 TCP 用的广泛,但是还有很多是基于UDP的程序的,故而简单介绍一下. 正文 秉承节约脑容量的问题,只做简单的介绍和例子,因为自己几乎也没怎么用过UDP. 只是了解和知晓 ...

  4. Velero:备份、迁移Kubernetes集群资源和PV

    Velero基本介绍 官方文档:https://velero.io/docs/v1.4/ 基本工作原理: 不管需求是实现什么,比如:集群迁移.恢复.备份,其核心都是通过velero client CL ...

  5. 隐式意图&显示意图

    1 隐式意图     通过指定一组动作或者数据 开启activity   2 显示意图    通过指定具体包名和类名 开启activity       总结    (1)显示意图更加安全一些    ( ...

  6. iOS测试模板

    测试模板,每次写一个功能测试Demo时总是要新建一个工程,导入一些第三方库,比较麻烦,先提供一个测试模板,提供一些常用第三方库,自己就不用导了 使用Cocospod管理第三方库 常用(其他自行添加) ...

  7. 微信小程序开发提升效率

    http://www.ifanr.com/minapp/790017 微信小程序的 API 实现需要兼顾方方面面,所以仍然使用 callback 写法. 众所周知,Callback-Hell(回调地狱 ...

  8. 06 jQuery

    BOM和DOM 1. 什么是BOM和DOM 到目前为止,我们已经学过了JavaScript的一些简单的语法.但是这些简单的语法,并没有和浏览器有任何交互. 也就是我们还不能制作一些我们经常看到的网页的 ...

  9. Solution -「POI 2011」「洛谷 P3527」MET-Meteors

    \(\mathcal{Description}\)   Link.   给定一个大小为 \(n\) 的环,每个结点有一个所属国家.\(k\) 次事件,每次对 \([l,r]\) 区间上的每个点点权加上 ...

  10. 【JOISC 2020 补题记录】

    目录 Day 1 Building 4 Hamburg Steak Sweeping Day 2 Chameleon's Love Making Friends on Joitter is Fun R ...