win32com操作word 第十五 Find接口的使用
最近一直在忙于项目,以至于win32com的视频一直拖更。要不,书面形式更新吧。这次介绍的是Find接口。
假如,要在一篇2万字的文章中找到某些关键词,并返回Range对象,通常可以通过遍历段落 + 正则匹配的方式解决,伪代码如下:
import re
from win32com.client import Dispatch
client = Dispatch('Word.Application')
client.Visible = 1
doc = client.Documents.Open('demo.doc')
# 遍历段落 找出以“编程”开头的段落,返回Range
rng = None
for p in doc.Paragraphs:
if re.match('编程', str(p)):
rng = p.Range
文章很长,这样的执行效率并不是最高的,如果要找出多个关键词呢,for循环 + re就显得有点慢了,当然,慢是相对的。
Find接口简单使用
此时Find接口就可以登场了,它的实现和文档客户端中的查找是一样的。先看看Find接口的简单用法,伪代码演示。
Tips 该接口只能通过
Range对象或Selection对象调用,这两个对象是可以定义任意范围的,意味着更灵活的使用,有时候并一定需要从头到尾找一篇。
from win32com.client import Dispatch
client = Dispatch('Word.Application')
client.Visible = 1
doc = client.Documents.Open('demo.doc')
# 在文章中找到python的字样
rng = doc.Range()
# rng = doc.Content 也可以,两者有点不同,
# 绝大部分情况下这种不同并不会带来影响,
# 除非是在编辑书本
# 查找时忽略空格
rng.Find.IgnoreSpace = True
# 如果能找到返回True,反之False
ret = rng.Find.Execute('python')
划重点
1、如果能找到关键词,rng变成选中当前关键词,形成了一个新的Range对象,之前所声明的rng = doc.Range()将不复存在,反之,rng保持不变。
2、文档有多个关键词时,Find找到第一个时就会停止,并不会自动继续往下找,且默认向前查找。
如果想实现通篇文章查找,可通过while循环实现,伪代码演示
from win32com.client import Dispatch
client = Dispatch('Word.Application')
client.Visible = 1
doc = client.Documents.Open('demo.doc')
rng_list = []
rng = doc.Range()
while True:
rng.Find.IgnoreSpace = True
ret = rng.Find.Execute('编程')
if ret:
rng_list.append(rng)
else:
break
划重点
1、记得有退出循环的条件;
2、rng不能声明在循环体中,不然ret永远都会返回True导致死循环。
Find接口进阶使用
在客户端的查找面板中,有通配符查找,本质上是正则,和常见的正则表达式,大部分是相同的,有某些是word的特色。比如查找在段落末尾的“编程”字样,伪代码演示(要考虑段落末尾是否有标点符号,此处假设没有)。
rng = doc.Range()
rng.Find.IgnoreSpace = True
rng.Find.Execute('编程^p')
^p是word中段落标记的通配符表示方法,如果把段落标记使用print打印出来,它是这样的\r。
不过有点遗憾的是,至今依然不知道如何使用通配符来查找出现在每个段落开头的关键词。
关于更多的通配符使用,有兴趣的可自行搜索,内容还是很丰富的。
ok,今天就先讲这么多,下回继续。我拉了一个win32com编程的交流群,想交流的可加微信:yideng6618,备注:交流群。
win32com操作word 第十五 Find接口的使用的更多相关文章
- win32com操作word API精讲 第十集 Paragraphs & Paragraph接口 (一)
本课程<win32com操作word API精讲&项目实战>以视频为主,文字为辅,公众号ID:一灯编程 在word编程中,Range和Paragraph(s)接口无愧于劳模接口的称 ...
- win32com操作word 第二集:Application&Documents接口
本课程<win32com操作word API精讲&项目实战>以视频为主,文字教程为辅,公众号ID:一灯编程. 先回答一个网友私信问题: win32com和微软的word接口文档有什 ...
- win32com操作word API精讲 第七集 Range(五)字体格式精讲
本课程<win32com操作word API精讲&项目实战>视频平台以视频为主,本平台以文字为主,公众号ID:一灯编程 本节课主要讲解使用Range操作Font接口中的字体.字号. ...
- win32com操作word API精讲&项目实战 预告
对win32com的使用和研究有好一段时间了,想起本人刚开始做word编程项目时的各种痛苦:网上能找到的都是简单的示例,如同hello word一般,嚼之无味又无可奈何.读office的word接口文 ...
- win32com操作word 第三集:Range精讲(一)
本课程<win32com操作word API精讲&项目实战>,本公众号以文字分享为主,B站与视频号则发布视频分享,ID均为:一灯编程 本集开始,将会深入Document接口.打开或 ...
- win32com操作word API精讲 第六集 Range(四)对齐和缩进
本课程<win32com操作word API精讲&项目实战>同步在B站.今日头条.视频号及本公众号发布.其中本公众号以发布文字教程为主. 今天是大年初二,一灯在此祝愿各位朋友兔年吉 ...
- win32com操作word(1):几个重要的对象(28.35)
Pywin32模块为python封装了操作windows底层API函数的功能.而win32com是Pywin32下面的一个模块,专门负责操作com组件. 由于office工具(Word.Excel等) ...
- win32com操作word(3):导入VBA常量
导入VBA常量方法:http://blog.sina.com.cn/s/blog_a73687bc0101k8x8.html 我们之前说过,win32com组件为python提供处理COM组件(.dl ...
- win32com操作word(2):常用用法
一.对象的位置关系: 1.Range属性位于(部分): Selection__Section__Cell__Paragraph__Table__Bookmark__Comment__Row__List ...
- C#图解教程 第十五章 接口
接口 什么是接口 使用IComparable接口的示例 声明接口实现接口 简单接口示例 接口是引用类型接口和as运算符实现多个接口实现具有重复成员的接口多个接口的引用派生成员作为实现显式接口成员实现 ...
随机推荐
- Vue-cli脚手架下载安装
注意:在下载安装该脚手架之前先安装配置好NodeJS以及镜像源,NodeJS详情可查询文章:NodeJS下载安装 1.cmd中输入以下指令: npm install -g @vue/cli 整个过程中 ...
- 27、Type关键字
1.是什么? type是go语法里额重要而且常用的关键字,type绝不只是对应于C/C++中的typeof.搞清楚type的使用,就容易理解Go语言中的核心概念struct.interface.函数等 ...
- @Async实现异步任务
1.@Async是SpringBoot自带的一个执行步任务注解 @EnableAsync // 开启异步 @SpringBootApplication public class Application ...
- 【Python】【OpenCV】检测直线和圆
重新理解一下Canny方法: 参数: image:输入的图像. threshold1:第一个阈值,用于检测边缘的强度梯度的下限. threshold2:第二个阈值,用于检测边缘的强度梯度的上限. ap ...
- 【C#】【WinForm】MDI窗体
MDI窗体的相关学习使用 1.设置MDI父窗体 在属性中找到IsMdiContainer选项,设置为True 2.添加MDI子窗体,在项目中依次选择添加->窗体,然后一直默认即可 添加后的项目目 ...
- java方法的定义与执行
java中的方法在类中定义. 定义方法格式: 访问修饰符 返回值类型 方法名(参数列表){ ... 执行内容 ... return 返回值; } 访问修饰符:表示方法在哪里能被 ...
- nodejs 中npm下载依赖速度慢的问题
已解决:nodejs 中npm下载依赖速度慢的问题 强烈建议不要用直接使用 cnpm 安装,会有各种诡异的 bug 可以通过重新指定 registry 来解决 npm 安装速度慢的问题 点击查看代码 ...
- 记录一次K8s pod被杀的排查过程
问题描述 今天下午运维反馈说我们这一个pod一天重启了8次,需要排查下原因.一看Kiban日志,jvm没有抛出过任何错误,服务就直接重启了.显然是进程被直接杀了,初步判断是pod达到内存上限被K8s ...
- RV1126 DSI 调试
一.基本信息 开发板:RV1126 linux版本:4.19.111 显示屏:HX070JGI50(7寸) 显示器分别率:1024 * 600 二.MIPI协议 连接示意图(图片来源,正点资料) MI ...
- React jsx 语法解析 & 转换原理
jsx介绍 jsx是一种JavaScript的语法扩展(eXtension),也在很多地方称之为JavaScript XML,因为看起就是一段XML语法,用于描述UI界面,并且可以和JavaScrip ...