python 使用win32com实现对word文档批量替换页眉页脚
最近由于工作需要,需要将70个word文件的页眉页脚全部进行修改,在想到这个无聊/重复/没有任何技术含量的工作时,我的内心是相当奔溃的。就在我接近奔溃的时候我突然想到完全可以用python脚本来实现这样无聊的工作,确定目标后我便开始在网上寻找有没有造好的轮子,但是结果让我有点儿失望。关于python操作页眉页脚的文章屈指可数,仅存在的几篇也都是片段代码,仅仅可以参考而已,于是我便决定自己是实现批量替换页眉页脚的脚本。
经过搜集资料发现,python可以通过win32com以及docx扩展包来实现对word的操作,但是经过实际操作发现docx对文件页眉页脚的处理不是很理想,于是我最终决定使用win32com来实现此功能。
使用的模块确定下来后就是思路的问题,小小的记录一下:
1、替换页眉页脚可以分成两个部分来实现,一个是针对单个文件的处理,另一个是针对文件夹下所有文件的处理,为了分别对此两种情况进行不同的处理使用if判断语句来让程序进入不同的逻辑。
2、针对文件夹下所有文件需要处理的情况,则使用python的内置模块os将文件夹下所有doc文件的绝对绝对路径拼接出来,以便实现对每一个文件的操作。对于单个文件的处理则不需要这样来做,只需要将文件的决定路径确定下来即可。
3、在确定了文件的路径之后便开始进行对word的操作,在进行测试过程中发现这里存在一个很大的坑,那就是word分节符的存在,分节符将整个word文档分成了若干部分,每个部分的页眉和页脚是独立的,在这个地方绕了我好几个小时。最终经过查资料发现section就是word的中每一个部分的对象,使用它便可以分别定位到每一个部分,解决了这个问题后剩下的逻辑便一气呵成。
接下来直接上代码:
import win32com,os,sys,re
from win32com.client import Dispatch, constants
import os,time
class Change_file_footer_header():
'''批量更改word文件的页眉页脚'''
def __init__( self ):
self.file_or_files = input('请选择需要修改文件或者文件夹 only 代表只修改一个文件 many 代表修改文件夹下的所有文件 :')
self.method = input( '请选择需要更改的类型 1 代表页眉,2代表页脚:')
self.path = input( '请输入需要更改文件的目录名称:')
self.old_name = input( '请输入需要更替换的名称:')
self.new_name = input( '请输入替换的名称:')
def change_header( self ,path ,file ):
''' 更改文件的页眉 '''
w = win32com.client.Dispatch('Word.Application')
w.Visible = 0
w.DisplayAlerts = 0
doc = w.Documents.Open( path )
a = w.ActiveDocument.Sections
n = 0
for i in range( len(a) ):
name = w.ActiveDocument.Sections[i].Headers[0]
old_name = str(name)
print( old_name )
if self.old_name in old_name:
new_name = old_name.replace( self.old_name,self.new_name )
print( new_name )
w.ActiveDocument.Sections[i].Headers[0].Range.Find.ClearFormatting()
w.ActiveDocument.Sections[i].Headers[0].Range.Find.Replacement.ClearFormatting()
w.ActiveDocument.Sections[i].Headers[0].Range.Find.Execute( self.old_name, False, False, False, False, False, False, 1, False, self.new_name, 2 )
n = n+1
doc.Close()
create_time = time.strftime('%Y/%m/%d:%H/%M/%S', time.localtime(time.time()))
text = '{} : {}文件====总共替换了{}个页眉'.format(create_time, file, n)
self.log(text)
def change_footer( self ,path ,file ):
''' 更改文件的页脚 '''
w = win32com.client.Dispatch('Word.Application')
w.Visible = 0
w.DisplayAlerts = 0
doc = w.Documents.Open( path )
a = w.ActiveDocument.Sections
n = 0
for i in range( len(a) ):
name = w.ActiveDocument.Sections[i].Footers[0]
old_name = str(name)
print( old_name )
if self.old_name in old_name:
new_name = old_name.replace( self.old_name,self.new_name )
print( new_name )
w.ActiveDocument.Sections[i].Footers[0].Range.Find.ClearFormatting()
w.ActiveDocument.Sections[i].Footers[0].Range.Find.Replacement.ClearFormatting()
w.ActiveDocument.Sections[i].Footers[0].Range.Find.Execute( self.old_name, False, False, False, False, False, False, 1, False, self.new_name, 2)
n = n+1
doc.Close()
create_time = time.strftime('%Y/%m/%d:%H/%M/%S',time.localtime(time.time()))
text = '{} : {}文件====总共替换了{}个页脚'.format( create_time,file, n)
self.log(text)
def change_file_header( self ):
''' 循环遍历所输入的文件夹 '''
for root, dirs, files in os.walk( self.path ):
for i in files:
if i.split('.')[1] == 'docx' or i.split('.')[1] == 'doc':
print( '更改文件的名称',i )
file_path = os.path.join( root,i )
self.change_header( file_path ,i )
#time.sleep( 1 )
def change_file_footer( self ):
''' 循环遍历所需要修改页脚的文件夹 '''
for root, dirs, files in os.walk( self.path ):
for i in files:
if i.split('.')[1] == 'docx' or i.split('.')[1] == 'doc':
print( '更改文件的名称',i )
file_path = os.path.join( root,i )
self.change_footer( file_path ,i )
def log(self,text):
'''输出日志模块'''
file_name = './' + time.strftime('%Y%m%d%H',time.localtime(time.time())) + '.' + 'txt'
with open( file_name,"a+" ) as f:
f.write( text )
f.write( '\n' )
def run( self ):
if self.file_or_files == 'only':
file_name = self.path.split( '\\' )[ -1 ]
if self.method == '1':
self.change_header( self.path ,file_name )
elif self.method == '2':
self.change_footer( self.path,file_name )
elif self.file_or_files == 'many':
if self.method == '1':
self.change_file_header()
elif self.method == '2':
self.change_file_footer()
else:
print( '请输入正确的选择 only或者 many' )
if __name__ == '__main__':
Change_file_name = Change_file_footer_header()
Change_file_name.run()
python 使用win32com实现对word文档批量替换页眉页脚的更多相关文章
- Python将word文档批量转PDF
前面有一篇<Python批量创建word文档(2)- 加图片和表格>的文章,利用这篇文章创建的word文档来批量转PDF文档.代码: 1 ''' 2 #python批量将word文档转换成 ...
- IText实现对PDF文档属性的基本设置
一.Itext简介 iText是著名的开放源码的站点sourceforge一个项目,是用于生成PDF文档的一个java类库.通过iText不仅可以生成PDF或rtf的文档,而且可以将XML.Html文 ...
- 自动化工具word文档批量转html
企业有很多的科室,科室的每个人或多或少都会写一些文档,有些文档领导需要浏览,解决的办法是将编辑的文档打印出来,供领导浏览,或是为了节约企业成本,文档就在人与人这间或部门之间copy过来,copy过去. ...
- word文档批量合并工具
#NoEnv ; Recommended for performance and compatibility with future AutoHotkey releases. ; #Warn ; En ...
- 【JAVA与DOM4J实现对XML文档的CRUD操作】
一.简介 1.网上下载DOM4J 1.6.1压缩包,解压开之后,发现几个目录和一个jar文件,jar文件是必须的文件其它目录: docs目录:帮助文档的目录,单击index.html: Quick s ...
- C# 实现对PPT文档加密、解密以及重置密码的操作
工作中我们会使用到各种各样的文档,其中,PPT起着不可或缺的作用.一份PPT文档里可能包含重要商业计划.企业运营资料或者公司管理资料等.因此,在竞争环境里,企业重要资料的保密工作就显得尤为重要,而对于 ...
- jaxp实现对xml文档的增,删,改,查操作(附源码)浅析
jaxp,属于javase中的一部分.是对xml进行解析的一个工具类: 既然说到这里,还是讲全一点,讲讲上面说到的xml的解析技术. xml的一个标记型文档. 在html的层级结构中,它会在内存中分配 ...
- XMLHelper类 源码(XML文档帮助类,静态方法,实现对XML文档的创建,及节点和属性的增、删、改、查)
以下是代码: using System; using System.Collections.Generic; using System.Linq; using System.Web; using Sy ...
- openpyxl库实现对excel文档进行编辑(追加写入)
首先,这个库只支持xlsx格式的excel文件 预期,对”excel_test.xlsx“的A1单元格写入”hello word“ 1.安装”openpyxl“库,pip install openpy ...
随机推荐
- springfox-swagger之swagger-bootstrap-ui
swagger-bootstrap-ui是国内的一个swagger开源项目,从发起到现在已经有三年了.初次体验了一下,觉得还是挺不错的,就如当初使用mybatis-plus那样,因为有了mybatis ...
- 【续】5年后,我们为什么要从 Entity Framework 转到 Dapper 工具?
前言 上一篇文章收获了 140 多条评论,这是我们始料未及的. 向来有争议的话题都是公说公的理,婆说婆的理,Entity Framework的爱好者对此可以说是嗤之以鼻,不屑一顾,而Dapper爱好者 ...
- FB商务管理平台(Business Manager) (2)
Business Manager 商务管理平台(以下简称BM)API 一站式管理广告帐户.主页及相关的工作人员. BM功能结构(其中:账户下的节点属于市场营销API) API / SDK FB提供了多 ...
- 关于H5从PC端切换到移动端,屏幕显示内容由横向转为竖向的研究!
1.前言: 在项目中,我们常会遇见在手机端需要横屏观看的效果,而在pc端则默认切换到竖屏的样式. 或者是,UI提供的图是一个长图,但是在移动端我们需要让这个图在手机横屏时显示. 以上两个都需要我们实行 ...
- 初识Haskell 五:自定义数据类型和类型类
对Discrete Mathematics Using a Computer的第一章Introduction to Haskell进行总结.环境Windows 自定义数据类型 data type de ...
- LR IP欺骗
一.设置IP欺骗的原因: 1.当某个IP的访问过于频繁,或者访问量过大是,服务器会拒绝访问请求,这时候通过IP欺骗可以增加访问频率和访问量,以达压力测试的效果 2.某些服务器配置了负载均衡,使用同一个 ...
- Spring中@Transactional用法
作者:bladestone 来源:CSDN 原文:https://blog.csdn.net/blueheart20/article/details/44654007 版权声明:本文为博主原创文章,转 ...
- oracle篇 之 单行函数
一.分类 1.单行函数:需要处理的行数和返回结果的行数相等(单行进单行出) 2.多行函数(组函数):返回结果的行数少于要处理的行数(多行进单行出) 二.字符处理相关函数 1.lower:字符串转换成小 ...
- java常用类-上
一,常用类之一包装类 java开发中习惯把八大基本数据类型封装到一个类中,并提供属性和方法,更方便的操作基本数据类型. 包装类的出现并不是用于取代基本数据类型,也取代不了. 包装类位于java.lan ...
- python 去重方法
待补充:https://www.cnblogs.com/zknublx/p/6042295.html 一.使用集合直接去重 ids = [1,4,3,3,4,2,3,4,5,6,1]ids = lis ...