word 转pdf 再转图片--用在轻社群发文章
#! /usr/bin/env python
# -*- coding: utf-8 -*-
import fitz
import glob
import os
from win32com.client import Dispatch, constants, gencache
import sys,shutil
import datetime
print sys.getdefaultencoding()
#################word
def doc2pdf(input, output):
w = Dispatch("Word.Application")
try:
doc = w.Documents.Open(input, ReadOnly = 1)
doc.ExportAsFixedFormat(output, constants.wdExportFormatPDF,
Item = constants.wdExportDocumentWithMarkup, CreateBookmarks = constants.wdExportCreateHeadingBookmarks)
return 0
except Exception ,e:
print str(e)
return 1
finally:
w.Quit(constants.wdDoNotSaveChanges)
# Generate all the support we can.
def GenerateSupport():
# enable python COM support for Word 2007
# this is generated by: makepy.py -i "Microsoft Word 12.0 Object Library"
gencache.EnsureModule('{00020905-0000-0000-C000-000000000046}', 0, 8, 4)
#####################
inputdoc = sys.argv[1]
store_tmp = unicode(os.path.splitext(inputdoc)[0],'GBK')
print inputdoc
outputpdf = os.path.splitext(inputdoc)[0]+'.pdf'
if (not os.path.isabs(inputdoc)):
inputdoc = os.path.abspath(inputdoc)
if (not os.path.isabs(outputpdf)):
outputpdf = os.path.abspath(outputpdf)
try:
GenerateSupport()
rc = doc2pdf(inputdoc, outputpdf)
except Exception,e:
print str(e)
def rightinput(desc):
flag=True
while(flag):
instr = raw_input(desc)
try:
intnum = eval(instr)
if type(intnum)==int:
flag = False
except:
print('ÇëÊäÈëÕýÕûÊý£¡')
pass
return intnum
#pdffile = glob.glob("*.pdf")[0]
pdffile = outputpdf
pdffile = unicode(pdffile , "GBK")
print pdffile
doc = fitz.open(pdffile)
#flag = rightinput("ÊäÈ룺1£ºÈ«²¿Ò³Ã棻2£ºÑ¡ÔñÒ³Ãæ\t")
flag = 1
if flag == 1:
strat = 0
totaling = doc.pageCount
# else:
# strat = rightinput('ÊäÈëÆðÊ¼Ò³Ãæ£º') - 1
# totaling = rightinput('ÊäÈë½áÊøÒ³Ãæ£º')
pdf2png = os.path.join(os.path.dirname(__file__),'pdf2png')
pdf2png_old = os.path.join(pdf2png,'old')
if not os.path.isdir(pdf2png):
os.mkdir(pdf2png)
if not os.path.isdir(pdf2png_old):
os.mkdir(pdf2png_old)
n_t = datetime.datetime.now().strftime('%Y%m%d%H%M%S')
for f in os.listdir(pdf2png):
#print f.endswith('png')
if f.endswith('png'):
try:
src = os.path.join(pdf2png,f)
dst = os.path.join(pdf2png_old,f)
shutil.move(src,dst)
except Exception,e:
pass
for pg in range(strat, totaling):
page = doc[pg]
zoom = int(100)
rotate = int(0)
trans = fitz.Matrix(zoom / 100.0, zoom / 100.0).preRotate(rotate)
pm = page.getPixmap(matrix=trans, alpha=False)
pm.writePNG(pdf2png+'/%s_%s_%s.png' % (store_tmp,n_t,str(pg+1)))
word 转pdf 再转图片--用在轻社群发文章的更多相关文章
- openOffice word转pdf,pdf转图片优化版
之前写了一个版本的,不过代码繁琐而且不好用,效率有些问题.尤其pdf转图片速度太慢.下面是优化版本的代码. spriing_boot 版本信息:2.0.1.RELEASE 1.配置信息: packag ...
- Word转pdf,再转图片插入PDF
WORD转PDF所需jar包: https://yangtaotao.lanzous.com/ice1jlc PDF转图片所需jar包: https://yangtaotao.lanzous.com/ ...
- C#实现 word、pdf、ppt 转为图片
office word文档.pdf文档.powerpoint幻灯片是非常常用的文档类型,在现实中经常有需求需要将它们转换成图片 -- 即将word.pdf.ppt文档的每一页转换成一张对应的图片,就像 ...
- word、pdf、ppt 转为图片
office word文档.pdf文档.powerpoint幻灯片是非常常用的文档类型,在现实中经常有需求需要将它们转换成图片 -- 即将word.pdf.ppt文档的每一页转换成一张对应的图片,就像 ...
- 解决word转pdf后图片失真
碰到问题: 将word转pdf后图片出现失真 问题分析: 上述问题必定跟图片类型和所用软件有关,现将不同图片在不同软件下的失真情况汇总,见表1 问题解决:迫不得已,不要使用截图:若必需要用,则word ...
- word转pdf图片问题
经过整理总结出两类问题:1,pdf文件下载文档中某些图片显示红叉. 问题现象:pdf是通过word转换成,发现源文件doc和docx文档均出现上述问题:只是某些图片显示红叉.通过这两点确定和文 ...
- CAD转PDF再由pdf转jpg图片
免费的PDF转JPG图片 https://www.gaitubao.com/pdf-to-jpg/
- 采用jacob实现word转pdf
网络上已经有很多这方面的内容,在用之前也是参考了好多别人的文章,下面记录下我自己的整合过程.整个过程都比较简单: 开发环境:win8 64位系统,在2008下面部署也是一样的. 文档要求jdk的版本要 ...
- C#操作word模板插入文字、图片及表格详细步骤
c#操作word模板插入文字.图片及表格 1.建立word模板文件 person.dot用书签 标示相关字段的填充位置 2.建立web应用程序 加入Microsoft.Office.Interop.W ...
随机推荐
- 从$a_n=f(n)$的角度理解数列中的表达式$a_{n+1}=\frac{k}{a_n}$
函数周期性 前面我们学习过函数的周期性的给出方式: \(f(x+a)=f(x)\) \(\hspace{2cm}\) \(T=a\) \(f(x+a)=-f(x)\) \(\hspace{2cm}\) ...
- PATB1006换个格式输出整数
参考代码: #include<cstdio> int main() { int n;//接收输入的数字 int a = 0, b = 0, c = 0;//分别记录百位十位个位上的数 sc ...
- Java class 和public class 区别
1.类的访问权限 为了控制某个类的访问权限,修饰词必须出现在关键字class之前.例如:public class Student {} 在编写类的时候可以使用两种方式定义类: (A)pub ...
- win10系统:VMware无法在Windows运行该怎么办?
出现的问题: 解决方法: 点击“检查更新”或去官网下载最新版本 Vmware15.5.0(经过测试发现,Windows 10上面可以运行Vmware15.5.0 ) VMware Workstati ...
- 小米win10+kali 双系统
1.下载kali linux 系统镜像,用windisk32imager 制作启动盘,制作好后千万不要格式化u盘,其他的启动盘制作工具不好用,无法加载系统镜像 2.将u盘插入电脑,重启,电脑重启时按 ...
- 一文带你了解 Flink 的基本组件栈
作为实时计算领域的佼佼者,Flink 的基本组件同样值得我们仔细研究. Flink 同样遵循着分层的架构设计理念,在降低系统耦合的同时,也为上层用户构建 Flink 应用提供了丰富且友好的接口. Fl ...
- hanlp添加词典不起作用
不起作用的原因很多,这里列举几个 这里的hanlp我虽然用的maven建立的但是要添加自定义词典,所以没有用maven引入的方式,而是下载了data+hanlp.jar文件 data ...
- angular get 数据请求
数据请求 get 新建一个服务 1. ng g service services /+服务名 eg:ng g service services/player 在此服务中进行设置 引入自带组件以及注册 ...
- CSS3移动端vw+rem不依赖JS实现响应式布局
1.前言 (1)vw/vh介绍 在使用之前,我们先简单了解一下什么是vw和rem以及它们的作用,vw是css3出现的一个新单位,它是"view width"缩写,定义为把当前屏幕分 ...
- idea pycharm 常用快捷键
Ctrl + P 方法参数提示显示 (必备)Alt + Enter 根据光标所在问题,提供快速修复选择,光标放在的位置不同提示的结果也不同 (必备)Ctrl + / 行注释(可选中多行)Ctrl + ...