python不可以打印.doc文件】的更多相关文章

[背景] 需求: 打印word文件 模块: python-docx [问题] 传递xxx.doc文件给python脚本,执行后,控制台没有内容输出 经查询后了解到,大致理由: doc是早一代的word文件,封闭格式,office或wps是采用反破译去解析出来,但也不保证完美解析 python没有做解析doc文件的模块 [解决](目前只找到这一种) 利用 Linux下的antiword命令进行解析 使用: [ antiword + doc_file] 安装antiword: 1. 解压安装包 2.…
def find(): txt = open(r'F:\send1.txt','rb') data = txt.read().decode('utf-8') #python3一定要加上这句不然会编码报错! txt.close() i = random.randint(1, 121) ###得到对应的i行的数据 line=linecache.getline(r'F:\send1.txt',i) 或者升级一下: def find(): txt = open(r'F:\send1.txt','rb')…
 介绍:通过pdf地址先将文件下载到本地,然后调用打印机打印,最后将下载的文件删除. 环境:windows系统.(windows64位) windows系统中安装python3.6.2环境 资料: O2S.Components.PDFRender4NET.dll(vs项目引用,这是在C#中调用打印机) python3.6.2 for windows python-3.6.2-amd64-webinstall 在python环境中添加:pywin32-221.win-amd64-py3.6 和  …
Python如何实现doc文件转换为docx文件? 在开发过程中遇到一个关于读写doc和docx的问题: 一个文件夹中有两种文件, 一种为doc结尾, 一种为docx结尾, 需要将这些文件全部重命名.然后保存. 查询好多方法之后, 发现一个狠简单暴力的方法: 1.首先新建一个.docx文件. 2.关门放代码: # dir_path: 文件所在路径, old_file: 原来文件名字, new_file: 改变的文件名字 import os def re_name(dir_path, old_fi…
将.doc转换为.docx文件有几种常用的方法: Microsoft Word 和 WPS 自带.doc转换.docx功能,但只能一个文件一个文件转换,批量转换要会员 在线网页 Office-Converter.com 等在线网页转换工具,以前很好用,现在也开始收费了 作为白嫖党,不想花钱冲会员又不想一个个打开一个个转换,故写此脚本. 1 import os 2 import time 3 from win32com import client as wc 4 5 path1 = 'E:/wai…
C# 打印PDF文件之使用不同打印机打印所有页面或部分页面 最近在逛国外各大编程社区论坛的时候,发现很多人都在问一个关于PDF文件打印的问题:打印时如何选择非默认打印机并设置打印页面的范围.而一般情况下,打印时选择的打印机是默认打印机,打印页面范围是所有页面,如果要选择其他打印机或打印部分页面,需要对代码进行一定的设置.通过在百度和各大网站上查找资料,终于在MSDN上找到了一个解决方案,我把它在这里分享出来,让其他有同样需求的朋友少走点冤枉路. 在该解决方案中我使用了一个免费的PDF控件,感兴趣…
本节学习Python的格式化输出,文件操作以及json的简单用法 1.格式化输出 将非字符串类型转换成字符串,可以使用函数:str() 或者repr() ,(这两个函数的区别目前我还没搞懂,求解答) >>> str([1,2,3,4]) '[1, 2, 3, 4]' >>> repr([1,2,3,4]) '[1, 2, 3, 4]' >>> str(10) ' >>> repr(10) ' 可以使用str.ljust() .str.…
本文地址:http://www.cnblogs.com/yhLinux/p/4063444.html $ sudo easy_install sqlalchemy [sudo] password for ovonel: Searching for sqlalchemy Reading http://pypi.python.org/simple/sqlalchemy/ Best match: SQLAlchemy Downloading https://pypi.python.org/packag…
生成单个pyc文件 python就是个好东西,它提供了内置的类库来实现把py文件编译为pyc文件,这个模块就是 py_compile 模块. 使用方法非常简单,如下所示,直接在idle中,就可以把一个py文件编译为pyc文件了.(假设在windows环境下) import py_compile py_compile.compile(r'H:/game/test.py') compile函数原型: compile(file[, cfile[, dfile[, doraise]]]) file 表示…
文件I/O是Python中最重要的技术之一,在Python中对文件进行I/O操作是非常简单的. 1. 打开文件 使用 open 函数来打开文件,语法如下: open(name[, mode[, buffering]]) 1.1 文件模式 open 函数除了必须提供的文件名参数外,其实还有一个 mode 的模式参数,如果没有指定参数值的话,它的默认值是: r.mode参数的可选值如下: 'r' 读模式 'w' 写模式 'a' 追加模式 'b' 二进制模式(可添加到其他模式使用) '+' 读/写模式…
目录 Python 文件I/O 打印到屏幕 读取键盘输入 打开和关闭文件 File对象属性 文件定位 重命名和删除文件 Python的目录 Python 文件I/O 本章只讲述所有基本的的I/O函数,更多函数请参考Python标准文档. 打印到屏幕 最简单的输出方法是用print语句,你可以给它传递零个或多个用逗号隔开的表达式.此函数把你传递的表达式转换成一个字符串表达式,并将结果写到标准输出如下: #!/usr/bin/python # -*- coding: UTF-8 -*- print…
Python同时向控制台和文件输出日志logging的方法http://www.jb51.net/article/66756.htm 1 #-*- coding:utf-8 -*- 2 import logging 3 # 配置日志信息 4 logging.basicConfig(level=logging.DEBUG, 5 format='%(asctime)s %(name)-12s %(levelname)-8s %(message)s', 6 datefmt='%m-%d %H:%M',…
PDFBox带了一些很方便的API, 可以直接创建 读取 编辑 打印PDF文件. 创建PDF文件 public static byte[] createHelloPDF() { ByteArrayOutputStream out = new ByteArrayOutputStream(); try { PDDocument doc = new PDDocument(); PDPage page = new PDPage(); doc.addPage(page); PDFont font = PD…
python入门学习:9.文件和异常 关键点:文件.异常 9.1 从文件中读取数据9.2 写入文件9.3 异常9.4 存储数据 9.1 从文件中读取数据 9.1.1 读取整个文件  首先创建一个pi_digits.txt文件,内容任意填写,保存在当前目录下. 1with open('pi_digits.txt') as file_object: #在当前目录下查找pi_digits.txt,同时返回一个文件对象2    contents = file_object.read()3    prin…
前面学习了解析PDF文档,并写入文档的知识,那篇文章的名字为深入学习Python解析并读取PDF文件内容的方法. 链接如下:https://www.cnblogs.com/wj-1314/p/9429816.html 但是最近出现了一个新问题,就是上面使用pdfminer这个库只能解析正常的PDF内容,然而在实际情况中,公司的一些文档可能是加密的,那么如何处理加密的PDF文件,就是本文学习的重点. 在网上查找资料,发现pypdf2可以实现对pdf文件进行加密,解密,所以就学习了一下这个库,并留下…
这篇文章主要学习了python解析并读取PDF文件内容的方法,包括对学习库的应用,python2.7和python3.6中python解析PDF文件内容库的更新,包括对pdfminer库的详细解释和应用.主要参考了一些已有的博客内容,代码. 主要思路是首先利用一个做项目的形式,描述所做的问题,运行环境,和需要安装的库,然后写代码,此代码是在python2.7中运行,小编也写出在python3.6中运行的代码,并详细解释python2.7和python3.6中python库的一些不同之处,最后详细…
文件操作 文件操作大概分三步: 把文件打开. 操作文件. 把文件关上. 打开文件 打开文件用open()函数,打开成功后返回一个资源,具体语法如下. open(要打开的文件,打开方式,打开文件的格式,默认为utf-8) #例如 f = open('passengers.txt','r',encoding='utf-8') 上例用open以只读的模式打开文件,因为该文本是utf-8编码的,所以第三个参数是utf-8 w 模式是写入,是创建一个新文件的写,所以如果已经有了该文件就会被覆盖掉,注意安全…
一.了解字符编码的知识储备 1.计算机基础知识(三副图) 2.文本编辑器存取文件的原理(notepad++,Pycharm,word) 打开编辑器就启动了一个进程,是在内存中运行的,所以在编辑器写的内容在没保存之前都是存放在内存中的,断电后数据就会丢失.因而需要保存到硬盘上,点击保存按钮,就从内存中把数据刷到硬盘上. 3.Python解释器执行py文件的与原理,例如python test.py 第一阶段:python解释器启动,此时就相当于启动了一个文本编辑器. 第二阶段:python解释器相当…
我已经了解Python是一种解释型语言......但是,当我查看我的Python源代码时,我看到.pyc文件,Windows将其识别为“编译的Python文件”. 这些来自哪里? #1楼 Python代码经历了两个阶段. 第一步将代码编译成.pyc文件,这实际上是一个字节码. 然后使用CPython解释器解释此.pyc文件(字节码). 请参阅此链接. 这里用简单的术语解释代码编译和执行的过程. #2楼 它们包含字节代码 ,这是Python解释器编译源的代码. 然后,此代码由Python的虚拟机执…
doc文件转txt # -*- coding:utf-8 -*- # 安装pywin32包 http://sourceforge.net/projects/pywin32/files/pywin32/ # windows 7下使用通过 # import os, sys from fnmatch import fnmatch import win32com.client if len(sys.argv)<=2: print "python %s inputdir outputdir"…
3.编写BinIoDemo.java的Java应用程序,程序完成的功能是:完成1.doc文件的复制,复制以后的文件的名称为自己的学号姓名.doc. try { FileInputStream in = new FileInputStream("e:/TextRw.txt"); FileOutputStream out = new FileOutputStream("e:/2012412440张伟.txt"); int i =0; byte[] b1 = new by…
package zuoye; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; public class BinIoDemo { public static void main(String[] args) throws IOException { // 判断1.doc文件是否存在,不存在创建文件 File file=n…
程序需要更新文件.虽然大部分程序员知道在执行I/O的时候会发生不可预期的事情,但是我经常看到一些异常幼稚的代码.在本文中,我想要分享一些如何在Python代码中改善I/O可靠性的见解. 考虑下述Python代码片段.对文件中的数据进行某些操作,然后将结果保存回文件中: 1 with open(filename) as f: 2    input = f.read() 3 output = do_something(input) 4 with open(filename, 'w') as f: 5…
需要将不少doc文件转为pdf,WPS带有这种功能,但是鼠标点击次数太多以后整个人都变得很烦躁 用了一下午去搜这方面的工具软件,找到若干.有一些免费,有一些试用的,但总归就找到一个真正能用,虽说生成的文件名中有未授权字样,但批量修改文件名简单多了. 谁知道到了实验室的电脑上因为什么打印机错误,还是不能用! 于是决定自己写一个, 第二天上午开始搜资料,乱搜一阵,居然发现WPS有二次开发的功能,大喜 但是,没有C++开发接口的资料,而且官方论坛的C++例子是针对老版本的. 于是参考别人写的C#和VB…
python之对指定目录文件夹的批量重命名 import os,shutil,string dir = "/Users/lee0oo0/Documents/python/test" #指定的目录 for i in os.listdir(dir): #遍历指定目录的文件 newfile = i.replace('a','b') # 替换 oldname = dir +'/'+str(i) newname = dir +'/'+str(newfile) shutil.move(oldnam…
PDF是一种文件格式,包含文本,图像,数据等,这是独立于操作系统的文件类型.它是一个开放的标准,压缩,另一方面DOC文件和矢量图形是由微软文字处理文件.该文件格式将纯文本格式转换为格式化文档.它支持几乎所有的操作系统. PDF和DOC转换期权具体地址的用户想从PDF数据的完美格式编辑Word文档更新文本和图像传输的转换需要. 有无数的工具和服务提供在线执行用户的转换,在这篇文章中,我们已经编制了一份清单15最好的PDF到DOC转换器将帮助您将您的PDF文件,以在各种不同的格式,如xls,RTF,…
命令:os 用到的:os.walk   os.listdir 写的爬虫爬的数据,但是又不知道进行到哪了,于是就写了个脚本来统计文件的个数 #统计 /home/dir/ 下的文件夹个数 import os path ="home/dir" count = 0 for fn in os.listdir(path): #fn 表示的是文件名 count = count+1 print count 获取文件夹下的文件的个数: import os path = os.getcwd() #获取当前…
原文 三种Python下载url并保存文件的代码 利用程序自己编写下载文件挺有意思的. Python中最流行的方法就是通过Http利用urllib或者urllib2模块. 当然你也可以利用ftplib从ftp站点下载文件.此外Python还提供了另外一种方法requests. 来看看三种方法是如何来下载zip文件的: import urllib import urllib2 import requests url = 'http://www.blog.pythonlibrary.org/wp-c…
阅读目录 1.word 里面调整好排版,包括你想生成的动态部分,还有一些不用生成的规则性的文字 2. 将 word 文档保存为 xml 3.用 Firstobject free XML edito 打开,将你需要动态生成的字段打上标记,${} 这样就可以 4.将 xml 文件更改后缀名 为 .ftl, 然后引用到你的项目中 项目中需要用 java 程序生成doc 文件,百度一番,FreeMarker 的评价比较高,FreeMarker是一个用Java语言编写的模板引擎,它基于模板来生成文本输出,…
In file included from greenlet.c:5:0: greenlet.h:8:20: 致命错误: Python.h:没有那个文件或目录 编译中断. error: Setup script exited with error: command 'gcc' failed with exit status 1  解决方法是安装python-dev,这是Python的头文件和静态库包: sudo apt-get install python-dev 如果这个python-dev无…