[转自] 用Python做统计分析 (Scipy.stats的文档) 对scipy.stats的详细介绍: 这个文档说了以下内容,对python如何做统计分析感兴趣的人可以看看,毕竟Python的库也有点乱.有的看上去应该在一起的内容分散在scipy,pandas,sympy等库中.这里是一般统计功能的使用,在scipy库中.像什么时间序列之类的当然在其他地方,而且它们反过来就没这些功能. 随机变量样本抽取 84个连续性分布(告诉你有那么多,没具体介绍) 12个离散型分布 分布的密度分布函数,累…
最近由于工作需要,需要将70个word文件的页眉页脚全部进行修改,在想到这个无聊/重复/没有任何技术含量的工作时,我的内心是相当奔溃的.就在我接近奔溃的时候我突然想到完全可以用python脚本来实现这样无聊的工作,确定目标后我便开始在网上寻找有没有造好的轮子,但是结果让我有点儿失望.关于python操作页眉页脚的文章屈指可数,仅存在的几篇也都是片段代码,仅仅可以参考而已,于是我便决定自己是实现批量替换页眉页脚的脚本. 经过搜集资料发现,python可以通过win32com以及docx扩展包来实现…
在阅读之前,你需要了解一些xml.dom的一些理论知识,在这里你可以对xml.dom有一定的了解,如果你阅读完之后. 下面是我做的demo 运行效果: 解析的XML文件位置:c:\\test\\hongten.xml <?xml version="1.0" encoding="UTF-8"?> <students> <student no="2009081097"> <name>Hongten<…
最近生成训练数据时,给一批无效的背景图片生成对应的xml文档,我用python写了一个简单的批量生成xml文档的demo,遇见了意外的小问题,记录一下. 报错问题为:ImportError: No module named 'xml.dom'; 'xml' is not a package 看见No module named “xxx”时想的是不就是没安装xml包嘛,还不简单,install一下不就好了,然而并没什么用,xml是python本生就带的.其实出现这种错误的原因是自己的命名规则问题,…
写好了代码,交付给他人使用的时候,查看代码固然可以了解各类和函数的功能细节,但接口文档能更方便的查找和说明功能.所以,一价与代码同步的接口文档是很有必要的.sphinx可以根据python中的注释,自动的生成接口文档,这样有利于保证文档和代码功能的同步.让我们来了解如何自动生成文档. 1. python代码格式. class A: ''' 你好! ''' @staticmethod def Aa(): ''' 你也好! ''' fun1() 看到类和函数中,都加入了注释. 2. 安装shpinx…
HTMLParser是Python自带的模块,使用简单,能够很容易的实现HTML文件的分析. 本文主要简单讲一下HTMLParser的用法. 使用时需要定义一个从类HTMLParser继承的类,重定义函数:handle_starttag( tag, attrs)handle_startendtag( tag, attrs)handle_endtag( tag) 来实现自己需要的功能. tag是的html标签,attrs是 (属性,值)元组(tuple)的列表(list).HTMLParser自动…
超简单Python将指定数据插入到docx模板渲染并生成 最近有一个需求,制作劳动合同表,要从excel表格中将每个人的数据导入到docx劳动合同中,重复量很大,因此可以使用python高效解决.为了让模板内容不变动,这里使用了类似jinja2的渲染引擎,使用{{ }}插值表达式把数据插入进去.也可以使用{% %}循环,条件语法等. docx模板如下(在需要插值的位置填充 {{}} 表达式): 首先安装docxtpl $ pip install docxtpl python代码如下: from…
1.pyExcelerator 主要通过俩个Object操作Excel: Workbook 和Worksheet2.pyExcelerator 读取Excel文件 parase_xls(filename,encoding=None),返回一个二元组如:[(u'Sheet1', {(3, 0): 14.0, (2, 0): 13.0, (1, 0): 12.0, (0, 0): u'\u8349\u6ce5\u9a6c'}), (u'Sheet2', {(1, 0): 222.0, (0, 0):…
下面是实验步骤: > db.things.find(){ "_id" : ObjectId("5652d71a1524dc14663060e8"), "x" : 4, "j" : 2 }{ "_id" : ObjectId("5652d71a1524dc14663060e9"), "x" : 4, "j" : 3 }{ "_id&q…
两类文档存储在两个路径下,假设每类文档有25个文档 def spamTest(): docList = [] classList = [] fullText = [] for i in range(1,26):#循环读取所有的txt,并解析成列表 wordlist = textParse(open('路径.txt' % i).read()) docList.append(wordlist) fullText.extend(wordlist) classList.append(1)#文档类别 wo…