通过Python实现一个文档的半自动录入工具
需求出现/使用场景:
因为公司需要将word办的接口文档在线化,看起来是个很好的事情,但是就是苦逼了我们这些干活的,其中工程量最大的就是参数的录入,要是参数少也罢,有的接口动辄三四十个参数,更甚八九十个,我手动复制了一个三四十个的就让我怀疑人生,我觉的我的人生不能在赋值接口参数中浪费掉。以前也学过一点python知识,也实践过通过selenium来模拟点击,所以就萌发了一个读取文件然后通过selenium来进行表单的填充和提交,完成工具以后会节省大约80%的工作量。 大大提高了效率,也减少了对手腕的伤害。
下面是参数录入界面,可以知道点击以后一个个粘贴需要费多大的力气。

实现过程:
下面介绍一下实现过程及思路,因为要复制word中的内容,但是在word中的格式不是统一的, 所以要进行人为的将接口复制到文本文档中,并且要做相应的格式处理,所以这个工具归属于半自动化。
1.读取文件
首先要通过python进行文件的读取,不得不说python的语法是真的简简洁,读取文件一行代码的事,然后剩下的就是根据某个标识符,对每一行数据进行处理存储。 下列是读取文件代码示例:
f = open("C:\\Users\\Administrator\\Desktop\\api.txt", 'r', encoding='UTF-8')
list = f.readlines()
2.开始使用selenium
selenium可以支持火狐、IE、谷歌,使用的时候都需要先下载对应的浏览器驱动,这里我选择谷歌。首先去下载浏览器驱动, 在这个网址下载 https://blog.csdn.net/jeremyjone/article/details/80450251,同时,贴出Chrome浏览器版本和与之对应的驱动,参考网址 https://www.cnblogs.com/sxming/p/7662945.html

下载完以后还需要进行配置, 一是需要去环境变量配置,在上面网址中有介绍,二是直接指定路径,我使用的是第二种方法,比较方便,不要忘记导入对应的模块
browser = webdriver.Chrome(executable_path=".\chromedriver.exe")
selenium的基本操作,这里只介绍一些这个代码中使用到的,更多API百度一下非常多:
browser.get("https://baidu.com") // 访问网址
obj = browser.find_element_by_id("ks_ka_api_id") // 通过id查找元素
obj1 = browser.find_element_by_xpath('//*[@id="test_form"]/input[5]') // 通过xpath查找元素
obj2 = find_elements_by_tag_name("p") // 通过Dom来查找元素
obj2.send_keys(); // 填充数据
obj.click() // 点击按钮
在自动话的过程中使用到了下拉框的选择,通过查找可以通过一下代码来实现指定选中,其他的方法可以通过网上教程来了解:
f_selet = Select(browser.find_element_by_id("ks_ka_id")) // 下拉框对象
f_selet.select_by_visible_text(select_text) // 选中哪个文本
总结:
到现在为止基本核心部分的思路就完成了,然后对代码进行修饰,添加日志和异常处理,代码就完成了,贴出完成代码。 这个程序也不是特别复杂, 不过可以对有遇到类似场景的提供一个减少自己工作量的思路。从这里还是可以看出这种繁杂并且重复的劳动还是可以通过代码来编写一些自动化工具的平时多思考,这种时候就会让自己的工作量减少许多,做出了这个软件一方面是减少工作量,另一方面也是进行了python的学习,一举两得。
同时我们不可能每次运行这个程序都是通过ide来运行,最好的方式是打成exe,需要的时候只需要双击一下。 如果有需要进行打包功能的同学可以看下一篇文章: https://www.cnblogs.com/liyuhui-Z/p/9419935.html
通过Python实现一个文档的半自动录入工具的更多相关文章
- Python处理Excel文档(xlrd, xlwt, xlutils)
简介 xlrd,xlwt和xlutils是用Python处理Excel文档(*.xls)的高效率工具.其中,xlrd只能读取xls,xlwt只能新建xls(不可以修改),xlutils能将xlrd.B ...
- Openstack python api 学习文档 api创建虚拟机
Openstack python api 学习文档 转载请注明http://www.cnblogs.com/juandx/p/4953191.html 因为需要学习使用api接口调用openstack ...
- 用Python做SVD文档聚类---奇异值分解----文档相似性----LSI(潜在语义分析)
转载请注明出处:电子科技大学EClab——落叶花开http://www.cnblogs.com/nlp-yekai/p/3848528.html SVD,即奇异值分解,在自然语言处理中,用来做潜在语义 ...
- Python之xml文档及配置文件处理(ElementTree模块、ConfigParser模块)
本节内容 前言 XML处理模块 ConfigParser/configparser模块 总结 一.前言 我们在<中我们描述了Python数据持久化的大体概念和基本处理方式,通过这些知识点我们已经 ...
- python+selenium自动化软件测试(第12章):Python读写XML文档
XML 即可扩展标记语言,它可以用来标记数据.定义数据类型,是一种允许用户对自己的标记语言进 行定义的源语言.xml 有如下特征: 首先,它是有标签对组成:<aa></aa> ...
- 【转】Python之xml文档及配置文件处理(ElementTree模块、ConfigParser模块)
[转]Python之xml文档及配置文件处理(ElementTree模块.ConfigParser模块) 本节内容 前言 XML处理模块 ConfigParser/configparser模块 总结 ...
- python 分词计算文档TF-IDF值并排序
文章来自于我的个人博客:python 分词计算文档TF-IDF值并排序 该程序实现的功能是:首先读取一些文档,然后通过jieba来分词,将分词存入文件,然后通过sklearn计算每一个分词文档中的tf ...
- [转载]linux+nginx+python+mysql安装文档
原文地址:linux+nginx+python+mysql安装文档作者:oracletom # 开发包(如果centos没有安装数据库服务,那么要安装下面的mysql开发包) MySQL-devel- ...
- python操作docx文档(转)
python操作docx文档 关于python操作docx格式文档,我用到了两个python包,一个便是python-docx包,另一个便是python-docx-template;,同时我也用到了很 ...
随机推荐
- git分支branch合并到主分支master
如何使用git将分支branch合并到主干master上 对于一人独立使用git进行系统开发时,branch分支相当于版本(Version),如果每次都将新的分支branch提交到GitHub上,则会 ...
- PHP 类与对象 全解析( 一)
目录 PHP 类与对象 全解析( 一) PHP 类与对象 全解析( 二) PHP 类与对象 全解析(三 ) 1.类与对象 对象:实际存在该类事物中每个实物的个体.$a =new User(); 实例化 ...
- IDEA相关设置
今天终于放弃了MyEclipse,在使用MyEclipse中的各种心酸就不多说,总结成一句话就是:珍爱生命,远离MyEclipse. 换到IDEA后,安装了IdeaVim插件,支持vim的操作,提高的 ...
- LINQ语法类似于SQL的语法
LINQ语法类似于SQL的语法如下, Models.BookStoreEntities 是从添加新建项中的数据--->ADO.NET实体数据模型--->从数据库生成--->使用5.0 ...
- 代码实现自定义TableView
实现效果(通过代码的方式实现TableCell 的创建) 实现过程: 实现过程两个部分 1 数据源的准备 本例子采用NSDictionary +NSArray 为数据源 (接口部分) (数据初始化部分 ...
- 关于vue2用vue-cli搭建环境后域名代理的http-proxy-middleware解决api接口跨域问题
在vue中用http-proxy-middleware来进行接口代理,比如:本地运行环境为http://localhost:8080但真实访问的api为 http://www.baidu.com这时我 ...
- for、for..in、forEach、$.each等循环性能测试
var num = 10000000,arr = []; for(i=0;i<num;i++){ arr[i] = i+2; } //1) 使用 for 循环 function test1() ...
- 爬虫必备—scrapy-redis(分布式爬虫)
转载自:http://www.cnblogs.com/wupeiqi/articles/6912807.html scrapy-redis是一个基于redis的scrapy组件,通过它可以快速实现简单 ...
- redis介绍(6)集群(ruby)
redis集群: redis集群是高可用的一种体现,让整个redis圈更加稳定,不易出现宕机的情况, redis原理: redis3.0之前是不支持集群的,实现集群要自己去配置实现,很麻烦,在3.0之 ...
- 【项目管理】git和码云的使用
缘起 说了那么多关于git和码云相关的事,一直都没给大伙讲解这个码云究竟是个啥玩意儿. 今天就给大伙说说如何通过git和码云搭建属于自己的代码库. 码云 码云(Git@OSC)是开源中国社区团队推出的 ...