通过Python实现一个文档的半自动录入工具
需求出现/使用场景:
因为公司需要将word办的接口文档在线化,看起来是个很好的事情,但是就是苦逼了我们这些干活的,其中工程量最大的就是参数的录入,要是参数少也罢,有的接口动辄三四十个参数,更甚八九十个,我手动复制了一个三四十个的就让我怀疑人生,我觉的我的人生不能在赋值接口参数中浪费掉。以前也学过一点python知识,也实践过通过selenium来模拟点击,所以就萌发了一个读取文件然后通过selenium来进行表单的填充和提交,完成工具以后会节省大约80%的工作量。 大大提高了效率,也减少了对手腕的伤害。
下面是参数录入界面,可以知道点击以后一个个粘贴需要费多大的力气。

实现过程:
下面介绍一下实现过程及思路,因为要复制word中的内容,但是在word中的格式不是统一的, 所以要进行人为的将接口复制到文本文档中,并且要做相应的格式处理,所以这个工具归属于半自动化。
1.读取文件
首先要通过python进行文件的读取,不得不说python的语法是真的简简洁,读取文件一行代码的事,然后剩下的就是根据某个标识符,对每一行数据进行处理存储。 下列是读取文件代码示例:
f = open("C:\\Users\\Administrator\\Desktop\\api.txt", 'r', encoding='UTF-8')
list = f.readlines()
2.开始使用selenium
selenium可以支持火狐、IE、谷歌,使用的时候都需要先下载对应的浏览器驱动,这里我选择谷歌。首先去下载浏览器驱动, 在这个网址下载 https://blog.csdn.net/jeremyjone/article/details/80450251,同时,贴出Chrome浏览器版本和与之对应的驱动,参考网址 https://www.cnblogs.com/sxming/p/7662945.html

下载完以后还需要进行配置, 一是需要去环境变量配置,在上面网址中有介绍,二是直接指定路径,我使用的是第二种方法,比较方便,不要忘记导入对应的模块
browser = webdriver.Chrome(executable_path=".\chromedriver.exe")
selenium的基本操作,这里只介绍一些这个代码中使用到的,更多API百度一下非常多:
browser.get("https://baidu.com") // 访问网址
obj = browser.find_element_by_id("ks_ka_api_id") // 通过id查找元素
obj1 = browser.find_element_by_xpath('//*[@id="test_form"]/input[5]') // 通过xpath查找元素
obj2 = find_elements_by_tag_name("p") // 通过Dom来查找元素
obj2.send_keys(); // 填充数据
obj.click() // 点击按钮
在自动话的过程中使用到了下拉框的选择,通过查找可以通过一下代码来实现指定选中,其他的方法可以通过网上教程来了解:
f_selet = Select(browser.find_element_by_id("ks_ka_id")) // 下拉框对象
f_selet.select_by_visible_text(select_text) // 选中哪个文本
总结:
到现在为止基本核心部分的思路就完成了,然后对代码进行修饰,添加日志和异常处理,代码就完成了,贴出完成代码。 这个程序也不是特别复杂, 不过可以对有遇到类似场景的提供一个减少自己工作量的思路。从这里还是可以看出这种繁杂并且重复的劳动还是可以通过代码来编写一些自动化工具的平时多思考,这种时候就会让自己的工作量减少许多,做出了这个软件一方面是减少工作量,另一方面也是进行了python的学习,一举两得。
同时我们不可能每次运行这个程序都是通过ide来运行,最好的方式是打成exe,需要的时候只需要双击一下。 如果有需要进行打包功能的同学可以看下一篇文章: https://www.cnblogs.com/liyuhui-Z/p/9419935.html
通过Python实现一个文档的半自动录入工具的更多相关文章
- Python处理Excel文档(xlrd, xlwt, xlutils)
简介 xlrd,xlwt和xlutils是用Python处理Excel文档(*.xls)的高效率工具.其中,xlrd只能读取xls,xlwt只能新建xls(不可以修改),xlutils能将xlrd.B ...
- Openstack python api 学习文档 api创建虚拟机
Openstack python api 学习文档 转载请注明http://www.cnblogs.com/juandx/p/4953191.html 因为需要学习使用api接口调用openstack ...
- 用Python做SVD文档聚类---奇异值分解----文档相似性----LSI(潜在语义分析)
转载请注明出处:电子科技大学EClab——落叶花开http://www.cnblogs.com/nlp-yekai/p/3848528.html SVD,即奇异值分解,在自然语言处理中,用来做潜在语义 ...
- Python之xml文档及配置文件处理(ElementTree模块、ConfigParser模块)
本节内容 前言 XML处理模块 ConfigParser/configparser模块 总结 一.前言 我们在<中我们描述了Python数据持久化的大体概念和基本处理方式,通过这些知识点我们已经 ...
- python+selenium自动化软件测试(第12章):Python读写XML文档
XML 即可扩展标记语言,它可以用来标记数据.定义数据类型,是一种允许用户对自己的标记语言进 行定义的源语言.xml 有如下特征: 首先,它是有标签对组成:<aa></aa> ...
- 【转】Python之xml文档及配置文件处理(ElementTree模块、ConfigParser模块)
[转]Python之xml文档及配置文件处理(ElementTree模块.ConfigParser模块) 本节内容 前言 XML处理模块 ConfigParser/configparser模块 总结 ...
- python 分词计算文档TF-IDF值并排序
文章来自于我的个人博客:python 分词计算文档TF-IDF值并排序 该程序实现的功能是:首先读取一些文档,然后通过jieba来分词,将分词存入文件,然后通过sklearn计算每一个分词文档中的tf ...
- [转载]linux+nginx+python+mysql安装文档
原文地址:linux+nginx+python+mysql安装文档作者:oracletom # 开发包(如果centos没有安装数据库服务,那么要安装下面的mysql开发包) MySQL-devel- ...
- python操作docx文档(转)
python操作docx文档 关于python操作docx格式文档,我用到了两个python包,一个便是python-docx包,另一个便是python-docx-template;,同时我也用到了很 ...
随机推荐
- Python操作 Memcache、Redis
Python操作 Memcached.Redis 一.Memcached和Redis对比 1.1 Memcached和Redis的数据类型对比 memcached只有一种数据类型,key对应value ...
- vps服务器搭建——Linode VPS 20美元优惠获取教程
转载:http://www.cuishifeng.cn/linode/index.html?v=2 声明:本文旨在教大家怎么获得linode 20美元优惠,并免费使用4个月vps,请低调薅羊毛!(多张 ...
- drawRect:和layoutSubview的区别
关于这两个方法的区别 还是有点意思的. UIView的setNeedsDisplay和setNeedsLayout方法.首先两个方法都是异步执行的.setNeedsDisplay会调用自动调用draw ...
- xmpp实现的即时通讯聊天(二)
参考网址:http://www.jianshu.com/p/8894a5a71b70 借图描述原理: 三.注册.登陆.聊天功能的实现 故事板如下: 四个类如下: 不喜多言,直接上Demo: Login ...
- K:Treap(堆树)
Treap=Tree+Heap.Treap是一棵二叉排序树,它的左子树和右子树分别是一个Treap,和一般的二叉排序树不同的是, Treap记录一个额外的数据, 就是优先级.Treap在以关键码构 ...
- xamarin.android App在后台运行不退出
/// <summary> /// 重写按键事件 /// </summary> /// <param name="keyCode"></p ...
- python学习之老男孩python全栈第九期_数据库day001知识点总结 —— MySQL操作数据库以及数据表、基本数据类型、基本增删改查、外键定义以及创建
一. 学习SQL语句规则以及外键 1. 操作文件夹 create database db2; 创建文件夹 create database db2 default charset utf8; 创建文件夹 ...
- Yii 日期时间过滤列 filter
在yii使用过程中,我们经常要使用到 按时间区间来检索数据 用gridview自身的filter就无法满足我们得需求. 下面可以用插件的方式来搞定: sydatecolumn 下载地址:http:// ...
- Yii 之widget
默认情况下, widget 的视图文件位于包含了widget文件的 views 子目录之下.这些视图可以通过调用 CWidget::render()渲染,这一点和控制器很相似.唯一不同的是,widge ...
- angular基于ui-router实现系统权限控制
前端去实现权限控制听起来有点扯淡(实际也有点扯淡),掩耳盗铃,主要是担心安全问题,但是如果在前后端分离的情况下,需要做一个带有权限控制的后台管理系统,angular基于ui-router应该怎么做呢? ...