python实现excel数据处理
python xlrd读取excel(表格)详解
安装:
pip install xlrd
官网地址:
介绍:
为开发人员提供一个库,用于从Microsoft Excel(tm)电子表格文件中提取数据。
快速使用xlrd
import xlrd
book = xlrd.open_workbook("myfile.xls")
print("当前excel文件工作表数量为 {0}".format(book.nsheets))
print("工作表名字为: {0}".format(book.sheet_names()))
# 获取第一张工作表
sh = book.sheet_by_index(0)
# 获取表的数量
print(book.nsheets)
# 当前工作表名, 总行数 总列数
print("{0} {1} {2}".format(sh.name, sh.nrows, sh.ncols))
# 单元 d30 数据为
print("Cell D30 is {0}".format(sh.cell_value(rowx=29, colx=3)))
# 获取所有行数据
for rx in range(sh.nrows):
# rx 行
print(sh.row(rx))
>>> [text:'Camille Richardson', text:'2316 EVIAN CT', empty:'', empty:'', text:'DISTRICT HEIGHTS', text:'MD', text:'20747-1153', text:'US']
# 获取所有行数据
for rx in range(sh.nrows):
print(sh.row_values(rx))
>>> ['Camille Richardson', '2316 EVIAN CT', '', '', 'DISTRICT HEIGHTS', 'MD', '20747-1153', 'US']
常用方法:
获取工作表名称、行数、列数
工作表名字:table.name
表行数:table.nrows
表列数:table.ncols
获取sheet
获取所有sheet名字:book.sheet_names()
获取sheet数量:book.nsheets
获取所有sheet对象:book.sheets()
通过sheet名查找:book.sheet_by_name("demo”)
通过索引查找:book.sheet_by_index(0)
获取sheet的汇总数据:
获取sheet名:sheet1.name
获取总行数:sheet1.nrows
获取总列数:sheet1.ncols
单元格批量读取:
行操作:
sheet1.row_values(0) # 获取第一行所有内容,合并单元格,首行显示值,其它为空。
sheet1.row(0) # 获取单元格值类型和内容
sheet1.row_types(0) # 获取单元格数据类型
列操作
sheet1.row_values(0, 6, 10) # 取第1行,第6~10列(不含第10表)
sheet1.col_values(0, 0, 5) # 取第1列,第0~5行(不含第5行)
sheet1.row_slice(2, 0, 2) # 获取单元格值类型和内容
sheet1.row_types(1, 0, 2) # 获取单元格数据类型
特定单元格读取:
获取单元格值:
sheet1.cell_value(1, 2)
sheet1.cell(1, 2).value
sheet1.row(1)[2].value
获取单元格类型:
sheet1.cell(1, 2).ctype
sheet1.cell_type(1, 2)
sheet1.row(1)[2].ctype
xlrd 常用函数
# 打开excel表,是否带格式
book = xlrd.open_workbook("地址信息.xlsx",formatting_info=True/False)
# 获取excel中所有的sheet
book.sheets()
# 打开具体sheet工作方法1
sheet = book.sheet_by_index(索引位置)
# 打开具体sheet工作方法2
sheet = book.sheet_by_nam(工作表名字)
# 获取单元格的值1
sheet.cell_value(rowx=行, colx=列)
# 获取单元格的值2
sheet.cell(行,列).value
# 获取单元格的值3
sheet.cell(行)[列].value
# 获取第4行的内容,以列表形式表示
row_4 = table.row_values(3)
# 获取所有工作表的名字
book.sheet_names()
# 获取工作表的数量
book.nsheets
# 获取工作表的所有行数
sheet.nrows
# 获取工作表的所有列数
sheet.ncols
python xlwd对excel(表格)写入详解
xlwd是一个专门对excel写入的数据。是xlrd的孪生兄弟,一个负责读取excel,一个负责对excel写入数据
安装
pip install xlwd
官方网址:
https://xlwt.readthedocs.io/en/latest/
https://github.com/python-excel/xlwt
快速入门
import xlwt
from datetime import datetime
# 设置样式 字体name Times New Roman 字体颜色为红色 数字格式为:#,##0.00
style0 = xlwt.easyxf('font: name Times New Roman, color-index red, bold on',
num_format_str='#,##0.00')
# 设置样式 日期格式为D-MMM-YY
style1 = xlwt.easyxf(num_format_str='D-MMM-YY')
# 新建工作簿
wb = xlwt.Workbook()
# 新建工作表
ws = wb.add_sheet('A Test Sheet')
# 向某行某列写入数据
ws.write(0, 0, 1234.56, style0)
ws.write(1, 0, datetime.now(), style1)
ws.write(2, 0, 1)
ws.write(2, 1, 1)
ws.write(2, 2, xlwt.Formula("A3+B3"))
# 保存工作表
wb.save('1.xls')
python 字典列表list of dictionary保存成csv
python 字典列表list of dictionary保存成csv
csv文件使用逗号分割,是一种纯文本格式,不能指定字体颜色等样式,也不能指定单元格的宽高,不能合并单元格,没有多个工作表等功能,可以使用Excel打开。使用csv模块可以把一些数据做成表格等处理,非常方便。
csv常用方法
csv.reader(f) 读取csv文件,f为打开csv文件的文件对象,返回的本质是一个迭代器,具有__next__(),__iter__()方法
csv.writer(f) 写入csv文件
csv.DictReader(f) 类字典方式读取csv文件
csv.DictWriter(f) 类字典方式写入csv文件
导出示例
from csv import DictWriter
players = [{'dailyWinners': 3, 'dailyFreePlayed': 2, 'user': 'Player1', 'bank': 0.06},
{'dailyWinners': 3, 'dailyFreePlayed': 2, 'user': 'Player2', 'bank': 4.0},
{'dailyWinners': 1, 'dailyFree': 2, 'user': 'Player3', 'bank': 3.1},
{'dailyWinners': 3, 'dailyFree': 2, 'user': 'Player4', 'bank': 0.32}]
fileds_names=('dailyWinners','dailyFreePlayed','dailyFree','user','bank')
with open('spreadsheet.csv','w',encoding='utf-8') as outfile:
writer = DictWriter(outfile, fileds_names)
writer.writeheader()
writer.writerows(players)
python3 format小数点保持指定位数
示例:
:.nf 输出小数点保留n位小数 n为一个整数
:.2f 输出小数点保留2位小数
import math
math.pi
>>> 3.141592653589793
print(f"圆周率小数点保持两位:{pi:.2f}")
>>> 圆周率小数点保持两位:3.14
:> 左对齐
:< 右对齐
:^ 居中对齐
requests 上传文件示例
requests 上传文件示例
import requests
files = {'upload_file': open('file.txt','rb')}
values = {'DB': 'photcat', 'OUT': 'csv', 'SHORT': 'short'}
r = requests.post(url, files=files, data=values)
封装写法
import os
import requests
def upload_file(file_path):
if os.path.exists(file_path):
raise ValueError(f"file_path:{file_path} is error")
files = {'upload_file': open(file_path,'rb')}
values = {'DB': 'photcat', 'OUT': 'csv', 'SHORT': 'short'}
r = requests.post(url, files=files, data=values)
python读取xlrd
xlrd模块实现对excel文件内容读取,xlwt模块实现对excel文件的写入。
安装
1
2
|
pip install xlrd pip install xlwt |
xlrd模块使用
excel文档名称为联系人.xls,内容如下:
(1) 打开excel文件并获取所有sheet
1
2
3
4
5
6
7
|
import xlrd # 打开Excel文件读取数据 data = xlrd.open_workbook( '联系人.xls' ) sheet_name = data.sheet_names() # 获取所有sheet名称 print (sheet_name) # ['银行2', '银行3'] |
(2) 根据下标获取sheet名称
1
2
3
|
# 根据下标获取sheet名称 sheet2_name = data.sheet_names()[ 1 ] print (sheet2_name) # '银行3' |
(3) 根据sheet索引或者名称获取sheet内容,同时获取sheet名称、行数、列数
1
2
3
4
5
6
7
8
9
10
11
12
13
|
# 根据sheet索引或者名称获取sheet内容,同时获取sheet名称、列数、行数 sheet2 = data.sheet_by_index( 1 ) print ( 'sheet2名称:{}\nsheet2列数: {}\nsheet2行数: {}' . format (sheet2.name, sheet2.ncols, sheet2.nrows)) # sheet2名称:银行3 # sheet2列数: 7 # sheet2行数: 5 sheet1 = data.sheet_by_name( '银行2' ) print ( 'sheet1名称:{}\nsheet1列数: {}\nsheet1行数: {}' . format (sheet1.name, sheet1.ncols, sheet1.nrows)) # sheet1名称:银行2 # sheet1列数: 8 # sheet1行数: 6 |
(4) 根据sheet名称获取整行和整列的值
1
2
3
4
5
6
|
# 根据sheet名称获取整行和整列的值 sheet1 = data.sheet_by_name( '银行2' ) print (sheet1.row_values( 3 )) # ['', '张2', '开发', 'IT编码', 999.0, 133111.0, 41463.0, 'zhang2@164.com'] 日期2013/7/7,实际却显示为浮点数41463.0 print (sheet1.col_values( 3 )) # ['', '工作职责', '', 'IT编码', '网络维修', ''] |
(5)获取指定单元格的内容
1
2
3
4
|
# 获取指定单元格的内容 print (sheet1.cell( 1 , 0 ).value) # 第2 行1列内容:机构名称 print (sheet1.cell_value( 1 , 0 )) # 第2 行1列内容:机构名称 print (sheet1.row( 1 )[ 0 ].value) # 第2 行1列内容:机构名称 |
(6)获取单元格内容的数据类型
1
2
3
4
5
|
# 获取单元格内容的数据类型 print (sheet1.cell( 1 , 0 ).ctype) # 第2 行1列内容 :机构名称为string类型 print (sheet1.cell( 3 , 4 ).ctype) # 第4行5列内容:999 为number类型 print (sheet1.cell( 3 , 6 ).ctype) # 第4 行7列内容:2013/7/8 为date类型 # 说明:ctype : 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error |
(7)获取单元内容为日期类型的方式
使用xlrd的xldate_as_tuple处理为date格式
1
2
3
4
5
6
7
8
|
from datetime import datetime,date if sheet1.cell( 3 , 6 ).ctype = = 3 : print (sheet1.cell( 3 , 6 ).value) # 41463.0 date_value = xlrd.xldate_as_tuple(sheet1.cell( 3 , 6 ).value, data.datemode) print (date_value) # (2013, 7, 8, 0, 0, 0) print (date( * date_value[: 3 ])) # 2013-07-08 print (date( * date_value[: 3 ]).strftime( '%Y/%m/%d' )) # 2013/07/08 |
(8)获取单元内容为number的方式(转为整型)
1
2
3
4
|
if sheet1.cell( 3 , 5 ).ctype = = 2 : print (sheet1.cell( 3 , 5 ).value) # 133111.0 num_value = int (sheet1.cell( 3 , 5 ).value) print (num_value) # 133111 |
(9) 获取合并单元格的内容
需要merged_cells属性
1
2
3
4
5
6
7
8
9
10
11
|
# 这里,需要在读取文件的时候添加个参数,将formatting_info参数设置为True,默认是False,否 # 则可能调用merged_cells属性获取到的是空值。<br> data = xlrd.open_workbook( '联系人.xls' ,formatting_info = True ) sheet1 = data.sheet_by_name( '银行2' ) print (sheet1.merged_cells) # [(0, 1, 0, 8), (2, 6, 0, 1)]<br> # merged_cells返回的这四个参数的含义是:(row,row_range,col,col_range),其中[row,row_range)包括row, # 不包括row_range,col也是一样,下标从0开始。 #(0, 1, 0, 8) 表示1列-8列合并 (2, 6, 0, 1)表示3行-6行合并<br> # 分别获取合并2个单元格的内容: print (sheet1.cell( 0 , 0 ).value) # 银行2 print (sheet1.cell_value( 2 , 0 )) # 银行2 |
规律 : 获取merge_cells返回的row和col低位的索引即可!
使用以下方法更加方便
1
2
3
4
5
6
7
8
9
|
merge_value = [] for (row,row_range,col,col_range) in sheet1.merged_cells: merge_value.append((row,col)) print (merge_value) # [(0, 0), (2, 0)] for v in merge_value: print (sheet1.cell(v[ 0 ], v[ 1 ]).value) # 银行2 # 银行2 |
xlwt模块
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
|
import xlwt from datetime import datetime,date def set_style(name, height, bold = False , format_str = ''): style = xlwt.XFStyle() # 初始化样式 font = xlwt.Font() # 为样式创建字体 font.name = name # 'Times New Roman' font.bold = bold font.height = height borders = xlwt.Borders() # 为样式创建边框 borders.left = 6 borders.right = 6 borders.top = 6 borders.bottom = 6 style.font = font style.borders = borders style.num_format_str = format_str return style wb = xlwt.Workbook() ws = wb.add_sheet( 'A Test Sheet' ) # 增加sheet ws.col( 0 ).width = 200 * 30 # 设置第一列列宽 ws.write( 0 , 0 , 1234.56 ,set_style( 'Times New Roman' , 220 ,bold = True ,format_str = '#,##0.00' )) ws.write( 1 , 0 , datetime.now(), set_style( 'Times New Roman' , 220 ,bold = False , format_str = 'DD-MM-YYYY' )) styleOK = xlwt.easyxf( 'pattern: fore_colour light_blue;' 'font: colour green, bold True;' ) pattern = xlwt.Pattern() #一个实例化的样式类 pattern.pattern = xlwt.Pattern.SOLID_PATTERN # 固定的样式 pattern.pattern_fore_colour = xlwt.Style.colour_map[ 'red' ] #背景颜色 styleOK.pattern = pattern ws.write( 2 , 0 , 1 ,style = styleOK) ws.write( 2 , 1 , 1 ) ws.write( 2 , 2 , xlwt.Formula( "A3+B3" )) wb.save( 'example.xls' ) # 保存xls |
联系人表
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
|
import xlwt from datetime import datetime, date def set_style(name, height, bold = False , format_str = ' ',align=' center'): style = xlwt.XFStyle() # 初始化样式 font = xlwt.Font() # 为样式创建字体 font.name = name # 'Times New Roman' font.bold = bold font.height = height borders = xlwt.Borders() # 为样式创建边框 borders.left = 2 borders.right = 2 borders.top = 0 borders.bottom = 2 alignment = xlwt.Alignment() # 设置排列 if align = = 'center' : alignment.horz = xlwt.Alignment.HORZ_CENTER alignment.vert = xlwt.Alignment.VERT_CENTER else : alignment.horz = xlwt.Alignment.HORZ_LEFT alignment.vert = xlwt.Alignment.VERT_BOTTOM style.font = font style.borders = borders style.num_format_str = format_str style.alignment = alignment return style wb = xlwt.Workbook() ws = wb.add_sheet( '联系人' ,cell_overwrite_ok = True ) # 增加sheet rows = [ '机构名称' , '姓名' , '部门' , '电话' , '入职日期' , '手机' , '邮箱' ] col1 = [ '王1' , '王2' , '王3' ] col2 = [ '666' , '777' , '888' ] col3 = [ '2014-08-09' , '2014-08-11' , '2015-08-09' ] # 写第一行数据 ws.write_merge( 0 , 0 , 0 , 6 , '联系人表' , set_style( 'Times New Roman' , 320 , bold = True , format_str = '')) # 合并单元格 styleOK = xlwt.easyxf() pattern = xlwt.Pattern() # 一个实例化的样式类 pattern.pattern = xlwt.Pattern.SOLID_PATTERN # 固定的样式 pattern.pattern_fore_colour = xlwt.Style.colour_map[ 'yellow' ] # 背景颜色 borders = xlwt.Borders() # 为样式创建边框 borders.left = 2 borders.right = 2 borders.top = 6 borders.bottom = 2 font = xlwt.Font() # 为样式创建字体 font.name = 'Times New Roman' font.bold = True font.height = 220 styleOK.pattern = pattern styleOK.borders = borders styleOK.font = font # 写第二行数据 for index, val in enumerate (rows): ws.col(index).width = 150 * 30 # 定义列宽 ws.write( 1 , index, val, style = styleOK) # 写第3行-6行第一列数据 ws.write_merge( 2 , 2 + len (col1) - 1 , 0 , 0 , 'x机构' , set_style( 'Times New Roman' , 320 , bold = True , format_str = '')) # 合并单元格 # 从第3行开始写1列数据 for index, val in enumerate (col1): ws.col( 1 ).width = 150 * 30 # 定义列宽 ws.write(index + 2 , 1 , val, style = set_style( 'Times New Roman' , 200 , bold = False , format_str = ' ',align=' ')) # 从第3行开始写4列数据 for index, val in enumerate (col2): ws.col( 3 ).width = 150 * 30 # 定义列宽 ws.write(index + 2 , 3 , val, style = set_style( 'Times New Roman' , 200 , bold = False , format_str = ' ',align=' ')) # 从第3行开始写5列数据 for index, val in enumerate (col3): ws.col( 4 ).width = 150 * 30 # 定义列宽 ws.write(index + 2 , 4 , val, style = set_style( 'Times New Roman' , 200 , bold = False , format_str = ' ',align=' ')) ws.write( 4 , 2 , '技术部' , style = styleOK) ws.write( 4 , 5 , '186777233' , style = styleOK) ws.write( 4 , 6 , 'wang@166.com' , style = styleOK) wb.save( 'test.xls' ) # 保存xls |
【Python】如何处理Excel中的数据
我们平时在做自动化测试的时候,可能会涉及到从表格中去读取或者存储数据,我们除了可以使用openpyxl来操作excel,当然也可以利用pandas来完成,这篇随笔只是我在学习过程中的简单记录,其他的功能还需要继续去探索。
一、pandas的安装:
1.安装pandas其实是非常简单的,pandas依赖处理Excel的xlrd模块,所以我们需要提前安装这个,安装命令是:pip install xlrd
2.开始安装pandas,安装命令是:pip install pandas
二、读取excel文件
webservice_testcase.xlsx结构如下:
1.首先我们应该先将这个模块导入
1
|
import pandas as pd |
2.读取表单中的数据:
sheet=pd.read_excel('test_data\\webservice_testcase.xlsx')#这个会直接默认读取到这个Excel的第一个表单
data=sheet.head()#默认读取前5行数据
print("获取到所有的值:\n{0}".format(data))#格式化输出
3.也可以通过指定表单名来读取数据
sheet=pd.read_excel('test_data\\webservice_testcase.xlsx',sheet_name='userRegister')
data=sheet.head()#默认读取前5行数据
print("获取到所有的值:\n{0}".format(data))#格式化输出
4.通过表单索引来指定要访问的表单,0表示第一个表单,也可以采用表单名和索引的双重方式来定位表单,也可以同时定位多个表单,方式都罗列如下所示

sheet=pd.read_excel('test_data\\webservice_testcase.xlsx',sheet_name=['sendMCode','userRegister'])#可以通过表单名同时指定多个
# sheet=pd.read_excel('test_data\\webservice_testcase.xlsx',sheet_name=0)#可以通过表单索引来指定读取的表单
# sheet=pd.read_excel('test_data\\webservice_testcase.xlsx',sheet_name=['sendMCode',1])#可以混合的方式来指定
# sheet=pd.read_excel('test_data\\webservice_testcase.xlsx',sheet_name=[1,2])#可以通过索引 同时指定多个
data=sheet.values#获取所有的数据,注意这里不能用head()方法
print("获取到所有的值:\n{0}".format(data))#格式化输出

二、操作Excel中的行列
1.读取制定的某一行数据:
sheet=pd.read_excel('webservice_testcase.xlsx')#这个会直接默认读取到这个Excel的第一个表单
data=sheet.ix[0].values#0表示第一行 这里读取数据并不包含表头
print("读取指定行的数据:\n{0}".format(data))
得到了如下结果:
2.读取指定的多行:
sheet=pd.read_excel('test_data\\webservice_testcase.xlsx')#这个会直接默认读取到这个Excel的第一个表单
data=sheet.ix[[0,1]].values#0表示第一行 这里读取数据并不包含表头
print("读取指定行的数据:\n{0}".format(data))
得到了如下的结果:
3.读取指定行列的数据:
sheet=pd.read_excel('test_data\\webservice_testcase.xlsx')#这个会直接默认读取到这个Excel的第一个表单
data=sheet.ix[0,1]#读取第一行第二列的值
print("读取指定行的数据:\n{0}".format(data))
得到了如下结果:
4.读取指定的多行多列的值:
sheet=pd.read_excel('test_data\\webservice_testcase.xlsx')
data=sheet.ix[[1,2],['method','description']].values#读取第二行第三行的method以及description列的值,这里需要嵌套列表
print("读取指定行的数据:\n{0}".format(data))
得到了如下的结果:
5.读取所有行指定的列的值:
sheet=pd.read_excel('test_data\\webservice_testcase.xlsx')
data=sheet.ix[:,['method','description']].values#读取第二行第三行的method以及description列的值,这里需要嵌套列表
print("读取指定行的数据:\n{0}".format(data))
得到了如下的结果:
6.获取行号输出:
sheet=pd.read_excel('test_data\\webservice_testcase.xlsx')
print("输出行号列表",sheet.index.values)
得到了如下的结果:
7.获取列名输出:
sheet=pd.read_excel('test_data\\webservice_testcase.xlsx')
print("输出列标题",sheet.columns.values)
得到了如下的结果:
8.获取指定行数的值:
sheet=pd.read_excel('test_data\\webservice_testcase.xlsx')
print("输出值",sheet.sample(2).values)
9.获取指定列的值
sheet=pd.read_excel('test_data\\webservice_testcase.xlsx')
print("输出值",sheet['description'].values)
得到了如下的结果:
三、将excel中的每一条数据处理成字典,然后让如一个列表中
test_data=[]
sheet = pd.read_excel(self.file_name, sheet_name=key)
for i in sheet.index.values:#获取行号的索引,并对其进行遍历:#根据i来获取每一行指定的数据 并利用to_dict转成字典
row_data=sheet.ix[i,['id','method','description','url','param','ExpectedResult']].to_dict()
test_data.append(row_data)
另外,我们可以把测试用例相关的东西写入一个配置文件当中,读取的时候可以根据配置文件中的内容来进行读取:
配置文件如下:
1
2
3
4
5
6
|
[CASECONFIG] sheet_list = { 'sendMCode' : 'all' , 'userRegister' : 'all' , 'verifyUserAuth' : 'all' , 'bindBankCard' :[] } |
配置文件处理.py代码如下:

import configparser
class ReadConfig:
def read_config(self,file_path,section,option):
cf=configparser.ConfigParser()
cf.read(file_path,encoding="utf-8")
value=cf.get(section,option)
return value

project_path.py代码如下:

import os
Project_path=os.path.split(os.path.split(os.path.realpath(__file__))[0])[0]
#配置文件路径
case_config_path=os.path.join(Project_path,'config','case.config')
#测试用例的路径
test_cases_path=os.path.join(Project_path,'test_data','webservice_testcase.xlsx')

然后我们把读取excel中的内容封装成一个类,代码示例如下:

from common import project_pathfrom common.read_config import ReadConfig as RC
import pandas as pd class DoExcel:
def __init__(self,file_name):
self.file_name=file_name
self.sheet_list=eval(RC().read_config(project_path.case_config_path,'CASECONFIG','sheet_list'))
def do_excel(self):
test_data=[]
for key in self.sheet_list:
if self.sheet_list[key] == 'all': # 读取所有的用例
sheet = pd.read_excel(self.file_name, sheet_name=key)
for i in sheet.index.values:#获取行号的索引,并对其进行遍历:
#根据i来获取每一行指定的数据 并利用to_dict转成字典
row_data=sheet.ix[i,['id','method','description','url','param','ExpectedResult']].to_dict()
test_data.append(row_data)
else:
sheet = pd.read_excel(self.file_name, sheet_name=key)
for i in self.sheet_list[key]:#根据list中的标号去读取excel指定的用例
row_data=sheet.ix[i-1,['id','method','description','url','param','ExpectedResult']].to_dict()
test_data.append(row_data)
return test_data
if __name__ == '__main__':
test_data=DoExcel(project_path.test_cases_path).do_excel()
print(test_data)

如果将配置改成如下内容:

[CASECONFIG]
sheet_list={'sendMCode':[1,3,5],
'userRegister':[],
'verifyUserAuth':[],
'bindBankCard':[]
}

我们将会得到如下的运行结果:
[{'id': 1, 'method': 'sendMCode', 'description': '正常流程', 'url': 'http://120.24.235.105:9010/sms-service-war-1.0/ws/smsFacade.ws?wsdl', 'param': '{"client_ip":"172.16.168.202","tmpl_id":1,"mobile":"${tel}"}', 'ExpectedResult': '(result){\n retCode = "0"\n retInfo = "ok"\n }'},
{'id': 3, 'method': 'sendMCode', 'description': '手机号为空', 'url': 'http://120.24.235.105:9010/sms-service-war-1.0/ws/smsFacade.ws?wsdl', 'param': '{"client_ip":"172.16.168.202","tmpl_id":1,"mobile":""}', 'ExpectedResult': "Server raised fault: '手机号码错误'"},
{'id': 5, 'method': 'sendMCode', 'description': 'ip地址为空', 'url': 'http://120.24.235.105:9010/sms-service-war-1.0/ws/smsFacade.ws?wsdl', 'param': '{"client_ip":"","tmpl_id":1,"mobile":"${tel}"}', 'ExpectedResult': "Server raised fault: '用户IP不能为空'"}]
到此,将excel中的用例数据读取成为[{key1:value1},{key2:value2},...,{keyn:valuen}]这样的形式已经完毕,但是还有很多东西需要完善,比如用例中完成参数的替换,测试完成后回写测试数据到excel对应的表格中等等内容。
python 从word/docx中提取链接(hyperlink)和文本
python 从word/docx中提取链接(hyperlink)和文本
import zipfile
import re
import json
import base64
from docx import Document
from os.path import basename
from docx.opc.constants import RELATIONSHIP_TYPE as RT
from bs4 import BeautifulSoup
def get_linked_text(soup):
links = []
# This kind of link has a corresponding URL in the _rel file.
for tag in soup.find_all("hyperlink"):
# try/except because some hyperlinks have no id.
try:
links.append({"id": tag["r:id"], "text": tag.text})
except:
pass
# This kind does not.
for tag in soup.find_all("instrText"):
# They're identified by the word HYPERLINK
if "HYPERLINK" in tag.text:
# Get the URL. Probably.
url = tag.text.split('"')[1]
# The actual linked text is stored nearby tags.
# Loop through the siblings starting here.
temp = tag.parent.next_sibling
text = ""
while temp is not None:
# Text comes in <t> tags.
maybe_text = temp.find("t")
if maybe_text is not None:
# Ones that have text in them.
if maybe_text.text.strip() != "":
text += maybe_text.text.strip()
# Links end with <w:fldChar w:fldCharType="end" />.
maybe_end = temp.find("fldChar[w:fldCharType]")
if maybe_end is not None:
if maybe_end["w:fldCharType"] == "end":
break
temp = temp.next_sibling
links.append({"id": None, "href": url, "text": text})
return links
if __name__ == '__main__':
file_name="xx.docx"
archive = zipfile.ZipFile(file_name, "r")
file_data = archive.read("word/document.xml")
doc_soup = BeautifulSoup(file_data, "xml")
linked_text = get_linked_text(doc_soup)
print(linked_text)
word读取图片,并将图片转换成链接
word读取图片,并将图片转换成链接
from docx import Document
from os.path import basename
import re
def upload_image(image_data):
image_url = "图片链接"
return image_url
file_name = "/Users/在文档顶部.docx"
doc = Document(file_name)
a = list()
pattern = re.compile('rId\d+')
for graph in doc.paragraphs:
b = list()
for run in graph.runs:
if run.text != '':
b.append(run.text)
else:
# b.append(pattern.search(run.element.xml))
content_id = pattern.search(run.element.xml).group(0)
try:
content_type = doc.part.related_parts[content_id].content_type
except KeyError as e:
print(e)
continue
if not content_type.startswith('image'):
continue
img_name = basename(doc.part.related_parts[content_id].partname)
img_data = doc.part.related_parts[content_id].blob
b.append(upload_image(img_data))
b_str=f"{''.join(b)}"
a.append(b_str)
print(a)
python re模块去掉括号及其里面的内容
括号为全角括号
文本:寄令狐绹(一本无绹字)相公
import re
text = "寄令狐绹(一本无绹字)相公"
text = re.sub("\\(.*?)|\\{.*?}|\\[.*?]|\\【.*?】", "",text)
print(text)
>>> 寄令狐绹相公
括号为半角括号
import re
text = "寄令狐绹(一本无绹字)相公"
text = re.sub("\\(.*?\\)|\\{.*?}|\\[.*?]", "",text)
print(text)
>>> 寄令狐绹相公
python实现excel数据处理的更多相关文章
- 【Python】Excel数据处理
1.环境准备 > python2.7 > xlrd,xlwt模块下载与安装,前者用来读取excel文件,后者用来写入excel文件 2.实战案例 案例场景: > excel1中包含某 ...
- [转]用Python读写Excel文件
[转]用Python读写Excel文件 转自:http://www.gocalf.com/blog/python-read-write-excel.html#xlrd-xlwt 虽然天天跟数据打交 ...
- 转:Python 与 Excel 不得不说的事
数据处理是 Python 的一大应用场景,而 Excel 则是最流行的数据处理软件.因此用 Python 进行数据相关的工作时,难免要和 Excel 打交道. 如果仅仅是要以表单形式保存数据,可以借助 ...
- Python 操作 Excel,总有一个模块适合自己
最近在写性能相关的测试脚本,脚本已经完成,最终怎么体现在报告上,要想让报告看起来漂亮些,我们是先创建一个模板(格式和公式已全部制作好),只需要性能测试完成后往对应的sheet页中填充数据,数据完成后最 ...
- 使用python将excel数据导入数据库
使用python将excel数据导入数据库 因为需要对数据处理,将excel数据导入到数据库,记录一下过程. 使用到的库:xlrd 和 pymysql (如果需要写到excel可以使用xlwt) 直接 ...
- Python对Excel的操作
Python几个读取Excel库的介绍: xlwings 可结合 VBA 实现对 Excel 编程,强大的数据输入分析能力,同时拥有丰富的接口,结合 pandas/numpy/matplotlib 轻 ...
- Python读写Excel表格
最近在做一些数据处理和计算的工作,因为数据是以.CSV格式保存的,因此刚开始直接用Excel来处理. 但是做着做着发现重复的劳动,其实并没有多大的意义,于是就想着写个小工具帮着处理. 以前正好在一本书 ...
- 【Python自动化Excel】pandas处理Excel数据的基本流程
这里所说的pandas并不是大熊猫,而是Python的第三方库.这个库能干嘛呢?它在Python数据分析领域可是无人不知.无人不晓的.可以说是Python世界中的Excel. pandas库处理数据相 ...
- 【Python自动化Excel】pandas处理Excel的“分分合合”
话说Excel数据表,分久必合.合久必分.Excel数据表的"分"与"合"是日常办公中常见的操作.手动操作并不困难,但数据量大了之后,重复性操作往往会令人崩溃. ...
- 【Python自动化Excel】pandas操作Excel的“分分合合”
话说Excel数据表,分久必合.合久必分.Excel数据表的"分"与"合"是日常办公中常见的操作.手动操作并不困难,但数据量大了之后,重复性操作往往会令人崩溃. ...
随机推荐
- optical simulation of quantum logic
量子逻辑的光学模拟(PRA, 1998) 主机中<1998Cerf.pdf> 核心: 1. 用一个光子的多条路径的叠加态来表示n qubits, 那么实验上干涉仪所包含的路径数为 2^n ...
- Centos模板机配置
icentos7标准化配置 挂载光盘 mkdir /media/cdrom mount /dev/sr0 /media/cdrom vi /etc/yum.repo.d/ 配置本地yum源 vim l ...
- C++之OpenCV入门到提高005:005 图像操作
一.介绍 今天是这个系列<C++之 Opencv 入门到提高>得第五篇文章.这篇文章也不难,介绍如何图像的基本操作,比如:读取一张图片的像素值,如何修改一张图片中的像素值,如何读取一张图片 ...
- Visual Studio 快速分析 .NET Dump 文件
前言 在开发和维护 .NET 应用程序的过程中,有时会遇到难以捉摸的性能瓶颈或内存泄漏等问题.这些问题往往发生在生产环境中,难以复现.为了更准确地诊断这些运行时问题,通常会收集应用程序在生产环境中的内 ...
- begin-预览,不行啊还是太弱了
方便管理,主要是想熟悉下git的操作 先创建并且切换到一个新的分支: git commit --allow-empty -am "before starting PA1" git ...
- 探究内存泄露—Part1—编写泄露代码
本文由 ImportNew - 黄索远 翻译自 captaindebug.如需转载本文,请先参见文章末尾处的转载要求. ImportNew注:如果你也对Java技术翻译分享感兴趣,欢迎加入我们的 Ja ...
- Spring AOP进行日志记录,管理 (使用Spring的拦截器功能获取对action中每个方法的调用情况,在方法调用前和调用后记录相关日志。)
在java开发中日志的管理有很多种.我一般会使用过滤器,或者是Spring的拦截器进行日志的处理.如果是用过滤器比较简单,只要对所有的.do提交进行拦截,然后获取action的提交路径就可以获取对每个 ...
- PHP5.2-5.6不同版本新特性
温故而知新, 时常复习下之前的东西 还是会有一些收获 本文目录:PHP5.2 以前:autoload, PDO 和 MySQLi, 类型约束PHP5.2:JSON 支持PHP5.3:弃用的功能,匿名函 ...
- 2022-2023 ACM-ICPC Nordic Collegiate Programming Contest (NCPC 2022)
F. Foreign Football 一共有\(n\)支队伍,每支队伍的名称为\(s_i\),给定一个\(n \times n\)的矩阵,\(a_{i,j}\)代表第\(i\)支队伍和第\(j\)支 ...
- 基于 C# 编写的 Visual Studio 文件编码显示与修改扩展插件
前言 在软件开发过程中,尤其是在处理跨平台或来自不同来源的项目时,文件的编码格式往往会成为一个不可忽视的问题.不同的操作系统.编程语言和编辑器可能对文件编码有不同的支持和默认设置,这可能导致在打开一个 ...