python xlrd读取excel(表格)详解

安装:

pip install xlrd

官网地址:

https://xlrd.readthedocs.io/

介绍:

为开发人员提供一个库,用于从Microsoft Excel(tm)电子表格文件中提取数据。

快速使用xlrd

import xlrd

book = xlrd.open_workbook("myfile.xls")
print("当前excel文件工作表数量为 {0}".format(book.nsheets))
print("工作表名字为: {0}".format(book.sheet_names())) # 获取第一张工作表
sh = book.sheet_by_index(0) # 获取表的数量
print(book.nsheets) # 当前工作表名, 总行数 总列数
print("{0} {1} {2}".format(sh.name, sh.nrows, sh.ncols)) # 单元 d30 数据为
print("Cell D30 is {0}".format(sh.cell_value(rowx=29, colx=3))) # 获取所有行数据
for rx in range(sh.nrows):
  # rx 行
  print(sh.row(rx))
  
>>>  [text:'Camille Richardson', text:'2316 EVIAN CT', empty:'', empty:'', text:'DISTRICT HEIGHTS', text:'MD', text:'20747-1153', text:'US']   # 获取所有行数据     
for rx in range(sh.nrows):
    print(sh.row_values(rx))
    
>>> ['Camille Richardson', '2316 EVIAN CT', '', '', 'DISTRICT HEIGHTS', 'MD', '20747-1153', 'US']

常用方法:

获取工作表名称、行数、列数

  • 工作表名字:table.name

  • 表行数:table.nrows

  • 表列数:table.ncols

获取sheet

  • 获取所有sheet名字:book.sheet_names()

  • 获取sheet数量:book.nsheets

  • 获取所有sheet对象:book.sheets()

  • 通过sheet名查找:book.sheet_by_name("demo”)

  • 通过索引查找:book.sheet_by_index(0)

获取sheet的汇总数据:

  • 获取sheet名:sheet1.name

  • 获取总行数:sheet1.nrows

  • 获取总列数:sheet1.ncols

单元格批量读取:

  1. 行操作:

    • sheet1.row_values(0)     # 获取第一行所有内容,合并单元格,首行显示值,其它为空。

    • sheet1.row(0)           # 获取单元格值类型和内容

    • sheet1.row_types(0)     # 获取单元格数据类型

  2. 列操作

    • sheet1.row_values(0, 6, 10)   # 取第1行,第6~10列(不含第10表)

    • sheet1.col_values(0, 0, 5)    # 取第1列,第0~5行(不含第5行)

    • sheet1.row_slice(2, 0, 2)     # 获取单元格值类型和内容

    • sheet1.row_types(1, 0, 2)   # 获取单元格数据类型

特定单元格读取:

  1. 获取单元格值:

    • sheet1.cell_value(1, 2)

    • sheet1.cell(1, 2).value

    • sheet1.row(1)[2].value

  2. 获取单元格类型:

    • sheet1.cell(1, 2).ctype

    • sheet1.cell_type(1, 2)

    • sheet1.row(1)[2].ctype

xlrd 常用函数

# 打开excel表,是否带格式
book = xlrd.open_workbook("地址信息.xlsx",formatting_info=True/False) # 获取excel中所有的sheet
book.sheets() # 打开具体sheet工作方法1
sheet = book.sheet_by_index(索引位置) # 打开具体sheet工作方法2
sheet = book.sheet_by_nam(工作表名字) # 获取单元格的值1
sheet.cell_value(rowx=行, colx=列) # 获取单元格的值2
sheet.cell(行,列).value # 获取单元格的值3
sheet.cell(行)[列].value  # 获取第4行的内容,以列表形式表示
row_4 = table.row_values(3) # 获取所有工作表的名字
book.sheet_names() # 获取工作表的数量
book.nsheets # 获取工作表的所有行数
sheet.nrows # 获取工作表的所有列数
sheet.ncols

python xlwd对excel(表格)写入详解

xlwd是一个专门对excel写入的数据。是xlrd的孪生兄弟,一个负责读取excel,一个负责对excel写入数据

安装

pip install xlwd

官方网址:

https://xlwt.readthedocs.io/en/latest/

https://github.com/python-excel/xlwt

快速入门

import xlwt
from datetime import datetime # 设置样式 字体name Times New Roman 字体颜色为红色 数字格式为:#,##0.00
style0 = xlwt.easyxf('font: name Times New Roman, color-index red, bold on',
    num_format_str='#,##0.00') # 设置样式 日期格式为D-MMM-YY    
style1 = xlwt.easyxf(num_format_str='D-MMM-YY') # 新建工作簿
wb = xlwt.Workbook() # 新建工作表
ws = wb.add_sheet('A Test Sheet') # 向某行某列写入数据
ws.write(0, 0, 1234.56, style0)
ws.write(1, 0, datetime.now(), style1)
ws.write(2, 0, 1)
ws.write(2, 1, 1)
ws.write(2, 2, xlwt.Formula("A3+B3")) # 保存工作表
wb.save('1.xls')

python 字典列表list of dictionary保存成csv

python 字典列表list of dictionary保存成csv

csv文件使用逗号分割,是一种纯文本格式,不能指定字体颜色等样式,也不能指定单元格的宽高,不能合并单元格,没有多个工作表等功能,可以使用Excel打开。使用csv模块可以把一些数据做成表格等处理,非常方便。

csv常用方法

csv.reader(f)   读取csv文件,f为打开csv文件的文件对象,返回的本质是一个迭代器,具有__next__(),__iter__()方法
csv.writer(f)   写入csv文件
csv.DictReader(f)    类字典方式读取csv文件
csv.DictWriter(f)    类字典方式写入csv文件

导出示例

from csv import DictWriter

players = [{'dailyWinners': 3, 'dailyFreePlayed': 2, 'user': 'Player1', 'bank': 0.06},
{'dailyWinners': 3, 'dailyFreePlayed': 2, 'user': 'Player2', 'bank': 4.0},
{'dailyWinners': 1, 'dailyFree': 2, 'user': 'Player3', 'bank': 3.1},            
{'dailyWinners': 3, 'dailyFree': 2, 'user': 'Player4', 'bank': 0.32}] fileds_names=('dailyWinners','dailyFreePlayed','dailyFree','user','bank') with open('spreadsheet.csv','w',encoding='utf-8') as outfile:
    writer = DictWriter(outfile, fileds_names)
    writer.writeheader()
    writer.writerows(players)

python3 format小数点保持指定位数

python3 format小数点保持指定位数

示例:

:.nf  输出小数点保留n位小数 n为一个整数

:.2f  输出小数点保留2位小数

import math    
math.pi >>>  3.141592653589793 print(f"圆周率小数点保持两位:{pi:.2f}")                                
>>> 圆周率小数点保持两位:3.14

:> 左对齐

:<  右对齐

:^  居中对齐

requests 上传文件示例

 

requests 上传文件示例

import requests

files = {'upload_file': open('file.txt','rb')}
values = {'DB': 'photcat', 'OUT': 'csv', 'SHORT': 'short'} r = requests.post(url, files=files, data=values)

封装写法

import os
import requests def upload_file(file_path):
if os.path.exists(file_path):
raise ValueError(f"file_path:{file_path} is error")
files = {'upload_file': open(file_path,'rb')}
values = {'DB': 'photcat', 'OUT': 'csv', 'SHORT': 'short'}  
r = requests.post(url, files=files, data=values)

python读取xlrd

xlrd模块实现对excel文件内容读取,xlwt模块实现对excel文件的写入。

安装

1
2
pip install xlrd
pip install xlwt

xlrd模块使用

excel文档名称为联系人.xls,内容如下:

(1) 打开excel文件并获取所有sheet

1
2
3
4
5
6
7
import xlrd
 
# 打开Excel文件读取数据
data = xlrd.open_workbook('联系人.xls')
 
sheet_name = data.sheet_names()  # 获取所有sheet名称
print(sheet_name) # ['银行2', '银行3']

(2) 根据下标获取sheet名称

1
2
3
# 根据下标获取sheet名称
sheet2_name = data.sheet_names()[1]
print(sheet2_name)  # '银行3'

(3) 根据sheet索引或者名称获取sheet内容,同时获取sheet名称、行数、列数

1
2
3
4
5
6
7
8
9
10
11
12
13
# 根据sheet索引或者名称获取sheet内容,同时获取sheet名称、列数、行数
sheet2 = data.sheet_by_index(1)
print('sheet2名称:{}\nsheet2列数: {}\nsheet2行数: {}'.format(sheet2.name, sheet2.ncols, sheet2.nrows))
# sheet2名称:银行3
# sheet2列数: 7
# sheet2行数: 5
 
sheet1 = data.sheet_by_name('银行2')
print('sheet1名称:{}\nsheet1列数: {}\nsheet1行数: {}'.format(sheet1.name, sheet1.ncols, sheet1.nrows))
 
# sheet1名称:银行2
# sheet1列数: 8
# sheet1行数: 6

 (4) 根据sheet名称获取整行和整列的值

1
2
3
4
5
6
#  根据sheet名称获取整行和整列的值
sheet1 = data.sheet_by_name('银行2')
print(sheet1.row_values(3))  
# ['', '张2', '开发', 'IT编码', 999.0, 133111.0, 41463.0, 'zhang2@164.com'] 日期2013/7/7,实际却显示为浮点数41463.0
print(sheet1.col_values(3)) 
# ['', '工作职责', '', 'IT编码', '网络维修', '']

 (5)获取指定单元格的内容

1
2
3
4
# 获取指定单元格的内容
print(sheet1.cell(1,0).value)  # 第2 行1列内容:机构名称
print(sheet1.cell_value(1,0))  # 第2 行1列内容:机构名称
print(sheet1.row(1)[0].value)  # 第2 行1列内容:机构名称

(6)获取单元格内容的数据类型

1
2
3
4
5
# 获取单元格内容的数据类型
print(sheet1.cell(1,0).ctype)  # 第2 行1列内容 :机构名称为string类型
print(sheet1.cell(3,4).ctype)  # 第4行5列内容:999 为number类型
print(sheet1.cell(3,6).ctype)  # 第4 行7列内容:2013/7/8 为date类型
# 说明:ctype : 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error

(7)获取单元内容为日期类型的方式

使用xlrd的xldate_as_tuple处理为date格式

1
2
3
4
5
6
7
8
from datetime import datetime,date
 
if sheet1.cell(3,6).ctype == 3 :
    print(sheet1.cell(36).value)  # 41463.0
    date_value = xlrd.xldate_as_tuple(sheet1.cell(36).value, data.datemode)
    print(date_value)  # (2013, 7, 8, 0, 0, 0)
    print(date(*date_value[:3])) # 2013-07-08
    print(date(*date_value[:3]).strftime('%Y/%m/%d'))  # 2013/07/08

(8)获取单元内容为number的方式(转为整型)

1
2
3
4
if sheet1.cell(35).ctype == 2:
    print(sheet1.cell(35).value)  # 133111.0
    num_value = int(sheet1.cell(35).value)
    print(num_value)  # 133111

(9) 获取合并单元格的内容 

需要merged_cells属性
1
2
3
4
5
6
7
8
9
10
11
# 这里,需要在读取文件的时候添加个参数,将formatting_info参数设置为True,默认是False,否
# 则可能调用merged_cells属性获取到的是空值。<br>
data = xlrd.open_workbook('联系人.xls',formatting_info=True)
sheet1 = data.sheet_by_name('银行2')
print(sheet1.merged_cells)  # [(0, 1, 0, 8), (2, 6, 0, 1)]<br>
# merged_cells返回的这四个参数的含义是:(row,row_range,col,col_range),其中[row,row_range)包括row,
# 不包括row_range,col也是一样,下标从0开始。
#(0, 1, 0, 8) 表示1列-8列合并 (2, 6, 0, 1)表示3行-6行合并<br>
# 分别获取合并2个单元格的内容:
print(sheet1.cell(0,0).value)  # 银行2
print(sheet1.cell_value(20))  # 银行2
规律 : 获取merge_cells返回的row和col低位的索引即可!

使用以下方法更加方便

1
2
3
4
5
6
7
8
9
merge_value = []
for (row,row_range,col,col_range) in sheet1.merged_cells:
    merge_value.append((row,col))
 
print(merge_value)  # [(0, 0), (2, 0)]
for in merge_value:
    print(sheet1.cell(v[0], v[1]).value)
# 银行2
# 银行2

xlwt模块

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
import xlwt
from datetime import datetime,date
 
def set_style(name, height, bold=False, format_str=''):
    style = xlwt.XFStyle()  # 初始化样式
 
    font = xlwt.Font()  # 为样式创建字体
    font.name = name  # 'Times New Roman'
    font.bold = bold
    font.height = height
 
    borders= xlwt.Borders() # 为样式创建边框
    borders.left= 6
    borders.right= 6
    borders.top= 6
    borders.bottom= 6
 
    style.font = font
    style.borders = borders
    style.num_format_str= format_str
 
    return style
 
wb = xlwt.Workbook()
ws = wb.add_sheet('A Test Sheet'# 增加sheet
ws.col(0).width = 200*30 # 设置第一列列宽
 
ws.write(001234.56,set_style('Times New Roman',220,bold=True,format_str='#,##0.00'))
ws.write(10, datetime.now(), set_style('Times New Roman',220,bold=False, format_str='DD-MM-YYYY'))
styleOK = xlwt.easyxf('pattern: fore_colour light_blue;'
 
                          'font: colour green, bold True;')
 
pattern = xlwt.Pattern()#一个实例化的样式类
 
pattern.pattern = xlwt.Pattern.SOLID_PATTERN # 固定的样式
 
pattern.pattern_fore_colour = xlwt.Style.colour_map['red']#背景颜色
 
styleOK.pattern = pattern
ws.write(201,style=styleOK)
ws.write(211)
ws.write(22, xlwt.Formula("A3+B3"))
 
wb.save('example.xls')   # 保存xls

 

联系人表

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
import xlwt
from datetime import datetime, date
 
 
def set_style(name, height, bold=False, format_str='',align='center'):
    style = xlwt.XFStyle()  # 初始化样式
 
    font = xlwt.Font()  # 为样式创建字体
    font.name = name  # 'Times New Roman'
    font.bold = bold
    font.height = height
 
    borders = xlwt.Borders()  # 为样式创建边框
    borders.left = 2
    borders.right = 2
    borders.top = 0
    borders.bottom = 2
 
    alignment = xlwt.Alignment()  # 设置排列
    if align== 'center':
        alignment.horz = xlwt.Alignment.HORZ_CENTER
        alignment.vert = xlwt.Alignment.VERT_CENTER
    else:
        alignment.horz = xlwt.Alignment.HORZ_LEFT
        alignment.vert = xlwt.Alignment.VERT_BOTTOM
 
    style.font = font
    style.borders = borders
    style.num_format_str = format_str
    style.alignment = alignment
 
    return style
 
 
wb = xlwt.Workbook()
ws = wb.add_sheet('联系人',cell_overwrite_ok=True)  # 增加sheet
rows = ['机构名称''姓名''部门''电话''入职日期''手机''邮箱']
col1 = ['王1''王2''王3']
col2 = ['666''777','888']
col3 = ['2014-08-09','2014-08-11','2015-08-09']
# 写第一行数据
ws.write_merge(
    0,
    0,
    0,
    6,
    '联系人表',
    set_style(
        'Times New Roman',
        320,
        bold=True,
        format_str=''))  # 合并单元格
 
styleOK = xlwt.easyxf()
 
pattern = xlwt.Pattern()  # 一个实例化的样式类
pattern.pattern = xlwt.Pattern.SOLID_PATTERN  # 固定的样式
pattern.pattern_fore_colour = xlwt.Style.colour_map['yellow']  # 背景颜色
 
borders = xlwt.Borders()  # 为样式创建边框
borders.left = 2
borders.right = 2
borders.top = 6
borders.bottom = 2
 
font = xlwt.Font()  # 为样式创建字体
font.name = 'Times New Roman'
font.bold = True
font.height = 220
 
styleOK.pattern = pattern
styleOK.borders = borders
styleOK.font = font
 
# 写第二行数据
for index, val in enumerate(rows):
    ws.col(index).width = 150 * 30 # 定义列宽
    ws.write(1, index, val, style=styleOK)
 
# 写第3行-6行第一列数据
ws.write_merge(
    2,
    2 + len(col1)-1,
    0,
    0,
    'x机构',
    set_style(
        'Times New Roman',
        320,
        bold=True,
        format_str=''))  # 合并单元格
 
# 从第3行开始写1列数据
for index, val in enumerate(col1):
    ws.col(1).width = 150 * 30 # 定义列宽
    ws.write(index+21, val, style=set_style('Times New Roman',
        200,
        bold=False,
        format_str='',align=''))
 
# 从第3行开始写4列数据
for index, val in enumerate(col2):
    ws.col(3).width = 150 * 30 # 定义列宽
    ws.write(index+23, val, style=set_style('Times New Roman',
        200,
        bold=False,
        format_str='',align=''))
 
 
# 从第3行开始写5列数据
for index, val in enumerate(col3):
    ws.col(4).width = 150 * 30 # 定义列宽
    ws.write(index+24, val, style=set_style('Times New Roman',
        200,
        bold=False,
        format_str='',align=''))
 
ws.write(42,'技术部', style=styleOK)
ws.write(45,'186777233', style=styleOK)
ws.write(46,'wang@166.com', style=styleOK)
wb.save('test.xls')   # 保存xls

【Python】如何处理Excel中的数据

我们平时在做自动化测试的时候,可能会涉及到从表格中去读取或者存储数据,我们除了可以使用openpyxl来操作excel,当然也可以利用pandas来完成,这篇随笔只是我在学习过程中的简单记录,其他的功能还需要继续去探索。

一、pandas的安装:

  1.安装pandas其实是非常简单的,pandas依赖处理Excel的xlrd模块,所以我们需要提前安装这个,安装命令是:pip install xlrd

  2.开始安装pandas,安装命令是:pip install pandas

二、读取excel文件

webservice_testcase.xlsx结构如下:

1.首先我们应该先将这个模块导入

1
import  pandas  as pd

2.读取表单中的数据:

sheet=pd.read_excel('test_data\\webservice_testcase.xlsx')#这个会直接默认读取到这个Excel的第一个表单
data=sheet.head()#默认读取前5行数据
print("获取到所有的值:\n{0}".format(data))#格式化输出

    

3.也可以通过指定表单名来读取数据

sheet=pd.read_excel('test_data\\webservice_testcase.xlsx',sheet_name='userRegister')
data=sheet.head()#默认读取前5行数据
print("获取到所有的值:\n{0}".format(data))#格式化输出

4.通过表单索引来指定要访问的表单,0表示第一个表单,也可以采用表单名和索引的双重方式来定位表单,也可以同时定位多个表单,方式都罗列如下所示

sheet=pd.read_excel('test_data\\webservice_testcase.xlsx',sheet_name=['sendMCode','userRegister'])#可以通过表单名同时指定多个
# sheet=pd.read_excel('test_data\\webservice_testcase.xlsx',sheet_name=0)#可以通过表单索引来指定读取的表单
# sheet=pd.read_excel('test_data\\webservice_testcase.xlsx',sheet_name=['sendMCode',1])#可以混合的方式来指定
# sheet=pd.read_excel('test_data\\webservice_testcase.xlsx',sheet_name=[1,2])#可以通过索引 同时指定多个
data=sheet.values#获取所有的数据,注意这里不能用head()方法
print("获取到所有的值:\n{0}".format(data))#格式化输出

二、操作Excel中的行列

1.读取制定的某一行数据:

sheet=pd.read_excel('webservice_testcase.xlsx')#这个会直接默认读取到这个Excel的第一个表单
data=sheet.ix[0].values#0表示第一行 这里读取数据并不包含表头
print("读取指定行的数据:\n{0}".format(data))

得到了如下结果:

2.读取指定的多行:

sheet=pd.read_excel('test_data\\webservice_testcase.xlsx')#这个会直接默认读取到这个Excel的第一个表单
data=sheet.ix[[0,1]].values#0表示第一行 这里读取数据并不包含表头
print("读取指定行的数据:\n{0}".format(data))

得到了如下的结果:

3.读取指定行列的数据:

sheet=pd.read_excel('test_data\\webservice_testcase.xlsx')#这个会直接默认读取到这个Excel的第一个表单
data=sheet.ix[0,1]#读取第一行第二列的值
print("读取指定行的数据:\n{0}".format(data))

得到了如下结果:

4.读取指定的多行多列的值:

sheet=pd.read_excel('test_data\\webservice_testcase.xlsx')
data=sheet.ix[[1,2],['method','description']].values#读取第二行第三行的method以及description列的值,这里需要嵌套列表
print("读取指定行的数据:\n{0}".format(data))

得到了如下的结果:

5.读取所有行指定的列的值:

sheet=pd.read_excel('test_data\\webservice_testcase.xlsx')
data=sheet.ix[:,['method','description']].values#读取第二行第三行的method以及description列的值,这里需要嵌套列表
print("读取指定行的数据:\n{0}".format(data))

得到了如下的结果:

6.获取行号输出:

sheet=pd.read_excel('test_data\\webservice_testcase.xlsx')
print("输出行号列表",sheet.index.values)

得到了如下的结果:

7.获取列名输出:

sheet=pd.read_excel('test_data\\webservice_testcase.xlsx')
print("输出列标题",sheet.columns.values)

得到了如下的结果:

8.获取指定行数的值:

sheet=pd.read_excel('test_data\\webservice_testcase.xlsx')
print("输出值",sheet.sample(2).values)

9.获取指定列的值

sheet=pd.read_excel('test_data\\webservice_testcase.xlsx')
print("输出值",sheet['description'].values)

得到了如下的结果:

三、将excel中的每一条数据处理成字典,然后让如一个列表中

test_data=[]
sheet = pd.read_excel(self.file_name, sheet_name=key)
for i in sheet.index.values:#获取行号的索引,并对其进行遍历:#根据i来获取每一行指定的数据 并利用to_dict转成字典
  row_data=sheet.ix[i,['id','method','description','url','param','ExpectedResult']].to_dict()
  test_data.append(row_data)

另外,我们可以把测试用例相关的东西写入一个配置文件当中,读取的时候可以根据配置文件中的内容来进行读取:

配置文件如下:

1
2
3
4
5
6
[CASECONFIG]
sheet_list={'sendMCode':'all',
             'userRegister':'all',
             'verifyUserAuth':'all',
             'bindBankCard':[]
             } 

配置文件处理.py代码如下:

import configparser
class ReadConfig:
def read_config(self,file_path,section,option):
cf=configparser.ConfigParser()
cf.read(file_path,encoding="utf-8")
value=cf.get(section,option)
return value

project_path.py代码如下:

import os
Project_path=os.path.split(os.path.split(os.path.realpath(__file__))[0])[0]
#配置文件路径
case_config_path=os.path.join(Project_path,'config','case.config')
#测试用例的路径
test_cases_path=os.path.join(Project_path,'test_data','webservice_testcase.xlsx')

然后我们把读取excel中的内容封装成一个类,代码示例如下:

from common import project_pathfrom common.read_config import ReadConfig as RC
import pandas as pd class DoExcel:
def __init__(self,file_name):
self.file_name=file_name
self.sheet_list=eval(RC().read_config(project_path.case_config_path,'CASECONFIG','sheet_list'))
def do_excel(self):
test_data=[]
for key in self.sheet_list:
if self.sheet_list[key] == 'all': # 读取所有的用例
sheet = pd.read_excel(self.file_name, sheet_name=key)
for i in sheet.index.values:#获取行号的索引,并对其进行遍历:
#根据i来获取每一行指定的数据 并利用to_dict转成字典
row_data=sheet.ix[i,['id','method','description','url','param','ExpectedResult']].to_dict()
test_data.append(row_data)
       else:
sheet = pd.read_excel(self.file_name, sheet_name=key)
for i in self.sheet_list[key]:#根据list中的标号去读取excel指定的用例
row_data=sheet.ix[i-1,['id','method','description','url','param','ExpectedResult']].to_dict()
test_data.append(row_data)
return test_data
if __name__ == '__main__':
test_data=DoExcel(project_path.test_cases_path).do_excel()
print(test_data)

如果将配置改成如下内容:

[CASECONFIG]
sheet_list={'sendMCode':[1,3,5],
'userRegister':[],
'verifyUserAuth':[],
'bindBankCard':[]
} 

我们将会得到如下的运行结果:

[{'id': 1, 'method': 'sendMCode', 'description': '正常流程', 'url': 'http://120.24.235.105:9010/sms-service-war-1.0/ws/smsFacade.ws?wsdl', 'param': '{"client_ip":"172.16.168.202","tmpl_id":1,"mobile":"${tel}"}', 'ExpectedResult': '(result){\n   retCode = "0"\n   retInfo = "ok"\n }'}, 
{'id': 3, 'method': 'sendMCode', 'description': '手机号为空', 'url': 'http://120.24.235.105:9010/sms-service-war-1.0/ws/smsFacade.ws?wsdl', 'param': '{"client_ip":"172.16.168.202","tmpl_id":1,"mobile":""}', 'ExpectedResult': "Server raised fault: '手机号码错误'"},
{'id': 5, 'method': 'sendMCode', 'description': 'ip地址为空', 'url': 'http://120.24.235.105:9010/sms-service-war-1.0/ws/smsFacade.ws?wsdl', 'param': '{"client_ip":"","tmpl_id":1,"mobile":"${tel}"}', 'ExpectedResult': "Server raised fault: '用户IP不能为空'"}] 

到此,将excel中的用例数据读取成为[{key1:value1},{key2:value2},...,{keyn:valuen}]这样的形式已经完毕,但是还有很多东西需要完善,比如用例中完成参数的替换,测试完成后回写测试数据到excel对应的表格中等等内容。

python 从word/docx中提取链接(hyperlink)和文本

 

python 从word/docx中提取链接(hyperlink)和文本

import zipfile
import re
import json
import base64
from docx import Document
from os.path import basename
from docx.opc.constants import RELATIONSHIP_TYPE as RT
from bs4 import BeautifulSoup def get_linked_text(soup):     links = []     # This kind of link has a corresponding URL in the _rel file.
    for tag in soup.find_all("hyperlink"):
        # try/except because some hyperlinks have no id.
        try:
            links.append({"id": tag["r:id"], "text": tag.text})
        except:
            pass     # This kind does not.
    for tag in soup.find_all("instrText"):
        # They're identified by the word HYPERLINK
        if "HYPERLINK" in tag.text:
            # Get the URL. Probably.
            url = tag.text.split('"')[1]             # The actual linked text is stored nearby tags.
            # Loop through the siblings starting here.
            temp = tag.parent.next_sibling
            text = ""             while temp is not None:
                # Text comes in <t> tags.
                maybe_text = temp.find("t")
                if maybe_text is not None:
                    # Ones that have text in them.
                    if maybe_text.text.strip() != "":
                        text += maybe_text.text.strip()                 # Links end with <w:fldChar w:fldCharType="end" />.
                maybe_end = temp.find("fldChar[w:fldCharType]")
                if maybe_end is not None:
                    if maybe_end["w:fldCharType"] == "end":
                        break                 temp = temp.next_sibling             links.append({"id": None, "href": url, "text": text})     return links if __name__ == '__main__':
    file_name="xx.docx"
    archive = zipfile.ZipFile(file_name, "r")
    file_data = archive.read("word/document.xml")
    doc_soup = BeautifulSoup(file_data, "xml")
    linked_text = get_linked_text(doc_soup)
    print(linked_text)

word读取图片,并将图片转换成链接

word读取图片,并将图片转换成链接

from docx import Document
from os.path import basename
import re def upload_image(image_data):
    image_url = "图片链接"
    return image_url file_name = "/Users/在文档顶部.docx"
doc = Document(file_name)
a = list()
pattern = re.compile('rId\d+')
for graph in doc.paragraphs:
    b = list()
    for run in graph.runs:
        if run.text != '':
            b.append(run.text)
        else:
            # b.append(pattern.search(run.element.xml))
            content_id = pattern.search(run.element.xml).group(0)
            try:
                content_type = doc.part.related_parts[content_id].content_type
            except KeyError as e:
                print(e)
                continue
            if not content_type.startswith('image'):
                continue
            img_name = basename(doc.part.related_parts[content_id].partname)
            img_data = doc.part.related_parts[content_id].blob
            b.append(upload_image(img_data))
    b_str=f"{''.join(b)}"
    a.append(b_str)
print(a)

python re模块去掉括号及其里面的内容

括号为全角括号

文本:寄令狐绹(一本无绹字)相公

import re
text = "寄令狐绹(一本无绹字)相公"
text = re.sub("\\(.*?)|\\{.*?}|\\[.*?]|\\【.*?】", "",text) print(text)
>>> 寄令狐绹相公

括号为半角括号

import re
text = "寄令狐绹(一本无绹字)相公"
text = re.sub("\\(.*?\\)|\\{.*?}|\\[.*?]", "",text) print(text)
>>> 寄令狐绹相公

python实现excel数据处理的更多相关文章

  1. 【Python】Excel数据处理

    1.环境准备 > python2.7 > xlrd,xlwt模块下载与安装,前者用来读取excel文件,后者用来写入excel文件 2.实战案例 案例场景: > excel1中包含某 ...

  2. [转]用Python读写Excel文件

    [转]用Python读写Excel文件   转自:http://www.gocalf.com/blog/python-read-write-excel.html#xlrd-xlwt 虽然天天跟数据打交 ...

  3. 转:Python 与 Excel 不得不说的事

    数据处理是 Python 的一大应用场景,而 Excel 则是最流行的数据处理软件.因此用 Python 进行数据相关的工作时,难免要和 Excel 打交道. 如果仅仅是要以表单形式保存数据,可以借助 ...

  4. Python 操作 Excel,总有一个模块适合自己

    最近在写性能相关的测试脚本,脚本已经完成,最终怎么体现在报告上,要想让报告看起来漂亮些,我们是先创建一个模板(格式和公式已全部制作好),只需要性能测试完成后往对应的sheet页中填充数据,数据完成后最 ...

  5. 使用python将excel数据导入数据库

    使用python将excel数据导入数据库 因为需要对数据处理,将excel数据导入到数据库,记录一下过程. 使用到的库:xlrd 和 pymysql (如果需要写到excel可以使用xlwt) 直接 ...

  6. Python对Excel的操作

    Python几个读取Excel库的介绍: xlwings 可结合 VBA 实现对 Excel 编程,强大的数据输入分析能力,同时拥有丰富的接口,结合 pandas/numpy/matplotlib 轻 ...

  7. Python读写Excel表格

    最近在做一些数据处理和计算的工作,因为数据是以.CSV格式保存的,因此刚开始直接用Excel来处理. 但是做着做着发现重复的劳动,其实并没有多大的意义,于是就想着写个小工具帮着处理. 以前正好在一本书 ...

  8. 【Python自动化Excel】pandas处理Excel数据的基本流程

    这里所说的pandas并不是大熊猫,而是Python的第三方库.这个库能干嘛呢?它在Python数据分析领域可是无人不知.无人不晓的.可以说是Python世界中的Excel. pandas库处理数据相 ...

  9. 【Python自动化Excel】pandas处理Excel的“分分合合”

    话说Excel数据表,分久必合.合久必分.Excel数据表的"分"与"合"是日常办公中常见的操作.手动操作并不困难,但数据量大了之后,重复性操作往往会令人崩溃. ...

  10. 【Python自动化Excel】pandas操作Excel的“分分合合”

    话说Excel数据表,分久必合.合久必分.Excel数据表的"分"与"合"是日常办公中常见的操作.手动操作并不困难,但数据量大了之后,重复性操作往往会令人崩溃. ...

随机推荐

  1. optical simulation of quantum logic

    量子逻辑的光学模拟(PRA, 1998)  主机中<1998Cerf.pdf> 核心: 1. 用一个光子的多条路径的叠加态来表示n qubits, 那么实验上干涉仪所包含的路径数为 2^n ...

  2. Centos模板机配置

    icentos7标准化配置 挂载光盘 mkdir /media/cdrom mount /dev/sr0 /media/cdrom vi /etc/yum.repo.d/ 配置本地yum源 vim l ...

  3. C++之OpenCV入门到提高005:005 图像操作

    一.介绍 今天是这个系列<C++之 Opencv 入门到提高>得第五篇文章.这篇文章也不难,介绍如何图像的基本操作,比如:读取一张图片的像素值,如何修改一张图片中的像素值,如何读取一张图片 ...

  4. Visual Studio 快速分析 .NET Dump 文件

    前言 在开发和维护 .NET 应用程序的过程中,有时会遇到难以捉摸的性能瓶颈或内存泄漏等问题.这些问题往往发生在生产环境中,难以复现.为了更准确地诊断这些运行时问题,通常会收集应用程序在生产环境中的内 ...

  5. begin-预览,不行啊还是太弱了

    方便管理,主要是想熟悉下git的操作 先创建并且切换到一个新的分支: git commit --allow-empty -am "before starting PA1" git ...

  6. 探究内存泄露—Part1—编写泄露代码

    本文由 ImportNew - 黄索远 翻译自 captaindebug.如需转载本文,请先参见文章末尾处的转载要求. ImportNew注:如果你也对Java技术翻译分享感兴趣,欢迎加入我们的 Ja ...

  7. Spring AOP进行日志记录,管理 (使用Spring的拦截器功能获取对action中每个方法的调用情况,在方法调用前和调用后记录相关日志。)

    在java开发中日志的管理有很多种.我一般会使用过滤器,或者是Spring的拦截器进行日志的处理.如果是用过滤器比较简单,只要对所有的.do提交进行拦截,然后获取action的提交路径就可以获取对每个 ...

  8. PHP5.2-5.6不同版本新特性

    温故而知新, 时常复习下之前的东西 还是会有一些收获 本文目录:PHP5.2 以前:autoload, PDO 和 MySQLi, 类型约束PHP5.2:JSON 支持PHP5.3:弃用的功能,匿名函 ...

  9. 2022-2023 ACM-ICPC Nordic Collegiate Programming Contest (NCPC 2022)

    F. Foreign Football 一共有\(n\)支队伍,每支队伍的名称为\(s_i\),给定一个\(n \times n\)的矩阵,\(a_{i,j}\)代表第\(i\)支队伍和第\(j\)支 ...

  10. 基于 C# 编写的 Visual Studio 文件编码显示与修改扩展插件

    前言 在软件开发过程中,尤其是在处理跨平台或来自不同来源的项目时,文件的编码格式往往会成为一个不可忽视的问题.不同的操作系统.编程语言和编辑器可能对文件编码有不同的支持和默认设置,这可能导致在打开一个 ...