借助openpyxl处理excel

一次处理excel中，原计划是借助excel中自带的工具进行处理，然而看到需要处理的列要达到30+，后来放弃了，用Python处理或许是一个不错的选择。

需求：

表格中每一列数据都是一个随机值，但是已知该列对应的标准区间，eg:20<x<40是正常区间，超出这一区间就是非正常区间，需要将落在正常区间的数据标记为0，落在非正常区间的数据标记为1。另外还有一种情况，eg:x<50是正常区间，超过50就是非法区间。

我的数据字典放在了sheet2中，首先去读取sheet2中的标准：

def readSheet2(ExcelFullName):

    wb = load_workbook(ExcelFullName)

    sheets = wb.sheetnames

    print (sheets)

    mysheet = sheets[1]

    #获取sheet2的信息

    ws = wb[mysheet]

    for i in range(2,29):

        mydata[ws.cell(row=i, column=1).value] = ws.cell(row=i, column=3).value

    print (mydata)

读出的标准放在了字典中：

{'AST': '15-40', 'ALT': '9-50', 'GGT': '10-60', 'ALP': '45-125', 'ALB': '40-55', 'TB': '3.5-23.5', 'DB': '0.5-6.5', 'IB': '1.0-17', 'XT': '3.9-6.3', 'GYSZ': '0.4-1.8', 'DGC': '3.6-6.2', 'GMDZDB': '0.8-1.5', 'DMDZDB': '0.5-3.36', 'PT': '11.0-14.0', 'NXMYHDD': '70-50', 'WBC': '3.5-9.5', 'RBC': '4.3-5.8', 'HB': '130-175', 'PLT': '125-350', 'BDL': '0-20', 'HBsAg': '<1.0', 'HBsAb': '<10.0', 'HBeAg': '<1.0', 'HBeAb': '>1.0', 'HBcAb': '>1.0', 'AFP': '0-20', 'PIVK': '0-40'}

使用上面读出的标准对sheet1的数据进行处理。

# 按照sheet2的信息逐列处理sheet1

def readSheet1(ExcelFullName):

    wb = load_workbook(ExcelFullName)

    sheets = wb.sheetnames

    mysheet = sheets[0]

    # 获取sheet1的信息

    ws = wb[mysheet]

    for i in range(27, 56):

        if ws.cell(row=1, column=i).value in mydata:

            #print(i)

            print(ws.cell(row=1, column=i).value)

            str = mydata[ws.cell(row=1, column=i).value]

            if str[0]!='<' and str[0]!='>':

                str = mydata[ws.cell(row=1, column=i).value]

                str1 = str.split('-')

                a = float(str1[0])

                b = float(str1[1])

                #c = a + b

                #print(c)

                for j in range(2,218):

                    if ws.cell(row=j, column=i).value != None:

                        if float(ws.cell(row=j, column=i).value) >=a and float(ws.cell(row=j, column=i).value) <=b:

                            ws.cell(row=j, column=i).value = 0

                        else:

                            ws.cell(row=j, column=i).value = 1

            else:

                op = str[0]

                opnum = float(str[1:])

                #print(opnum)

                if op == '<':

                    for j in range(2, 218):

                        if ws.cell(row=j, column=i).value != None:

                            if float(ws.cell(row=j, column=i).value) < opnum:

                                ws.cell(row=j, column=i).value = 0

                            else:

                                ws.cell(row=j, column=i).value = 1

                else:

                    for j in range(2, 218):

                        if ws.cell(row=j, column=i).value != None:

                            if float(ws.cell(row=j, column=i).value) > opnum:

                                ws.cell(row=j, column=i).value = 0

                            else:

                                ws.cell(row=j, column=i).value = 1

    wb.save('balances.xlsx')

上述是两种处理方式，最后将数据保存在balances.xlsx文件中。

主函数如下：

if __name__ == '__main__':

    # 需进行两次读excel与一次写excel

    excelPath = "C:/Users/Halo/Desktop/ml/"

    excelName = "info.xlsx"

    ExcelFullName= os.path.join(excelPath,excelName)

    # 存储sheet2中的信息，用于后续比较

    # mydata = {'AST': '15-40', 'ALT': '9-50', 'GGT': '10-60', 'ALP': '45-125', 'ALB': '40-55', 'TB': '3.5-23.5', 'DB': '0.5-6.5', 'IB': '1.0-17', 'XT': '3.9-6.3', 'GYSZ': '0.4-1.8', 'DGC': '3.6-6.2', 'GMDZDB': '0.8-1.5', 'DMDZDB': '0.5-3.36', 'PT': '11.0-14.0', 'NXMYHDD': '70-50', 'WBC': '3.5-9.5', 'RBC': '4.3-5.8', 'HB': '130-175', 'PLT': '125-350', 'BDL': '0-20', 'HBsAg': '<1.0', 'HBsAb': '<10.0', 'HBeAg': '<1.0', 'HBeAb': '>1.0', 'HBcAb': '>1.0', 'AFP': '0-20', 'PIVK': '0-40'}

    # 1.读取sheet2中需要处理的参数

    readSheet2(ExcelFullName)

    # 2.读取根据Sheet2中内容找到Sheet1中对应的列中的内容并进行处理

    readSheet1(ExcelFullName)

后续再进行补充。

借助openpyxl处理excel的更多相关文章

python openpyxl 操作 excel
初识与安装 Openpyxl is a Python library for reading and writing Excel 2010 xlsx/xlsm/xltx/xltm files. 安装 ...
Python使用openpyxl读写excel文件
Python使用openpyxl读写excel文件这是一个第三方库,可以处理xlsx格式的Excel文件.pip install openpyxl安装.如果使用Aanconda,应该自带了. 读取E ...
python用openpyxl操作excel
python操作excel方法 1)自身有Win32 COM操作office但讲不清楚,可能不支持夸平台,linux是否能用不清楚,其他有专业处理模块,如下 2)xlrd:(读excel)表,xlrd ...
python使用 openpyxl包 excel读取与写入
'''### 写入操作 ###from openpyxl import Workbook#实例化对象wb=Workbook()#创建表ws1=wb.create_sheet('work',0) #默认 ...
用python从符合一定格式的txt文档中逐行读取数据并按一定规则写入excel（openpyxl支持Excel 2007 .xlsx格式）
前几天接到一个任务,从gerrit上通过ssh命令获取一些commit相关的数据到文本文档中,随后将这些数据存入Excel中.数据格式如下图所示观察上图可知,存在文本文档中的数据符合一定的格式,通过 ...
【转发】Python使用openpyxl读写excel文件
Python使用openpyxl读写excel文件这是一个第三方库,可以处理xlsx格式的Excel文件.pip install openpyxl安装.如果使用Aanconda,应该自带了. 读取E ...
Python3使用openpyxl读写Excel文件
Python中常用的操作Excel的三方包有xlrd,xlwt和openpyxl等,xlrd支持读取.xls和.xlsx格式的Excel文件,只支持读取,不支持写入.xlwt只支持写入.xls格式的文 ...
Python 使用openpyxl导出Excel表格的时候，使用save()保存到指定路径
在使用openpyxl导出Excel表格的使用,如何指定导出的路径呢. 使用sava(filename),会保存到当前执行文件的路径下. 使用sava("/tmp/{}.xlsx" ...
使用openpyxl创建excel，设置不显示网格线
最近在学openpyxl,想设置excel不显示网格线,试了好多种方法都不行,最后发现可以通过修改views文件来实现. 文件路径:虚拟目录\Lib\site-packages\openpyxl\wo ...

随机推荐

[RoarCTF]Easy Java
目录 [RoarCTF]Easy Java 知识点 1.WEB-INF/web.xml泄露 [RoarCTF]Easy Java 题目复现链接:https://buuoj.cn/challenges ...
Unity3D小知识
下载离线Unity3D官方文档 Unity同时打开多个场景(Multi-Scene editing) Unity将资源导出成package实现资源重用 Animator不一定只能用来做动画,也可以当状 ...
Unity3D Substance designer Sub 欧洲小镇场景制作视频教程中文字幕
大小6.53G,中文字幕扫码时备注或说明中留下邮箱付款后如未回复请至https://shop135452397.taobao.com/ 联系店主
安装TensorFlow后import tensorflow时，出现CXXABI_1.3.11和GLIBCXX_3.4.22 not found
Ubuntu16.04使用Anaconda搭建TensorFlow使用环境但是在安装TensorFlow后,import tensorflow报出如下错误: 该问题的错误原因是由于gcc的动态库较老导 ...
顶部导航TabBar、TabBarView、DefaultTabController
原文地址:https://www.cnblogs.com/upwgh/p/11369537.html TabBar:Tab页的选项组件,默认为水平排列. TabBarView:Tab页的内容容器,Ta ...
腾讯云短信 nodejs 接入, 通过验证码修改手机示例
腾讯云短信 nodejs 接入, 通过验证码修改手机示例参考:腾讯云短信文档国内短信快速入门qcloudsms Node.js SDK文档中心>短信>错误码 nodejs sdk 使用示 ...
node 报错 env: node\r: No such file or directory
最近在编写一个命令行工具.使用 npm link 时可以正常运行.但是 ctrl+s 保存后, 再运行则报错 env: node\r: No such file or directory ,需要再 n ...
python初级(302) 2 easygui简单使用
一.复习之前的两个练习,巩固计数循环和条件循环 1.系统生成一个随机数1到5,然后让用户的猜测,若猜对了,提示恭喜你,猜对了,否则提示,对不起,你猜错了(提示,1到5的随机数为:secret = ra ...
人工智能新编程语言-Gen
MIT 的一个研究小组正努力让初学者更容易入门人工智能,同时也帮助专家进一步推进这个领域的发展. 在 PLDI 大会(Programming Language Design and Implement ...
jsConfig那些事儿
jsConfig 是为了解决 vscode 的警告. { "compilerOptions": { "experimentalDecorators": true ...

借助openpyxl处理excel

借助openpyxl处理excel的更多相关文章

随机推荐

热门专题