把药品名称导入到sheet1的A字段

# -*- coding: utf-8 -*-
"""
Created on Fri Dec  9 09:38:58 2016
判断一个名称归类为药品,药材,辅料,药包材

缺乏经典中药方剂,蒙药,等少数民族药品,这些被归入药材,需要改善

@author: Administrator
"""
import xlrd,re,pandas

excelFilename="test.xlsx"

#药品的关键词
rex_drug=re.compile(r'丸|颗粒|搽|片|胶囊|注射|诊断试剂|剂|凝胶|贴|软膏|膏|眼膏|粉针|溶液|吸入|滴眼|乳剂|口服液|液|盐酸|清凉油|糖浆|药品|复方|转移因子|汤|味散|安神|安神散')
#药包材的关键字
rex_yaobaocai=re.compile(r'复合膜|低硼硅|药品包装|药品包装用复合膜|双向拉伸|聚酯瓶|聚乙烯瓶|玻璃安瓿|低硼硅|剂瓶|滴眼剂瓶|药用硬片|高密度聚乙烯瓶')

rex_others=re.compile(r'富氧空气')

#获取一个excel内首页表格
def Get_sheet1_from_oneExcel(excelFileName):
    wb=xlrd.open_workbook(excelFileName)
    sheet=wb.sheets()[0]
    return sheet

#获取excel的首页信息,去除首行
def Get_sheet1_Data_NoFirstLine(excelFileName):
    sheet=Get_sheet1_from_oneExcel(excelFileName)
    #获取表格行数和列数
    highest_row=sheet.nrows
       
    sheet_data=[]
    for rowNum in range(1,highest_row):
        #获取行数据
        rowData=sheet.row_values(rowNum)
        sheet_data.append(rowData[0])
     
    return sheet_data

#判断是药品,药材,辅料,药包材
def Drug_type(drug):
    #不是字符串就转换为字符串
    if type(drug)!=str:
        drug=str(drug)
    #正则表达式快速匹配    
    if rex_others.search(drug)!=None:
        return "其它"     
    
    #药品分类
    elif rex_drug.search(drug)!=None:
        #print("in rexq")
        #print(rex1.search(i))
        return "药品"
       
     #药包材分类    
    elif rex_yaobaocai.search(drug)!=None:
        return "药包材"
        
        
    #字典精确匹配 ,注册数据库与中药材数据库有重复,优先遍历中药材   
    elif drug in list_fuliao:
        #print("在药品辅料数据库内")
        return "辅料"
    
       
    elif drug in list_yaobaocai:
        #print("在药包材数据库内")
        return "药包材"    

    #中药材筛选,因为注册数据库中有药品也有药材
    elif drug in list_zhongyaocai:
        #print("在药包材数据库内")
        return "药材"
        
    
    elif drug in list_yaopin:
        #print("在药品注册数据库内")
        return "药品"
      #药材分类    
    else:
        return "药材"
    #else:
       #return "不确定"
    
    
#获取药品信息   
list_yaopin=Get_sheet1_Data_NoFirstLine("药品.xlsx")
#获取辅料信息   
list_fuliao=Get_sheet1_Data_NoFirstLine("辅料.xlsx")
#获取药包材信息   
list_yaobaocai=Get_sheet1_Data_NoFirstLine("药包材.xlsx")
#获取中药材信息   
list_zhongyaocai=Get_sheet1_Data_NoFirstLine("中药材.xlsx")

#处理表格
list_drugs=Get_sheet1_Data_NoFirstLine(excelFilename)  
#药品药材分类
list_drugType=[Drug_type(i) for i in list_drugs]
#写入excel
data=pandas.DataFrame({'me_name':list_drugs,'me_type':list_drugType})
data.to_excel("药品与种类.xlsx")

需要文件:

excel批处理_判断一个名称是不是药品的更多相关文章

  1. C#判断一个类中有无"指定名称"的方法

    C#中可以通过反射分析元数据来解决这个问题,示例代码如下: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 2 ...

  2. Win7全自动精简批处理_温柔处理极速修正版/暴力剩女工程测试版

    2011htpcfans 发表于 2012-5-11 http://bbs.wuyou.net/forum.php?mod=viewthread&tid=210269&highligh ...

  3. DOS批处理命令判断操作系统版本、执行各版本对应语句

    DOS批处理命令判断操作系统版本.执行各版本对应语句   昨天在家里试用  netsh interface ip set address 这些命令更改上网IP.DNS.网关等,今天将那些代码拿来办公室 ...

  4. PHPExcel 是用来操作Office Excel 文档的一个PHP类库

    PHPExcel 是用来操作Office Excel 文档的一个PHP类库,它基于微软的OpenXML标准和PHP语言.可以使用它来读取.写入不同格式的电子表格,如 Excel (BIFF) .xls ...

  5. C#实现如何判断一个数组中是否有重复的元素

    如何判断一个数组中是否有重复的元素 实现判断数组中是否包含有重复的元素方法 这里用C#代码给出实例 方法一:可以新建一个hashtable利用hashtable的Contains方法进行查找 /// ...

  6. C#实现如何判断一个数组中是否有重复的元素 返回一个数组升序排列后的位置信息--C#程序举例 求生欲很强的数据库 别跟我谈EF抵抗并发,敢问你到底会不会用EntityFramework

    C#实现如何判断一个数组中是否有重复的元素   如何判断一个数组中是否有重复的元素 实现判断数组中是否包含有重复的元素方法 这里用C#代码给出实例 方法一:可以新建一个hashtable利用hasht ...

  7. 【已解决】每次打开Excel时会同时打开一个空的Excel表格

    每次打开Excel时会同时打开一个空的Excel表格,情况如图. 官方解法如下,本人验证有效: 方法1, 请到以后路径中检查是否存在与空白文件夹同名字的Excel文件,删除它. C:\Users\\A ...

  8. Java判断一个字符串是否有中文

    Java判断一个字符串是否有中文一般情况是利用Unicode编码(CJK统一汉字的编码区间:0x4e00–0x9fbb)的正则来做判断,但是其实这个区间来判断中文不是非常精确,因为有些中文的标点符号比 ...

  9. HDU 1756 Cupid's Arrow 计算几何 判断一个点是否在多边形内

    LINK:Cupid's Arrow 前置函数 atan2 返回一个向量的幅角.范围为[Pi,-Pi) 值得注意的是 返回的是 相对于x轴正半轴的辐角. 而判断一个点是否在一个多边形内 通常有三种方法 ...

随机推荐

  1. Android窗口机制分析与UI管理系统

    类图关系 在看Android的窗口机制之前,先看看其主要的类图关系以及层级之间的依赖与调用关系 1.window在当前的android系统的中的呈现形式是PhoneWindow (frameworks ...

  2. iOS提交AppStore后申请加急审核

    提交审核后进去下面链接申请加急审核链接:https://developer.apple.com/appstore/contact/appreviewteam/index.html 在I would l ...

  3. redis参考文档

    本文为之前整理的关于redis的文档,放到博客上一份,也方便我以后查阅. redis简介 Redis是一个开源的.高性能的.基于键值对的缓存与存储系统, 通过提供多种键值数据类型来适应不同场景下的缓存 ...

  4. "Becoming Functional" 阅读笔记+思维导图

    <Becoming Functional>是O'Reilly公司今年(2014)7月发布的一本薄薄的小册子,151页,介绍了函数式编程的基本概念.全书使用代码范例都是基于JVM的编程语言, ...

  5. (三)Spark-Hadoop集群搭建-Java&Python版Spark

    Spark-Hadoop集群搭建 视频教程: 1.优酷 2.YouTube 配置java 启动ftp [root@master ~]# /etc/init.d/vsftpd restart 关闭 vs ...

  6. T-SQL 查询XML

    我们经常在SQL Server列中存一些XML来作为配置文件或者是保存特殊信息,那么如何将其展开并查询它或将其呈现为关系数据? 其实在T-SQL 下可以很容易的实现. 示例xml <catalo ...

  7. redis数据结构存储Dict设计细节(redis的设计与实现笔记)

    说到redis的Dict(字典),虽说算法上跟市面上一般的Dict实现没有什么区别,但是redis的Dict有2个特殊的地方那就是它的rehash(重新散列)和它的字典节点单向链表. 以下是dict用 ...

  8. java中可定制的序列化过程 writeObject与readObject

    来源于:[http://bluepopopo.iteye.com/blog/486548] 什么是writeObject 和readObject?可定制的序列化过程 这篇文章很直接,简单易懂.尝试着翻 ...

  9. Azure上的几个坑

    此文用于记录在使用Azure中国版时遇到的一些“坑”. 1.虚拟机备份/还原 在某些场景中,使用备份/还原功能来创建(克隆)虚拟机比使用capture的image要方便很多.虚拟机备份后,执行还原操作 ...

  10. curl -w,–write-out参数详解

    顾名思义,write-out的作用就是输出点什么.curl的-w参数用于在一次完整且成功的操作后输出指定格式的内容到标准输出. 输出格式由普通字符串和任意数量的变量组成,输出变量需要按照%{varia ...