Python正则匹配字母大小写不敏感在读xml中的应用

需要解决的问题：要匹配字符串，字符串中字母的大小写不确定，如何匹配？

问题出现之前是使用字符串比较的方式，比如要匹配'abc'，则用语句：

 if s == 'abc':#s为需要匹配的字符串

     print '匹配成功\n'

现在的问题是s可能是Abc、ABC等等，所以需要大小写不敏感的匹配，如果把需要匹配的模式的大小写进行罗列，那即使是三个字母的短模式也是很麻烦，查了一下，正则表达式re模块中有个参数flags=re.I，这样就可以大小写不敏感的匹配了，示例如下：

 import re

 s = 'Abc'

 p = 'abc'

 p = re.compile(p,re.I)

 print re.search(p,s).group()

匹配成功，输出结果：'Abc'

Re模块中compile函数的使用：

预编译在python正则匹配中不是必须的，但是最好预编译一下，提升效率（多次使用，及时存缓存，也节省了查缓存等时间）。Re模块中的flag参数值可选范围如下表：

（可查文档re模块）

标志	含义
DOTALL, S	使 . 匹配包括换行在内的所有字符
IGNORECASE, I	使匹配对大小写不敏感
LOCALE, L	做本地化识别（locale-aware）匹配
MULTILINE, M	多行匹配，影响 ^ 和 $
VERBOSE, X	能够使用 REs 的 verbose 状态，使之被组织得更清晰易懂

这个表中Flags参数的值对search函数直接用也是可以的，如re.searchi(pattern,string,flags)

下一个问题，如何匹配大小写不确定的xml元素中的属性名呢：

既然可以不敏感的匹配字母的大小写，那么如果要匹配xml元素节点，要获取该节点的值怎么做呢？

思路是这样的:要获取属性值，则要得到属性名，但是怎么准确知道属性名哪个字母大写哪个字母小写呢，这是个问题

方法是利用元素tag找到所在元素，然后取出元素的所有属性名，挨个匹配，找出所需的就停止，这样匹配元素属性名成功后，re.search(p,s,f).group()就是该属性当前的名了

需要解析的xml文件(abc.xml)如下：

 <root>

     <element  name = 'who'  /element1>

     <element  Name = 'am'  /element1>

     <element  NAME = 'I'  /element1>

 </root>

解析的代码如下：

 import re

 import xml.etree.Element as etree

 file = 'abc.xml'

 p = 'name'

 pattern = re.compile(p,re.I)

 tree = etree.parse(file)

 root = tree.getroot()

 result = []

 result = tree.findall('.//element')

 for i in result:

     for j in i.attrib.keys():

         try:

             r = re.search(pattern,j).group()

             #输出匹配的name属性名和对应的属性值

             print 'attrib is %s,and the value is %s\n'%r%i.attrib[r]

             break

         except AttributeError,e:

             pass

输出的结果如下：

 attrib is name,and the value is who

 attrib is Name,and the value is am

 attrib is NAME,and the value is I

最后记录下：Str.Strip()参数为空可以去掉字符串首尾的特殊字符，很好用~

Python正则匹配字母大小写不敏感在读xml中的应用的更多相关文章

用python处理时间、utf8文本、正则匹配、序列化、目录路径搜索、xml解析
python 处理时间 import time import re now = time.strftime("%Y-%m-%d %H:%M:%S", time.gmtime()) ...
python 正则匹配中文(unicode)(转)
由于需求原因,需要匹配提取中文,大量google下,并没有我需要的.花了一个小时大概测试,此utf8中文通过,特留文. 参考: http://hi.baidu.com/nivrrex/blo ...
python正则匹配——中文字符的匹配
# -*- coding:utf-8 -*- import re '''python 3.5版本正则匹配中文,固定形式:\u4E00-\u9FA5 ''' words = 'study in 山海大 ...
python 正则匹配
正则表达式模式模式字符串使用特殊的语法来表示一个正则表达式: 字母和数字表示他们自身.一个正则表达式模式中的字母和数字匹配同样的字符串. 多数字母和数字前加一个反斜杠时会拥有不同的含义. 标点符号只 ...
python 正则之字母匹配
\A:匹配字符串的开始 \b:匹配一个单词边界取出a边界单词的个数 >>> len(re.findall(r"\ba"," ab abc ad ...
Python正则匹配多行，多个数据
最近用Python做一个crawler工具的时候,发现用一个正则表达式可以匹配到个数据的时候用match.group()只能打印出第一个数据,其它数据不能打印出来.最后找到解决方法,现在记录一下,直接 ...
Python 正则匹配网页内的IP地址及端口号
#!/usr/bin/env python # -*- coding: utf-8 -*- # @Date : 2017-08-30 20:38:23 # @Author : EnderZhou (z ...
python正则匹配示例
text="山东省临沂市兰山区市委大院中区21号楼4单元 276002 奥特曼1号 18254998111" #匹配手机号 m=re.findall(r"1\d{10} ...
[Python]正则匹配字符串 | 蒲公英二维码图片url
代码示例: import re def Find(string): # findall() 查找匹配正则表达式的字符串 url = re.findall('http[s]?://(?:[a-zA-Z] ...

随机推荐

JAVA回调函数ANDROID中典型的回调地方
在计算机中回调函数是指通过函数参数传递到其他代码类的,某一块可执行代码的引用,这以设计允许了底层代码调用者在高层定义的子程序. 在JAVA里面我们使用接口的方式来实现函数的回调. 回调的通俗就是:程序 ...
java中把字节数组转换为16进制字符串
把字符串数组转换为16进制字符串 import java.security.MessageDigest; public class StringUtil { public StringUtil() { ...
drop,delete,truncate
drop,truncate是ddl,数据库定义语言,不执行事务 delete是dml,数据库操作语言,有事务 drop:删除内容和定义,释放空间 delete:删除内容,不删除定义,不释放空间 tru ...
关于炒股软件——金魔方炒股软件的Dll外挂开发
2015-01-19 14:40:04 金魔方平台是由飞狐交易师原创团队集多年研发经验,依靠和讯财经网强大资源,吸取国际专家思路而推出的十年巨作.目前新出的这个2.0版,这一版在数据存储方面作很大的改 ...
iOS设备后台播放音乐方法
iOS设备后台播放音乐方法 1 在设置Capabliites中打开Background Modes,选择Audio And AirPlay 2 在控制viewDidLoad中添加下面代码 AVAudi ...
TestNG使用Eclipse建立Test Case - 就是爱Java
除了JUnit可以进行单元测试外,还可以使用TestNG来撰写Test Case,这是另一种测试Framework,它是为更广泛的测试场合而设计,可以运行在没有修改过的JUnit测试,除非看到它们的i ...
ANDROID （eclipse）开发常见问题及解决办法汇总
1.ANDROID 在eclipse中没有出现AVD的解决方法(转)如果android安装正确的话,但是eclipse里面的导航条就是没有AVD 可以通过「Window」⇒「Customize Per ...
ORTP库API使用入门
一.简介 ORTP是一个支持RTP以及RFC3550协议的库,有如下的特性: (1)使用C语言编写,可以工作于windows, Linux, 以及 Unix平台 (2)实现了RFC3550协议,提供简 ...
openstack组件手动部署整合
preface:当你完全且正确的配置好整个OpenStack ENV 你将能看到的和体验到的!!! 我们先来看看简单效果吧,祝君能在这条路上走的更远,更好;
java获取项目地址或tomcat绝对地址
在java项目中获取文件的路径,不管是相对路径还是绝对路径,其本质都是通过绝对路径去寻找. 获取项目地址 request.getSession().getServletContext().getRea ...

Python正则匹配字母大小写不敏感在读xml中的应用

Python正则匹配字母大小写不敏感在读xml中的应用的更多相关文章

随机推荐

热门专题