0x01:

部分参考:https://www.cnblogs.com/edwardsun/p/4421773.html

  • match(string[, pos[, endpos]]) | re.match(pattern, string[, flags]):       这个方法将从string的pos下标处起尝试匹配pattern;如果pattern结束时仍可匹配,则返回一个Match对象;如果匹配过程中pattern无法匹配,或者匹配未结束就已到达endpos,则返回None。     pos和endpos的默认值分别为0和len(string);re.match()无法指定这两个参数,参数flags用于编译pattern时指定匹配模式。     注意:这个方法并不是完全匹配。当pattern结束时若string还有剩余字符,仍然视为成功。想要完全匹配,可以在表达式末尾加上边界匹配符'$'。     示例参见2.1小节。
  • search(string[, pos[, endpos]]) | re.search(pattern, string[, flags]):       这个方法用于查找字符串中可以匹配成功的子串。从string的pos下标处起尝试匹配pattern,如果pattern结束时仍可匹配,则返回一个Match对象;若无法匹配,则将pos加1后重新尝试匹配;直到pos=endpos时仍无法匹配则返回None。     pos和endpos的默认值分别为0和len(string));re.search()无法指定这两个参数,参数flags用于编译pattern时指定匹配模式。    
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    # encoding: UTF-8
    import re
     
    # 将正则表达式编译成Pattern对象
    pattern = re.compile(r'world')
     
    # 使用search()查找匹配的子串,不存在能匹配的子串时将返回None
    # 这个例子中使用match()无法成功匹配
    match = pattern.search('hello world!')
     
    if match:
        # 使用Match获得分组信息
        print match.group()
     
    ### 输出 ###
    # world
  • split(string[, maxsplit]) | re.split(pattern, string[, maxsplit]):       按照能够匹配的子串将string分割后返回列表。maxsplit用于指定最大分割次数,不指定将全部分割。    
    1
    2
    3
    4
    5
    6
    7
    import re
     
    p = re.compile(r'\d+')
    print p.split('one1two2three3four4')
     
    ### output ###
    # ['one', 'two', 'three', 'four', '']
  • findall(string[, pos[, endpos]]) | re.findall(pattern, string[, flags]):       搜索string,以列表形式返回全部能匹配的子串。    
    1
    2
    3
    4
    5
    6
    7
    import re
     
    p = re.compile(r'\d+')
    print p.findall('one1two2three3four4')
     
    ### output ###
    # ['1', '2', '3', '4']
  • finditer(string[, pos[, endpos]]) | re.finditer(pattern, string[, flags]):       搜索string,返回一个顺序访问每一个匹配结果(Match对象)的迭代器。    
    1
    2
    3
    4
    5
    6
    7
    8
    import re
     
    p = re.compile(r'\d+')
    for m in p.finditer('one1two2three3four4'):
        print m.group(),
     
    ### output ###
    # 1 2 3 4
  • sub(repl, string[, count]) | re.sub(pattern, repl, string[, count]):       使用repl替换string中每一个匹配的子串后返回替换后的字符串。     当repl是一个字符串时,可以使用\id或\g<id>、\g<name>引用分组,但不能使用编号0。     当repl是一个方法时,这个方法应当只接受一个参数(Match对象),并返回一个字符串用于替换(返回的字符串中不能再引用分组)。     count用于指定最多替换次数,不指定时全部替换。    
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    import re
     
    p = re.compile(r'(\w+) (\w+)')
    s = 'i say, hello world!'
     
    print p.sub(r'\2 \1', s)
     
    def func(m):
        return m.group(1).title() + ' ' + m.group(2).title()
     
    print p.sub(func, s)
     
    ### output ###
    # say i, world hello!
    # I Say, Hello World!
  • subn(repl, string[, count]) |re.sub(pattern, repl, string[, count]):       返回 (sub(repl, string[, count]), 替换次数)。    
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    import re
     
    p = re.compile(r'(\w+) (\w+)')
    s = 'i say, hello world!'
     
    print p.subn(r'\2 \1', s)
     
    def func(m):
        return m.group(1).title() + ' ' + m.group(2).title()
     
    print p.subn(func, s)
     
    ### output ###
    # ('say i, world hello!', 2)
    # ('I Say, Hello World!', 2)

0x02:自己的案例

需要对前端传来的

str数据切分成list

然后传给数据库

原数据:

{"value":"123","isEditing":false,"isActive":false,"isChecked":false},{"value":"2","isEditing":false,"isActive":false,"isChecked":false},{"value":"32","isEditing":false,"isActive":false,"isChecked":false},{"value":"12","isEditing":false,"isActive":false,"isChecked":false},{"value":"12","isEditing":false,"isActive":false,"isChecked":false},{"value":"123","isEditing":false,"isActive":false,"isChecked":false},{"value":"32","isEditing":false,"isActive":false,"isChecked":false},{"value":"23","isEditing":false,"isActive":false,"isChecked":false},{"value":"12","isEditing":false,"isActive":false,"isChecked":false},{"value":"321","isEditing":false,"isActive":false,"isChecked":false},{"value":"21","isEditing":false,"isActive":false,"isChecked":false}]

过滤:

str = text
def checkFilter(keywords,text):
return re.sub('|'.join(keywords),'',str)
keywords = ('\'','"','\[{','\}]','\{')
a = checkFilter(keywords,text)
print (checkFilter(keywords,text))

输出结果:

<class 'str'>
******************
value:123,isEditing:false,isActive:false,isChecked:false},value:2,isEditing:false,isActive:false,isChecked:false},value:32,isEditing:false,isActive:false,isChecked:false},value:12,isEditing:false,isActive:false,isChecked:false},value:12,isEditing:false,isActive:false,isChecked:false},value:123,isEditing:false,isActive:false,isChecked:false},value:32,isEditing:false,isActive:false,isChecked:false},value:23,isEditing:false,isActive:false,isChecked:false},value:12,isEditing:false,isActive:false,isChecked:false},value:321,isEditing:false,isActive:false,isChecked:false},value:21,isEditing:false,isActive:false,isChecked:false

拆分:

b = a.split('},')
print(b)

输出结果:

******************
['value:123,isEditing:false,isActive:false,isChecked:false', 'value:2,isEditing:false,isActive:false,isChecked:false', 'value:32,isEditing:false,isActive:false,isChecked:false', 'value:12,isEditing:false,isActive:false,isChecked:false', 'value:12,isEditing:false,isActive:false,isChecked:false', 'value:123,isEditing:false,isActive:false,isChecked:false', 'value:32,isEditing:false,isActive:false,isChecked:false', 'value:23,isEditing:false,isActive:false,isChecked:false', 'value:12,isEditing:false,isActive:false,isChecked:false', 'value:321,isEditing:false,isActive:false,isChecked:false', 'value:21,isEditing:false,isActive:false,isChecked:false']
******************

源码:

import re
input = open('I:\\python_test\\json_mysql\\jsondata.txt','r')
text=input.read()
print (text)
print ('******************')
print (type(text))
print ('******************')
str = text
def checkFilter(keywords,text):
return re.sub('|'.join(keywords),'',str)
keywords = ('\'','"','\[{','\}]','\{')
a = checkFilter(keywords,text)
print (checkFilter(keywords,text))
print ('******************') b = a.split('},')
print(b)
print ('******************')
print (type(b))
print ('******************')
print (b[0])
print ('******************')
str1 = b[0]
b1 = str1.split(':') print (b1[0])

输出:

[{"value":"","isEditing":false,"isActive":false,"isChecked":false},{"value":"","isEditing":false,"isActive":false,"isChecked":false},{"value":"","isEditing":false,"isActive":false,"isChecked":false},{"value":"","isEditing":false,"isActive":false,"isChecked":false},{"value":"","isEditing":false,"isActive":false,"isChecked":false},{"value":"","isEditing":false,"isActive":false,"isChecked":false},{"value":"","isEditing":false,"isActive":false,"isChecked":false},{"value":"","isEditing":false,"isActive":false,"isChecked":false},{"value":"","isEditing":false,"isActive":false,"isChecked":false},{"value":"","isEditing":false,"isActive":false,"isChecked":false},{"value":"","isEditing":false,"isActive":false,"isChecked":false}]
******************
<class 'str'>
******************
value:123,isEditing:false,isActive:false,isChecked:false},value:2,isEditing:false,isActive:false,isChecked:false},value:32,isEditing:false,isActive:false,isChecked:false},value:12,isEditing:false,isActive:false,isChecked:false},value:12,isEditing:false,isActive:false,isChecked:false},value:123,isEditing:false,isActive:false,isChecked:false},value:32,isEditing:false,isActive:false,isChecked:false},value:23,isEditing:false,isActive:false,isChecked:false},value:12,isEditing:false,isActive:false,isChecked:false},value:321,isEditing:false,isActive:false,isChecked:false},value:21,isEditing:false,isActive:false,isChecked:false
******************
['value:123,isEditing:false,isActive:false,isChecked:false', 'value:2,isEditing:false,isActive:false,isChecked:false', 'value:32,isEditing:false,isActive:false,isChecked:false', 'value:12,isEditing:false,isActive:false,isChecked:false', 'value:12,isEditing:false,isActive:false,isChecked:false', 'value:123,isEditing:false,isActive:false,isChecked:false', 'value:32,isEditing:false,isActive:false,isChecked:false', 'value:23,isEditing:false,isActive:false,isChecked:false', 'value:12,isEditing:false,isActive:false,isChecked:false', 'value:321,isEditing:false,isActive:false,isChecked:false', 'value:21,isEditing:false,isActive:false,isChecked:false']
******************
<class 'list'>
******************
value:123,isEditing:false,isActive:false,isChecked:false
******************
value

2910.1.14-------------------------------------------------------------------------------------------------------

拼接dict类型 json

----------------------------------------------------------------------------------------------------------------

b = a.split('},')
print(b)
print ('******************')
print (type(b))
print ('******************')
print (b[0])
print (type(b[0]))
print ('******************')
lines_json = b[0].replace(',', '","')#替换字符;;;;;具体b[i] for输出到数据库
lines_json1 = lines_json.replace(':','":"')
lines_json2 = ('{"'+lines_json1+'"}')
print (lines_json2)
print ('******************')
j = json.loads(lines_json2)
print (j)
print (j["value"])
print(type(j))  

输出:

******************
<class 'list'>
******************
value:123,isEditing:false,isActive:false,isChecked:false
<class 'str'>
******************
{"value":"","isEditing":"false","isActive":"false","isChecked":"false"}
******************
{'isActive': 'false', 'value': '', 'isEditing': 'false', 'isChecked': 'false'}
123
<class 'dict'>

-------

【python】re库 正则的一些过滤和把str拆分成list案例 以及json dict类型的更多相关文章

  1. 【归纳】正则表达式及Python中的正则库

    正则表达式 正则表达式30分钟入门教程 runoob正则式教程 正则表达式练习题集(附答案) 元字符\b代表单词的分界处,在英文中指空格,标点符号或换行 例子:\bhi\b可以用来匹配hi这个单词,且 ...

  2. python第六天 函数 python标准库实例大全

    今天学习第一模块的最后一课课程--函数: python的第一个函数: 1 def func1(): 2 print('第一个函数') 3 return 0 4 func1() 1 同时返回多种类型时, ...

  3. Python标准库 re

    正则表达式 regular expression 用来匹配一系列符合句法规则的字符串,是一门独立的小型的语言,如果你了解类Unix系统,那么你对正则表达式就一定不陌生.正则表达式的概念最初是由Unix ...

  4. python+paramiko库+svn写的自动化部署脚本

    第一篇博文 直接开门见山的说了. 这是件什么事?:每次部署都是复制本地的文件粘贴到服务器端,因为路径复杂,所以费时且手工容易出漏洞. 一直在想有什么办法可以解决这种,因为以前在微软的一个牛人同事做过一 ...

  5. python匹配ip正则

    python匹配ip正则 #!/usr/bin/env python # -*- coding:utf-8 -*- import re ip_str = "asdad1.1.1.1sdfwe ...

  6. python标准库00 学习准备

    Python标准库----走马观花 python有一套很有用的标准库.标准库会随着python解释器一起安装在你的电脑上的.它是python的一个组成部分.这些标准库是python为你准备的利器,可以 ...

  7. Python标准库的学习准备

    作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明.谢谢! Python标准库是Python强大的动力所在,我们已经在前文中有所介绍.由于标准 ...

  8. Python HTTP库requests中文页面乱码解决方案!

    http://www.cnblogs.com/bitpeng/p/4748872.html Python中文乱码,是一个很大的坑,自己不知道在这里遇到多少问题了.还好通过自己不断的总结,现在遇到乱码的 ...

  9. python第三方库,你要的这里都有

    Python的第三方库多的超出我的想象. python 第三方模块 转 https://github.com/masterpy/zwpy_lst   Chardet,字符编码探测器,可以自动检测文本. ...

随机推荐

  1. Ubuntu学习之路

    一. Ubuntu简介 Ubuntu(乌班图)是一个基于Debian的以桌面应用为主的Linux操作系统,据说其名称来自非洲南部祖鲁语或科萨语的“ubuntu”一词,意思是“人性”.“我的存在是因为大 ...

  2. 《Linux就该这么学》第十五天课程

    本次课所学习的是DNS域名解析服务! 下面提供一些DNS有关的内容 如需进一步学习,请前往https://www.linuxprobe.com/chapter-13.html 工作模式: 1.主服务器 ...

  3. mybatis-plus 3.X 配置

    官网配置参数说明地址:https://mp.baomidou.com/config/#logicdeletevalue 本地配置:yml mybatis-plus: mapper-locations: ...

  4. Java JSONArray for循环 remove成员的一个好算法

    好久没写日志了,今天来写一个,JSONArry fro循环判断value,移除不需要的,不需再将JSONArry再次转换成 map或list. JSONArray移除成员只能通过for遍历取成员,判断 ...

  5. Stanford CS20学习笔记

    Lecture Note 2 Tensorboard P3 Data Structures P4 Math Operations P6 Data Types P7 tf native &&am ...

  6. gulp使用详解

    前面整理了 gulp使用入门,本节介绍相关的压缩 1.压缩js文件 步骤同基础步骤,相关可以看入门篇 npm install gulp-uglify --save-dev 引入js压缩库 gulpfi ...

  7. MySql技术内幕之MySQL入门(1)

    目录 MySql技术内幕之MySQL入门(1) 安装 关于注释 执行SQL语句 关于命令大小写 创建数据库 查看表的信息 查看更加详细的信息 查看与给定模式相匹配的列 插入数据 利用insert添加行 ...

  8. 天气预报demo (ShareREC 官网 MobAPI)

    第一步 自己注册一个应用,然后获取里面的 App Key,下载MobAPI SDK 然后拖入 MobAPI.framework 和 MOBFoundation.framework 到你的项目中 官网是 ...

  9. java基础0615

    1. 1)2)   1)输出:Base  2)编译成功,但没有输出. 2. 编译成功,但没有输出. 3. 只有12行的话,不会新建文件.需要create~~ 4. public static void ...

  10. Maven中可以被继承的POM元素

    groupId:项目组ID,项目坐标的核心元素 version: 项目版本, 项目坐标的核心元素 description: 项目的描述信息 organization: 项目的组织信息 inceptio ...