python中匹配中文，解决不匹配，乱码等问题

python中加入中文注释报错处理

python中加入中文注释,运行报错如下解决方法: 在py文件的第一行加入 #coding:utf-8 即可…

Python中表示中文的pattern

Python中表示中文的pattern:[\u4e00-\u9fff] 汉字unicode码表: http://jlqzs.blog.163.com/blog/static/2125298320070101826277/ 汉字全角半角转化: http://hi.baidu.com/fenghua1893/item/d1a71d5ac47ffdcfd3e10cd1…

一開始我用的是: db=MySQLdb.connect(db=sae.const.MYSQL_DB,user=sae.const.MYSQL_USER,passwd=sae.const.MYSQL_PASS,host=sae.const.MYSQL_HOST,port=int(sae.const.MYSQL_PORT)) 数据库编码与python代码的编码都已设为utf8,在PHPMyAdmin中加入中文记录,在网页查询显示中却显示乱码.我在网上各种搜索都找不到解决方法.最后最终发如今连接数据库…

Python源码文件中带有中文时，输出乱码

Python源码文件中带有中文时,文件头应加注释: #!/usr/bin/env python # -*- coding: utf-8 -*- 第一行注释是为了告诉Linux/OS X系统,这是一个Python可执行程序,Windows系统会忽略这个注释: 第二行注释是为了告诉Python解释器,按照UTF-8编码读取源代码,否则,你在源代码中写的中文输出可能会有乱码…

python正则匹配——中文字符的匹配

# -*- coding:utf-8 -*- import re '''python 3.5版本正则匹配中文,固定形式:\u4E00-\u9FA5 ''' words = 'study in 山海大学' regex_str = ".*?([\u4E00-\u9FA5]+大学)" match_obj = re.match(regex_str, words) if match_obj: print(match_obj.group(1)) 结果:山海大学…

python中打印中文

python中打印中文在python 2.x版本中,默认是ASCII编码方式,在有业务需要输入中文时,就会出现乱码的情况.解决这种问题的一个方式就是设置py文件的编码方式.实现方式如下: 在py文件的第一行添加如下代码: # -*- encoding:utf-8 -*- # 逻辑代码区 # -*- encoding:utf-8 -*- 更改默认编码方式为utf-8,可打印中文.…

Python中使用中文

python的中文问题一直是困扰新手的头疼问题,这篇文章将给你详细地讲解一下这方面的知识.当然,几乎可以确定的是,在将来的版本中,python会彻底解决此问题,不用我们这么麻烦了. 先来看看python的版本:>>> import sys>>> sys.version'2.5.1 (r251:54863, Apr 18 2007, 08:51:08) [MSC v.1310 32 bit (Intel)]' (一)用记事本创建一个文件ChineseTest.py,默认A…

java中的中文参数存到数据库乱码问题

关于java中的中文参数乱码问题,遇见过很多,若开发工具的字符集环境和数据库的字符集环境都一样,存到数据库中还是乱码的话,可以通过以下方法解决: 用数据库客户端检查每个字段的字符集和字符集校对和这个表的字符集及字符集校对是否一致,如图:,若一直的话,去jdbc属性文件里的数据库连接url里加上characterEncoding=UTF8,如图: 此时存到数据库里的乱码问题就完美解决,目前只遇到过这一种情况,以后遇到别的情况会一一为大家总结出来.…

Python中使用中文正则表达式匹配指定的中文字符串

业务场景: 从中文字句中匹配出指定的中文子字符串 .这样的情况我在工作中遇到非常多, 特梳理总结如下. 难点: 处理GBK和utf8之类的字符编码, 同时正则匹配Pattern中包含汉字,要汉字正常发挥作用,必须非常谨慎.推荐最好统一为utf8编码,如果不是这种最优情况,也有酌情处理. 往往一个具有普适性的正则表达式会简化程序和代码的处理,使过程简洁和事半功倍,这往往是高手和菜鸟最显著的差别. 示例一: 从QQ纯真数据库中解析出省市县等特定词语,这里的正则表达式基本能够满足业务场景,懒惰匹配?非…

python 2.7中文字符串的匹配（参考）

#!/bin/env python #-*- coding:utf-8 -*- import urllib import os,sys,json import ssl context = ssl._create_unverified_context() def GetWorkOrder(ip): try: #ip = sys.argv[1] len(ip) != 1 except: print "error paras!!" else: #bxurl='**' + ip + '&…

PL/SQL中复制中文再粘贴出现乱码问题的解决【转】

前不久!我对我的windowsxp做了一番大规模的设置:包括区域.系统.网络等方面的,结果当我设置完成以后,发现如果我从一些软件上复制内容到记事本里面会出现乱码,而且如果复制到word里面也不能够正常显示,除非复制到ultraedit里面.结果当然是我只能用 ultraedit做中转站,把从一些软件上要扶植的内容先复制到ultraedit里面,然后在复制到其他的软件中去,这样做很是麻烦,但是我又没有其他更好的办法,为此事我还到一些网站上去求救(包括中国程序员网站),结果都没有得到很好的答复.没有…

python 中的反斜杠匹配的问题

关于反斜杠的匹配问题可以参考: https://www.cnblogs.com/mzc1997/p/7689235.html 文章中提出了两个概念: 字符串转义和正则转义,我觉得是理解反斜杠的关键所在 1. 字符串转义在一个字符串中因为有\n\t 等特殊含义的字符存在,所以字符“\” 是转义字符(字符串转义),如果要取消其转义属性有两种方式: 1)再加一个转义字符:'\\'2)使用原始字符串:r'\' 2. 正则转义正则表达式中,因为有\d,\s 等表示特殊意义的字符存在,所以正则表达式中…

Python中添加中文注释报错SyntaxError: Non-UTF-8 code starting with '\xc1'

问题:在文本编辑器中编辑Python文件时添加中文注释,运行python文件时报错.SyntaxError: Non-UTF-8 code starting with '\xc1' 解决方法:在文本开头添加 # coding=gbk…

ssm中返回中文字符串时出现乱码？

问题:返回json格式时,前端ajax请求,响应数据接收正常: 返回String时,响应数据是乱码? 解决:@RequestMapping注解中添加:produces = "text/html; charset=utf-8" 再次测试,返回中文成功: 参考:https://www.cnblogs.com/roy-blog/p/7048401.html…

Python中加入中文注释

最近开发学习Pyton,当加入中文注释时,运行程序报错: File SyntaxError: Non-ASCII character , but no encoding declared; see http://www.python.org/peps/pep-0263.html for details 解决方法: 在Python脚本文件的第一行或第二行添加一句: #coding:gbk 或 #coding:utf- 或 ##-*- coding : gbk -*-…

【JS】中ajax的URL中包含中文，后台接收乱码

[问题]ajax提交get请求,url中参数包含中文,后台接收到显示乱码. [解决方案]前台: function getSiteInfoByName(siteName){ var res; $.ajax({ url : getRootPath() + "/site/getSiteInfoByName.do?" + "siteName=" + encodeURI(encodeURI(siteName)), type : "get", content…

python中由于中文路径引起的os.path.isfile(imgpath) == False问题

昨天在用python脚本处理文件的时候,遇到了题述问题,明明文件时存在的,但是在用os.path.isfile(imgpath) == False进行判断的时候总是成立,在一开始以为是正反斜杠windows与linux不同导致的,后来发现时因为中文路径造成的. 在网上查阅了解决办法如下: imgpath = unicode(imgpath, "utf8") 利用上述语句将imgpath的编码进行转换,然后再进行判断以及后续的图片读取(使用cv2模块)就都没有问题了.…

vimrc配置-中文编码和python中的中文注释

set fileencoding=gb18030"设置vim输入的编码 set fileencodings=gb18030,...,"打开文档时vim自动匹配可能的编码方式在python文件头上添加 # -*- coding: gb18030 -*- 告诉python解释器当前的编码方式 vim -r filename…

关于Python中输出中文的一点疑问

#encoding=gb2312 import urllib import re def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html): reg = r'<strong>(.*)</strong>' imgre = re.compile(reg) imglist = re.findall(imgre, html) return imglist html…

Windows下Python中的中文路径和中文输出问题

这几天有个项目需要写一点类似于脚本的小程序,就用Python写了,涉及到中文路径和中文输出的问题,整理一下. 有一个问题我觉得需要先强调一下,在写Python程序的时候,一定保证编码是utf-8,然后在每个文件的首部加上# coding=utf-8,这是一个避免出问题的好习惯. 1.中文路径 Windows下的中文路径,Python是能够自动识别的,所以不需要特别强调. 如果需要通过浏览对话框选取文件或目录,可导入如下包 import tkFileDialog 然后调用函数(比如tkFileDi…

Python中的IndentationError解决

用Python .join拼接SQL的时候遇到一个错误:TypeError: cannot concatenate 'str' and 'dict' objects,检查了一下确认是join了两个类型的变量,一个是string,一个是dict(字典),把两边都变成string型就可以了. 有意思的是在处理的过程中修改了简单的几行代码,系统却起不来了,因为cherrypy设置了debug模式,理应一旦有code改变会自动重启web server,查看了移一下log文件,发现: Indentatio…

python中import失败解决的简单办法

例如:import pkg_resources失败可以print sys.path查看,从其他机器上cp -r过来即可,如下例子: 从另外一个正常的机器上scp过来/usr/ali/lib/python2.5/site-packages目录. $python Python (r254:, May , ::) [GCC (Red Hat -)] on linux2 Type "help", "copyright", "credits" or &q…

Python中暂未解决的问题

编写一个复杂的计算器,可以在通过GUI输出出来.参考代码http://www.cnblogs.com/BeginMan/p/3216093.html shelve模块中open()函数调用文件文件的路径是为什么出错,但是调用没有调用过的文件却可以正常运行.…

iOS 的url中含有中文解决方法

[NSURLURLWithString:urlString]生成URL对象时,iOS客户端不能正确进行网络请求,网上找到的URLEncode方法又不能完全解决问题. 方法1: NSString* encodedString = [urlString stringByAddingPercentEscapesUsingEncoding:NSUTF8StringEncoding]; 方法2: NSString * encodedString = (NSString *)CFURLCreateStrin…

解决python代码中含有中文报错

python中写入中文时报错如下图所示: 依照网上解决方法:在py文件中加入:#encoding=utf-8 然后继续报错如下图所示: 解决方法: 在py文件中加入: import sysreload(sys)sys.setdefaultencoding('utf8')…

JS文件中的中文在网页引用时显示乱码的简单解决方式

今天把一个jquery方法从前台cshtml文件转移到单独的js文件中后执行不成功,调试发现if判断中的中文字符串变成了乱码,之前在前台文件中是可以正常显示的,所以判定可能是跟文件的编码方式有关系. 搜索网络得知在引用时指定编码方式charset即可解决,此方法已验证: <script type="text/javascript" language="javascript" src="scripts/xxx.js" charset=&quo…

JS文件中的中文在网页上显示为乱码解决方法

转自:http://www.pc6.com/infoview/Article_63835.html 如果JS文件中的中文在网页上显示为乱码,不妨采用本文章中的方法来试一试,或许能解决使你很头疼的问题.JS编码转换,这句话本身就是一句具有二重义的话.通常理解为JS文件里能转换编码的代码,但是,我所碰到的问题并不是这样的,是要解决JS文件本身的编码问题,它是UTF-8编码的还是ANSI编码的?在百度.谷歌上一搜,大家都是说通过JAVA后台处理来解决编码问题,试问,这样能解决JS文件本身的编码问题吗?…

python中正则表达式在中文字符串匹配时的坑

之前一直有使用python 正则表达式来做中文字符串或者中英文数字混合的字符串的匹配,发现有不少情况下会匹配失灵或者结果混乱,并且在不同操作系统上匹配结果也不一致,查了很久都不知道是什么原因.今天终于彻底弄懂了,原来还是python中对中文的编码问题造成的. 解决办法: step1 在设置默认编码为UTF8之后,将正则表达式和待匹配字符串都decode("utf8")统一成 unicode再进行匹配: step2 正则表达式前面一定要加 r : 示例代码: kw_regexp = r'…

在raw_input()中使用中文提示，在CMD下中文乱码问题解决。。。

错误的程序及结果: 解决1: guess = int(raw_input('请输入一个整数:'.decode('utf-8').encode('gbk'))) 解决2: guess = int(raw_input(unicode('请输入一个整数:','utf-8').encode('gbk'))) 此处python 版本 2.7.11,编译器 sublime 3 注意: python 中出现中文一般需要加前缀 u 或 U 用来避免乱码,但只对 print 有效,对 raw_input 无效(或…

Python::re 模块 -- 在Python中使用正则表达式

前言这篇文章,并不是对正则表达式的介绍,而是对Python中如何结合re模块使用正则表达式的介绍.文章的侧重点是如何使用re模块在Python语言中使用正则表达式,对于Python表达式的语法和详细的介绍,可以参考别的文章,这篇文章只是给出一些常用的正则表达式语法,以方便对re模块的使用进行讲解. 对正则表达式的介绍,可以参看这两篇文章: 正则表达式30分钟入门教程正则表达式之道注意:实验环境为 Python 3.4.3 正则表达式简介正则表达式,又称正规表示式.正规表示法.正规表达式.…