关于Python中输出中文的一点疑问

#encoding=gb2312 import urllib import re def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html): reg = r'<strong>(.*)</strong>' imgre = re.compile(reg) imglist = re.findall(imgre, html) return imglist html…

iText中输出中文

原文链接 http://hintcnuie.iteye.com/blog/183690 转载内容 iText中输出中文,有三种方式: 1.使用iTextAsian.jar中的字体 BaseFont.createFont("STSong-Light", "UniGB-UCS2-H",BaseFont.NOT_EMBEDDED); 2.使用Windows系统字体(TrueType) BaseFont.createFont("C:/WINDOWS/Fonts/S…

iText中输出中文

iText中输出中文,有三种方式: 1.使用iTextAsian.jar中的字体 BaseFont.createFont("STSong-Light", "UniGB-UCS2-H",BaseFont.NOT_EMBEDDED);2.使用Windows系统字体(TrueType) BaseFont.createFont("C:/WINDOWS/Fonts/SIMYOU.TTF", BaseFont.IDENTITY_H,Bas…

Python中表示中文的pattern

Python中表示中文的pattern:[\u4e00-\u9fff] 汉字unicode码表: http://jlqzs.blog.163.com/blog/static/2125298320070101826277/ 汉字全角半角转化: http://hi.baidu.com/fenghua1893/item/d1a71d5ac47ffdcfd3e10cd1…

python中加入中文注释报错处理

python中加入中文注释,运行报错如下解决方法: 在py文件的第一行加入 #coding:utf-8 即可…

Python中使用中文

python的中文问题一直是困扰新手的头疼问题,这篇文章将给你详细地讲解一下这方面的知识.当然,几乎可以确定的是,在将来的版本中,python会彻底解决此问题,不用我们这么麻烦了. 先来看看python的版本:>>> import sys>>> sys.version'2.5.1 (r251:54863, Apr 18 2007, 08:51:08) [MSC v.1310 32 bit (Intel)]' (一)用记事本创建一个文件ChineseTest.py,默认A…

python中打印中文

python中打印中文在python 2.x版本中,默认是ASCII编码方式,在有业务需要输入中文时,就会出现乱码的情况.解决这种问题的一个方式就是设置py文件的编码方式.实现方式如下: 在py文件的第一行添加如下代码: # -*- encoding:utf-8 -*- # 逻辑代码区 # -*- encoding:utf-8 -*- 更改默认编码方式为utf-8,可打印中文.…

sae python中Mysql中文乱码的解决

一開始我用的是: db=MySQLdb.connect(db=sae.const.MYSQL_DB,user=sae.const.MYSQL_USER,passwd=sae.const.MYSQL_PASS,host=sae.const.MYSQL_HOST,port=int(sae.const.MYSQL_PORT)) 数据库编码与python代码的编码都已设为utf8,在PHPMyAdmin中加入中文记录,在网页查询显示中却显示乱码.我在网上各种搜索都找不到解决方法.最后最终发如今连接数据库…

Python中输出格式化的字符串

在Python中,采用的格式化方式和C语言是一致的,用%实现,举例如下: >>> 'Hello, %s' % 'world' 'Hello, world' >>> 'Hi, %s, you have $%d.' % ('Michael', 1000000) 'Hi, Michael, you have $1000000.' 你可能猜到了,%运算符就是用来格式化字符串的.在字符串内部,%s表示用字符串替换,%d表示用整数替换,有几个%?占位符,后面就跟几个变量或者值,顺序…

Windows下Python中的中文路径和中文输出问题

这几天有个项目需要写一点类似于脚本的小程序,就用Python写了,涉及到中文路径和中文输出的问题,整理一下. 有一个问题我觉得需要先强调一下,在写Python程序的时候,一定保证编码是utf-8,然后在每个文件的首部加上# coding=utf-8,这是一个避免出问题的好习惯. 1.中文路径 Windows下的中文路径,Python是能够自动识别的,所以不需要特别强调. 如果需要通过浏览对话框选取文件或目录,可导入如下包 import tkFileDialog 然后调用函数(比如tkFileDi…

Python中添加中文注释报错SyntaxError: Non-UTF-8 code starting with '\xc1'

问题:在文本编辑器中编辑Python文件时添加中文注释,运行python文件时报错.SyntaxError: Non-UTF-8 code starting with '\xc1' 解决方法:在文本开头添加 # coding=gbk…

Python中使用中文正则表达式匹配指定的中文字符串

业务场景: 从中文字句中匹配出指定的中文子字符串 .这样的情况我在工作中遇到非常多, 特梳理总结如下. 难点: 处理GBK和utf8之类的字符编码, 同时正则匹配Pattern中包含汉字,要汉字正常发挥作用,必须非常谨慎.推荐最好统一为utf8编码,如果不是这种最优情况,也有酌情处理. 往往一个具有普适性的正则表达式会简化程序和代码的处理,使过程简洁和事半功倍,这往往是高手和菜鸟最显著的差别. 示例一: 从QQ纯真数据库中解析出省市县等特定词语,这里的正则表达式基本能够满足业务场景,懒惰匹配?非…

python中输出内容颜色得控制

参考:http://www.jb51.net/article/51237.htm 颜色代码 1)代码列表格式:\[显示方式;前景色;背景色m 说明: 前景色背景色颜色 --------------------------------------- 黑色红色绿色黃色蓝色紫红色青蓝色白色显示方式意义 ------------------------- 终端默认设置高亮显示使用下划线闪烁反白显示不可见 2)例子例子: \[;;40m <!---高亮显示 -前景色红色…

Python中加入中文注释

最近开发学习Pyton,当加入中文注释时,运行程序报错: File SyntaxError: Non-ASCII character , but no encoding declared; see http://www.python.org/peps/pep-0263.html for details 解决方法: 在Python脚本文件的第一行或第二行添加一句: #coding:gbk 或 #coding:utf- 或 ##-*- coding : gbk -*-…

scrapy中输出中文保存中文

1.json文件中文解码: #!/usr/bin/python #coding=utf-8 #author=dahu import json with open('huxiu.json','r') as f: data=json.load(f) print data[0]['title'] for key in data[0]: print '\"%s\":\"%s\",'%(key,data[0][key]) read_from_json 中文写入json: #!…

python中由于中文路径引起的os.path.isfile(imgpath) == False问题

昨天在用python脚本处理文件的时候,遇到了题述问题,明明文件时存在的,但是在用os.path.isfile(imgpath) == False进行判断的时候总是成立,在一开始以为是正反斜杠windows与linux不同导致的,后来发现时因为中文路径造成的. 在网上查阅了解决办法如下: imgpath = unicode(imgpath, "utf8") 利用上述语句将imgpath的编码进行转换,然后再进行判断以及后续的图片读取(使用cv2模块)就都没有问题了.…

sublime text 3 python 控制台输出中文乱码解决方案

自建的python运行环境如下:python3 找到python3.sublime-build文件打开,在文件中加入"env": { "PYTHONIOENCODING": "utf8" }, 即可文档包含: { "cmd": ["D:\\Software\\Python37\\python.exe","-u","$file"], "file_regex&…

【Python】输出中文字符串的两种方法

print u"中文" # -*- coding: utf-8 -*- 这句话放在最上面,记得是最上面,顶格写这样,print后,字符串前就不用加u了…

vimrc配置-中文编码和python中的中文注释

set fileencoding=gb18030"设置vim输入的编码 set fileencodings=gb18030,...,"打开文档时vim自动匹配可能的编码方式在python文件头上添加 # -*- coding: gb18030 -*- 告诉python解释器当前的编码方式 vim -r filename…

python 控制台输出中文乱码问题

乱码原因: 源码文件的编码格式为utf-8,但是window的本地默认编码是gbk,所以在控制台直接打印utf-8的字符串当然是乱码了! 解决方法: 1,print mystr.decode('utf-8').encode('gbk') 2,比较通用的方法: import sys type = sys.getfilesystemencoding() print mystr.decode('utf-8').encode(type)…

python学习笔记（四）---python不能输出中文问题

只需要在所有代码的最前面加上:#coding:utf-8 即可…

python中匹配中文，解决不匹配，乱码等问题

UnicodeDecodeError: 'ascii' codec can't decode byte 0xe7 in position 0: ordinal 字符串前加 ur‘str’即可;…

Python中输出字体的颜色设置

1.实现过程终端的字符颜色是用转义序列控制的,是文本模式下的系统显示功能,和具体的语言无关.控制字符颜色的转义序列是以ESC开头,即用\033来完成 2.书写过程开头部分: \033[显示方式;前景色;背景色m 结尾部分: \033[0m 注意: 开头部分的三个参数:显示方式,前景色,背景色是可选参数,可以只写其中的某一个:另外由于表示三个参数不同含义的数值都是唯一的没有重复的,所以三个参数的书写先后顺序没有固定要求,系统都能识别:但是,建议按照默认的格式规范书写. 结尾部分其实也可以省…

Python中解决中文乱码问题

乱码原因:因为你的文件声明为utf-8,并且也应该是用utf-8的编码保存的源文件.但是windows的本地默认编码是cp936,也就是gbk编码,所以在控制台直接打印utf-8的字符串当然是乱码了. 解决方法:在控制台打印的地方用一个转码就ok了,打印的时候这么写:print myname.decode('UTF-8').encode('GBK') 比较通用的方法应该是:import systype = sys.getfilesystemencoding()print myname.decod…