Unicode 通用类别: http://msdn.microsoft.com/zh-cn/library/20bw873z(VS.80).aspx 类别 说明 Lu 字母,大写 Ll 字母,小写 Lt 字母,词首字母大写 Lm 字母,修饰符 Lo 字母,其他 Mn 标记,非间距 Mc 标记,间距组合 Me 标记,封闭 Nd 数字,十进制数 Nl 数字,字母 No 数字,其他 Pc 标点,连接符 Pd 标点,短划线 Ps 标点,开始 Pe 标点,结束 Pi 标点,前引号(根据用途可能表现为类似
1 模块简介 Python 3中最大的变化之一就是删除了Unicode类型.在Python 2中,有str类型和unicode类型,例如, Python 2.7.6 (default, Oct 26 2016, 20:30:19) [GCC 4.8.4] on linux2 Type "help", "copyright", "credits" or "license" for more information. >&g
实例1: v1=u '好神奇的问题!?' type(v1)->unicode v1.decode("utf-8")# not work,because v1 is unicode already v1.encode("gb2312")#work,convert from unicode into gbk2312 [发现] decode是把指定的对象转化为unicode(unicode包含utf-8,utf-16),并且指明了待转化对象的编码方式. encode