unicode可以通过编码（encode）成为特定编码的str

1.原始字符串
python中的原始字符串以r开头，使用原始字符串可以避免字符串中转义字符带来的问题，例如写路径时 path = 'c:\noway'，此时用 print path，其结果为：
c:
oway
如果用原始字符串 path = r'c:\noway'，则 print path，其结果为：c:\noway
2.python中没有字符的概念，字符即长度为1的字串。
3.字符串之间的转换：
1）字符串和数字之间的转换：
int（x [,radix])
long(x [,radix])
float(x);
round(num [,digit])
complex(real [,imaginary])：转换为复数
ord(ch):转换为ascii码
2）数字和字符串之间的转换：
1 chr(x) unichr(x):将ascii码或者unicode转换为字符
2将数字转换为16或者8进制 oct（x） hex（x）
3 str（obj）将任何对象转换为字符串
4.字符串中的处理方法

摘录其整理的表格，供参考：

类型
方法
注解
填充
center(width[, fillchar]),
ljust(width[, fillchar]),
rjust(width[, fillchar]),
zfill(width),
expandtabs([tabsize])

fillchar 参数指定了用以填充的字符，默认为空格
zfill的z为zero的缩写,顾名思义,是以字符0进行填充，用于数值输出
expandtabs()的tabsize 参数默认为8。它的功能是把字符串中的制表符（tab）转换为适当数量的空格。

删减
strip([chars]),
lstrip([chars]),
rstrip([chars])
chars为指定要去掉的字符,默认为空白字符,它由string.whitespace常量定义
变形
lower(),#全部小写
upper(),#全部小写
capitalize(),#首字母大写
swapcase(),#大小写交换
title()#每个单词第一个大写,其他小写
因为title() 函数并不去除字符串两端的空白符也不会把连续的空白符替换为一个空格，
所以建议使用string 模块中的capwords(s)函数，它能够去除两端的空白符，再将连续的空白符用一个空格代替。
>>> ‘ hello world!’.title()
‘ Hello World!’
>>> string.capwords(‘ hello world!’)
‘Hello World!’
切割
partition(sep),
rpartition(sep),
splitlines([keepends]),
split([sep [,maxsplit]]),
rsplit([sep[,maxsplit]])

partition()函数族是2.5版本新增的方法。它接受一个字符串参数，并返回一个3个元素的tuple 对象。
如果sep没出现在母串中，返回值是(sep, ‘’, ‘’)；
否则，返回值的第一个元素是sep 左端的部分，第二个元素是sep 自身，第三个元素是sep 右端的部分。
参数maxsplit 是分切的次数，即最大的分切次数，所以返回值最多有maxsplit+1 个元素。
s.split() 和s.split(‘ ‘)的返回值不尽相同
>>> ‘ hello world!’.split()
['hello', 'world!']
>>> ‘ hello world!’.split(‘ ‘)
['', '', 'hello', '', '', 'world!']

产生差异的原因在于当忽略sep 参数或sep参数为None 时与明确给sep 赋予字符串值时split() 采用两种不同的算法。
对于前者，split() 先去除字符串两端的空白符，然后以任意长度的空白符串作为界定符分切字符串
即连续的空白符串被当作单一的空白符看待；
对于后者则认为两个连续的sep 之间存在一个空字符串。因此对于空字符串（或空白符串），它们的返回值也是不同的：
>>> ”.split()
[]
>>> ”.split(‘2881064151 ‘)
['']
连接
join(seq)
join() 函数的高效率（相对于循环相加而言），使它成为最值得关注的字符串方法之一。
它的功用是将可迭代的字符串序列连接成一条长字符串，如：
>>> conf = {‘host’:’127.0.0.1′,
… ‘db’:'spam’,
… ‘user’:'sa’,
… ‘passwd’:'eggs’}
>>> ‘;’.join("%s=%s"%(k, v) for k, v in conf.iteritems())
‘passswd=eggs;db=spam;user=sa;host=127.0.0.1′
判定
isalnum(),
isalpha(),
isdigit(),
islower(),
isupper(),
isspace(),
istitle(),
startswith(prefix[, start[, end]]),
endswith(suffix[,start[, end]])
这些函数都比较简单，顾名知义。需要注意的是*with()函数族可以接受可选的start, end 参数，善加利用，可以优化性能。
另，自Py2.5 版本起，*with() 函数族的prefix 参数可以接受tuple 类型的实参，当实参中的某人元素能够匹配，即返回True。
查找
count( sub[, start[, end]]),
find( sub[, start[, end]]),
index( sub[, start[, end]]),
rfind( sub[, start[,end]]),
rindex( sub[, start[, end]])
find()函数族找不到时返回-1，index()函数族则抛出ValueError异常。
另，也可以用in 和not in 操作符来判断字符串中是否存在某个模板。
替换
replace(old, new[,count]),
translate(table[,deletechars])
replace()函数的count 参数用以指定最大替换次数
translate() 的参数table 可以由string.maketrans(frm, to) 生成
translate() 对unicode 对象的支持并不完备，建议不要使用。
编码
encode([encoding[,errors]]),
decode([encoding[,errors]])
这是一对互逆操作的方法，用以编码和解码字符串。因为str是平台相关的，它使用的内码依赖于操作系统环境，
而unicode是平台无关的，是Python内部的字符串存储方式。
unicode可以通过编码（encode）成为特定编码的str，而str也可以通过解码（decode）成为unicode。

unicode可以通过编码（encode）成为特定编码的str的更多相关文章

关于base64编码Encode和Decode编码的几种方式
关于base64编码Encode和Decode编码的几种方式 Base64是一种能将任意Binary资料用64种字元组合成字串的方法,而这个Binary资料和字串资料彼此之间是可以互相转换的,十分方便 ...
关于base64编码Encode和Decode编码的几种方式--Java
Base64是一种能将任意Binary资料用64种字元组合成字串的方法,而这个Binary资料和字串资料彼此之间是可以互相转换的,十分方便.在实际应用上,Base64除了能将Binary资料可视化之外 ...
Java如何进行Base64的编码(Encode)与解码(Decode)？
https://blog.csdn.net/zhou_kapenter/article/details/62890262 *************************************** ...
Java进行Base64的编码(Encode)与解码(Decode)
关于base64编码Encode和Decode编码的几种方式 Base64是一种能将任意Binary资料用64种字元组合成字串的方法,而这个Binary资料和字串资料彼此之间是可以互相转换的,十分方便 ...
Java如何进行Base64的编码(Encode)与解码(Decode)
关于base64编码Encode和Decode编码的几种方式 Base64是一种能将任意Binary资料用64种字元组合成字串的方法,而这个Binary资料和字串资料彼此之间是可以互相转换的,十分方便 ...
python编码encode和decode
计算机里面,编码方法有很多种,英文的一般用ascii,而中文有unicode,utf-8,gbk,utf-16等等. unicode是 utf-8,gbk,utf-16这些的父编码,这些子编码都能转换 ...
python编码encode decode(解惑)
关于python 字符串编码一直没有搞清楚,今天总结了一下. Python 字符串类型 Python有两种字符串类型:str 与 unicode. 字符串实例 # -*- coding: utf-8 ...
is 和 == 区别,id() ,回顾编码,encode(),decode()
1. is 和 == 区别 id()函数 == 判断两边的值 is 判断内存地址例 s = "alex 是大 xx"# abc = id(s) # 得到内存地址# print(a ...
太白老师 day06 编码 encode decode
ASCII : 字母, 数字, 特殊字符字符:1个字节数字: 1个字节 Unicode: 万国码, 包含所有文字创建之初字符: 2个字节中文: 2个字节升级: 字符: 4个字节中文 : ...

随机推荐

Laravel错误与日志处理
App\Exceptions\Handler class is where all exceptions triggered by your application are logged and th ...
SpringJMS解析2-JmsTemplate
尽管消息接收可以使用消息监听器的方式替代模版方法,但是在发送的时候是无法替代的,在Spring中必须要使用JmsTemplate提供的方法来进行发送操作,可见JmsTemplate类的重要性,那么我们 ...
no-jquery 03 Ajax
Ajax Requests GETting var xhr = new XMLHttpRequest(); xhr.open('GET', encodeURI('myservice/username? ...
wpf ListBox,item两列不等高。
业务有这样的需求,类似瀑布流.内容两列不等高展示. 只需要继承panel,重写MeasureOverride和ArrangeOverride方法就行了. 很简单,内容都在代码里. using Syst ...
【面经】用递归方法对二叉树进行层次遍历 && 二叉树深度
void PrintNodeAtLevel(BiTree T,int level) { // 空树或层级不合理 ) return; == level) { cout << T->da ...
MFC 程序以管理员权限运行
首先,VS打开项目的属性然后设置如图: 转载自:http://www.cnblogs.com/zzuhjf/archive/2012/09/12/2681548.html
Python学习笔记06
源代码文件第一行添加:#coding:utf-8,这样就可以避免了或者:#-*- coding: UTF-8 -*- dict:实际就是哈希表,其键只能是不可变类型,如string,bool ...
《Getting Started with Storm》译文 Homepage
拿到这本书感觉还挺薄,所以当下就想赶紧读完,然后尝试着翻译下,并加上一些自己的理解,作学习交流之用,非盈利性质这段时间在做一个分布式的.支持大吞吐的.实时的日志系统 ,主要用到的开源方案有Kaf ...
【ZOJ】3329 One Person Game
http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemId=3754 题意:有三个色子,分别有k1.k2.k3个面,权值分别是1-k1, 1~ ...
CentOS 6.5/6.6 安装mysql 5.7 最完整版教程
Step1: 检测系统是否自带安装mysql # yum list installed | grep mysql Step2: 删除系统自带的mysql及其依赖命令: # yum -y remove ...

unicode可以通过编码（encode）成为特定编码的str

unicode可以通过编码（encode）成为特定编码的str的更多相关文章

随机推荐

热门专题