Python数据类型之字符串类型
字符串的表示
字符串是Python中最常用的数据类型之一,必须使用成对的引号包围来表示字符串,引号可以是单引号 ' 、双引号 " 、三引号''' """,格式如下:
a = 'hello'
b = 'python'
c = "I'm boy"
d = '''Hi, I'm Tom'''
e = """I
am Boy"""
print(type(e)) # <class 'str'>
注: 字符串是不可变的数据类型
字符串的下标、切片
字符串下标
获取指定下标的数据
words = 'zhangsan'
print(words[0]) # z
print(words[3]) # n
print(words[5]) # s
print(words[-1]) # n
注:下标从0开始,最后一个元素的的下标为-1
字符串切片
对于指定的对象,对其中部分的数据进行操作,叫做切片。字符串、列表、元组都支持切片操作。切片是从指定的字符串里面复制一段指定的内容,生成的是一个新的字符串。
语法:
序列[开始下标:结束下标:步长]
注意:
1.不包含结束位置下标的数据,正负整数都可以。
2.步长是选取间隔,正负整数都可以,默认的步长是1,不能为0。
示例:
m = 'abcdefghijk'
print(m[2:4]) # cd
print(m[2:4:1]) # cd
print(m[3:6:2]) # df
print(m[:3]) # abc 如果不指定开始下标,则默认从0开始
print(m[6:]) # ghijk 如果不指定结束下标,则选取到最后
print(m[:]) # abcdefghijk 如果不指定开始和结束,则选取所有
print(m[::-1]) # kjihgfedcba # 步长为负数,表示倒序选取
print(m[-4:-1]) # hij
print(m[-4:-1:-1]) # 不能选取数据 从-4开始到-1结束,选取方向为从左到右,但是步长为-1,则表示从右向左
print(m[-1:-4:-1]) # kji
字符串的常见操作
+: 字符串拼接
使用 + 拼接字符串
a = "hello"
print(a * 3) # hellohellohello
a = "Hello"
b = "World"
c = a + b
print(c) # HelloWorld
*: 字符串重复
使用 * 重复输出字符串
a = "hello"
print(a * 3) # hellohellohello
in: 判断字符是否存在
如果存在返回True,不存在返回False
str1 = "abcde"
print("a" in str1) # True
print("f" in str1) # False
not in: 判断字符是否不存在
如果不存在返回True,存在返回False,
str2 = "abcde"
print("a" not in str2) # False
print("f" not in str2) # True
del: 使用del关键字删除字符串
# 删除整个字符串
str1 = "abcd"
del str1
print(str1)
# del删除的是变量,而不是数据
str2 = "hello"
str3 = str2
del str2
print(str3)
字符串的遍历
使用while循环
message = "你好呀Python"
i = 0
while i < len(message):
print(message[i])
i += 1
使用for循环
message = "你好呀Python"
for v in message:
print(v)
使用for循环和range()
message = "你好呀Python"
for index in range(len(message)):
print(message[index])
使用enumerate函数
message = "你好呀Python"
for index, value in enumerate(message):
print(index, value)
使用内置函数iter
message = "你好呀Python"
for v in iter(message):
print(v)
字符串常见的方法
Python中字符串对象提供了很多内置方法来操作字符串,在Python中字符串是不可变的,所以字符串所有相关的方法都不会改变原有字符串,都是返回一个新的字符串。
获取字符串的长度
len()方法
len方法用来获取字符串的长度。
test_str = 'Hello Python !'
print(len(test_str)) # 14
查找某个子串
find()
如果子串包含在该字符串中,则返回这个子串的下标,否则返回-1
语法:
字符串序列.find(子串, 开始位置下标, 结束位置下标)
注:开始和结束下标可以省略,表示在整个字符串序列中查找。
示例:
test_str = 'Hello Python and World!'
print(test_str.find('Python')) # 6
print(test_str.find('hello')) # -1
print(test_str.find('and', 10, 20)) # 13
index()
如果子串包含在该字符串中,则返回这个子串的下标。
字符串序列.index(子串, 开始位置下标, 结束位置下标)
注意:使用index方法,当找不到对应的子串时,程序会报错。
示例:
my_str = 'Hello Python and World!'
print(my_str.index('World')) # 17
print(my_str.find('and', 10, 20)) # 13
print(my_str.index('Worlds')) # 程序会报错
count()
count方法用来查找子串出现的个数。
语法:
字符串序列.cout(子串, 开始位置下标, 结束位置下标)
注意:开始和结束位置下标可以省略,表示在整个字符串中查找。
示例:
my_str = 'Hello Python and and World!'
print(my_str.count('and')) # 2
print(my_str.count('and', 12, 16)) # 1
print(my_str.count('ands')) # 0
rfind()
和find()作用相同,但是查找方向是从右侧开始。
示例:
my_str = 'Hello Python and and World!'
print(my_str.rfind('and')) # 17
print(my_str.rfind('ands')) # -1
rindex()
和index()作用相同,但是查找方向是从右侧开始。
示例:
my_str = 'Hello Python and and World!'
print(my_str.rindex('and')) # 17
print(my_str.rindex('ands')) # 程序报错
修改字符串
注意:原字符串没有修改,只是返回新的字符串。
replace()
语法:
字符串序列.replace(旧的子串, 新的子串, 替换次数)
示例:
my_str = 'Hello World! Hello Python!'
new_str = my_str.replace('Python', 'Java')
print(my_str) # Hello World! Hello Python!
print(new_str) # Hello World! Hello Java!
split()
按照指定字符分割字符串,转为列表。
语法:
字符串序列.split(分割字符, num)
注: num表示的是分割字符出现的次数,即将来返回数据个数为num + 1
示例:
my_str = 'he and llo and wor and ld!'
news_str = my_str.split('and')
print(news_str) # ['he ', ' llo ', ' wor ', ' ld!']
news_str2 = my_str.split('and', 2)
print(news_str2) # ['he ', ' llo ', ' wor and ld!']
partition()
指定一个分隔符,如果字符串包含指定的分隔符,将整个字符串拆分为包含三个元素的元组。第一个元素包含指定分割符之前的部分。第二个元素包含指定的字符串分隔符。第三个元素包含指定分割符后面的部分。
注:该方法搜索指定字符串的第一个匹配项。
str1 = "qwert-yuiop"
print(str1.partition("-")) # ('qwert', '-', 'yuiop')
str2 = "qwert-yui-op"
print(str2.partition("-")) # ('qwert', '-', 'yui-op')
join()
将列表转为字符串
示例:
my_list = ['aa', 'bb', 'cc']
new_str = '...'.join(my_list)
print(new_str) # aa...bb...cc
capitalize()方法
将字符串第一个字符转为大写。
my_str = 'hello world!'
new_str =my_str.capitalize()
print(new_str) # Hello world!
title()
字符串中每个单词首字母大写。
my_str = 'hello world lalala'
new_str =my_str.title()
print(new_str) # Hello World Lalala
upper()方法
将字符串所有字符转为大写。
my_str = 'hello world lalala'
new_str =my_str.upper()
print(new_str) # HELLO WORLD LALALA
lower()
将字符串所有字符转为小写。
my_str = 'Hello WorlD PytHon'
new_str =my_str.lower()
print(new_str) # hello world python
strip()
删除字符串两侧空格
my_str = ' hello python '
print(my_str.strip()) # hello python
lstrip()
删除字符串左侧空格。
my_str = ' hello python ! '
print(my_str.lstrip()) # hello python !
rstrip()方法
删除字符串右侧空格。
my_str = ' hello python '
print(my_str.rstrip()) # hello python
ljust()
返回一个原字符串左对齐,并使用 fillchar 填充至指定长度 width 的新字符串,fillchar 默认为空格。
示例:

rjust()
返回一个原字符串右对齐,并使用fillchar填充至指定长度 width 的新字符串。fillchar 默认为空格。
示例:

center()
返回一个指定的长度 width 居中的字符串,fillchar 为填充的字符,默认为空格。
示例:

字符串判断
startswith()
判断查字符串是否是以指定子字符串开头,如果是则返回True,否则返回False。如果指定start和end,则在指定范围内判断。
my_str = "Hello Python"
print(my_str.startswith("H")) # True
print(my_str.startswith("Hello")) # True
print(my_str.startswith("Hello P")) # True
print(my_str.startswith("Python")) # False
endswith()
检查字符串是否以指定子串结束,如果是则返回True,否则返回False,如果指定start和end,则在指定的范围内检查。
my_str = "Hello Python"
print(my_str.endswith('Python')) # True
print(my_str.endswith('n')) # True
print(my_str.endswith('Hello')) # False
isalpha()
如果字符串至少有一个字符并且所有字符都是字母或中文字则返回True,否则返回False
my_str = "Hello"
print(my_str.isalpha()) # True
my_str1 = "Hello Python"
print(my_str1.isalpha()) # False
isdigit()
如果字符串只包含数字则返回True,否则返回False。
my_str = "123"
print(my_str.isdigit()) # True
my_str1 = "123abc"
print(my_str1.isdigit()) # False
isalnum()
如果字符串至少有一个字符并且所有字符都是字母或数字则返回True,否则返回False。
my_str = "123"
print(my_str.isalnum()) # True
my_str1 = "123 abc"
print(my_str1.isalnum()) # False
my_str2 = "abc"
print(my_str2.isalnum()) # True
isspace()
如果字符串中只包含空白,则返回True,否则返回False。
my_str = "abc"
print(my_str.isspace()) # False
my_str1 = " "
print(my_str1.isspace()) # True
encode()
将字符串按照指定方式编码。
name = "小明"
print(name.encode("utf-8")) # b'\xe5\xb0\x8f\xe6\x98\x8e'
decode()
将字符串按照指定方式解码。
name = "小明"
data = name.encode("utf-8")
print(data.decode("utf-8"))
注意: 用什么方式编码,就要以什么方式解码。
常见的字符编码
计算机只能处理数字(0和1),如果要处理文本,必须先把文本转为数字01才能处理。这种转换方式称为字符编码。
常见的字符编码如下:
- ASCII编码
ASCII码使用指定的7位或8位二进制数组合来表示128或256种可能的字符,基础ASCII码使用7位二进制数来表示所有的大写和小写字母、数字0到9、标点符号以及一些特殊字符。每一位0或者1所占的空间单位为bit(比特),这是计算机中最小的表示单位,每8个bit组成一个字符,这是计算机中最小的存储单位。
- Unicode编码
为了解决传统的字符编码的局限,国际组织制定了Unicode编码,用来对世界上大部分的文字和符号进行编码,使电脑可以更方便的处理和展示文字。Unicode采用16位编码空间,每个字符占2个字节。
- UTF-8编码
使用统一的Unicode编码,乱码问题从此消失了,但是比ASCII编码需要多一倍的存储空间,在存储和传输上就十分不划算。UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,英文字符还是用一个byte编码,汉字通常使用两个字节或三个字节表示。
转义字符
有很多特殊字符没有办法用普通字符表示,需要进行转义。python用反斜杠\ + 字符 进行转义。
如下常见的转义字符:
| 转义字符 | 描述 |
|---|---|
\(在行尾时) |
续行符 |
\\ |
反斜杠符号 |
\' |
单引号 |
\" |
双引号 |
\a |
响铃 |
\b |
退格(Backspace) |
\e |
转义 |
\000 |
空 |
\n |
换行 |
\v |
纵向制表符 |
\t |
横向制表符 |
\r |
回车 |
\f |
换页 |
\oyy |
八进制数,yy代表的字符,例如:\o12代表换行 |
\xyy |
十六进制数,yy代表的字符,例如:\x0a代表换行 |
\other |
其它的字符以普通格式输出 |
示例:
s = 'I\'m fine'
print(s) # I'm fine
s = "Hel\tlo"
print(s) # Hel lo
原始字符串
在字符串前加上r可以防止字符转义,比如当字符串中出现'\n',想要原样输出时。
my_str = "abc\ndef"
print(my_str)
my_str2 = r"abc\ndef"
print(my_str2)
Python数据类型之字符串类型的更多相关文章
- Python笔记_第一篇_面向过程_第一部分_5.Python数据类型之字符串类型(string)
关于Python的字符串处理也如其他语言一样属于重点中的重点,主要是牵扯到的函数和内容较为多和乱一些.关于什么是字符串,Python中的定义是:以单引号或者双引号括起来的任意文本. 1. 字符串的 ...
- Python数据类型-----数字&字符串
Python数字类型 int类型表示的范围:-2147483648至2147483648之间,超出这个范围的数字即视为long(长整形) 在Python中不需要事先声明数据类型,它是根据具体的赋值来进 ...
- Python数据类型之字符串
一:概述 Python中的字符串的一些概念 可以看作是字符的集合,在数据类型里没有单个字符的数据类型,可以用单个字符表示的一个字符串数据类型 字符串是一种不可变的序列类型,单个字符从左到右按照顺序排列 ...
- python的str()字符串类型的方法详解
字符串一旦创建,不可修改,一旦修改或者拼接,都会造成重新生成字符串,因为内存存数据是一个挨着一个存的,如果增加一个字符串的话,之前的老位置只有一个地方,不够,这是原理性的东西,在其他语言里面也一样 7 ...
- Python数据类型-02.字符串
本文主要记录字符串的相关知识,包括字符串的定义特点,常用方法和 请知悉: 计算机中,一切皆为对象世界万物,皆为对象,一切对象皆可分类 1.什么是字符串? 类似"hello world&quo ...
- Python数据类型(字符串)
文章内容参考了教程:http://www.runoob.com/python/python-basic-syntax.html#commentform Python 字符串 字符串是 Python 中 ...
- python基础【2】——python数据类型之字符串
python数据类型-字符串 一. 字符串的表示方法(str) 作用: 记录文本信息 表示方法:' ' 单引号 " "双引号 ''' '''三单引号 ""&qu ...
- python数据类型:序列(字符串,元组,列表,字典)
序列通常有2个特点: 1,可以根据索引取值 2,可以切片操作 字符串,元组,列表,字典,都可以看做是序列类型 我的操作环境:Ubuntu16.04+python2.7 一.字符串类型 >按索引获 ...
- JavaScript数据类型 String字符串类型
前言 javascript没有表示单个字符的字符型,只有字符串String类型,字符型相当于仅包含一个字符的字符串 字符串String是javascript基本数据类型,同时javascript也支持 ...
随机推荐
- css标题文字和下划线重叠
<view class="text"> <text class="textCon">标题</text> <text c ...
- 使用jsoup十分钟内掌握爬虫技术
对,就是十分钟,没有接触过爬虫的你,肯定一脸懵逼,感觉好高深的样子,一开始我也有点懵,但用了以后发现还是很简单的,java爬虫框架有很多,让我有种选择困难症,通过权衡比较还是感觉jsoup比较好用些, ...
- RFC2544吞吐量测试详细步骤-MiniSMB-HurricaneII软件操作演示
RFC2544吞吐量测试详细步骤-MiniSMB-HurricaneII软件操作演示 关键词:网络性能测试:RFC2544:吞吐量:吞吐率. RFC2544协议是RFC组织提出的用于评测网络互联设备( ...
- 【codeforces - 1307G】Cow and Exercise
目录 description solution accepted code details description 给定 n 点 m 边简单有向图,有边权. q 次询问,每次给出 xi.可以增加某些边 ...
- 死磕生菜 -- lettuce 间歇性发生 RedisCommandTimeoutException 的深层原理及解决方案
0x00 起源 项目的一些微服务集成了 Spring Data Redis,而底层的 Redis 客户端是 lettuce,这也是默认的客户端.微服务在某些环境中运行很正常,但在另一些环境中运行就会间 ...
- 最新版Swagger 3升级指南和新功能体验!
Swagger 3.0 发布已经有一段时间了,它于 2020.7 月 发布,但目前市面上使用的主流版本还是 Swagger 2.X 版本和少量的 1.X 版本,然而作为一名合格的程序员怎么能不折腾新技 ...
- Linux sed 使用笔记
sed 工具使用笔记 Linux中经常需要对一些超大的文本文件进行操作,例如 GB 级别的 CSV.TXT.LOG 文件,如果使用 vi 或者 vim 编辑器操作会非常慢且卡,此时 sed 工具或许可 ...
- ES 终于可以搜到”悟空哥“了!
Elasticsearch 搜索引擎内置了很多种分词器,但是对中文分词不友好,所以我们需要借助第三方中文分词工具包. 悟空哥专门研究了下 ik 中文分词工具包该怎么玩,希望对大家有所帮助. 本文主要内 ...
- 计算机体系结构——CH2 指令系统
CH2 指令系统 右键点击查看图像,查看清晰图像 X-mind CH2 指令系统 数据表示 定义 指计算机硬件能够直接识别,可以被指令系统直接调用的那些数据类型 确定哪些数据类型用哪些数据表示实现,是 ...
- 【C++】 C++知识点总结
作者:李春港 出处:https://www.cnblogs.com/lcgbk/p/14643010.html 目录 前言 一.C++常用后缀 二.头文件 1.C++输入输出 2.在C++中使用C的库 ...