对字符串的处理分类:分段,连接,剔除,提取,综合

连接:+,*

+(加法)的使用

a='i'

b=' love'

c=' you'

print(a+b+c)

#return i love you

*(乘法)的使用

a='word'

print(a*3)

#result wodwordword

分段:split()

split():将字符串按标志(默认为空格)分成列表格式

a='www.baidu.com'

print(a.split('.'))

#return ['www','baidu','com']

剔除:strip(),

strip():剔除两侧字符,默认空格,自定义为!结尾。

#默认

a='       python is cool     '

print(a.strip())

#return 'python is cool'

#自定义

a='*********python **is** cool***********'

print(a.strip('*!'))

#return 'python **is** cool'

利用RE模块的正则表达式功能,sub(函数)

import re

phone='123-456-789'

new_phone=re.sub('\D','',phone)

print(new_phone)

#return 123456789

提取:切片和索引

切片和索引

索引:正值和负值

a='123456789'

print(a[0])

#return 1

print(a[-1])

#return 9

切片:包头不包尾(将数字看成角标)

a='123456789'

print(a[0:1])

#return 1

print(a[0:3])

#return 123

综合:替换,  字符串格式化符

替换:replace(),    原值=》替换值

如果有多个原值效果未知

以值查询或位置查询为索引替换

替换is为are

a=''there is apples''

b=a.replace('is','are')

print(b)

#return 'there are apples'

将电话号码中间四位屏蔽

def change_number(number):

  hiding_number=number.replace(number[3:7],'*'*4)

  print(hiding_number)

change_number('13813986643')

#return 138****6643

format():  单词用replace(),长句用format()

#字符串使用

a='{} is my love'.format('python')

print(a)

#return 'python is my love'

#url使用

content=input('输入搜索内容?')

url_path='https://www.abc.com/{}'.format(content)

print(url_path)

#url_path=www.abc.com.content

利用RE模块的正则表达式功能,sub(函数)

import re

phone='123-456-789'

new_phone=re.sub('\D','*',phone)

print(new_phone)

#return 123*456*789

python爬虫之路——对字符串的处理的更多相关文章

  1. Python爬虫之路——简单网页抓图升级版(添加多线程支持)

    转载自我的博客:http://www.mylonly.com/archives/1418.html 经过两个晚上的奋斗.将上一篇文章介绍的爬虫略微改进了下(Python爬虫之路--简单网页抓图),主要 ...

  2. python学习之路06——字符串

    字符串 1.概念 字符串就是由若干个字符组成的有限序列 字符:字母,数字,特殊符号,中文 表示形式:采用的单引号或者双引号 注意:字符串属于不可变实体 2.创建字符串 str1 = "hel ...

  3. 我的Python自学之路-003 字符串的知识

    '''字符串是以引号或者单引号括起来的任意文本,例如"123","asdfjk",'adfa'引号或者单引号,只是一种表示方法,并不是字符串的一部分如果字符串本 ...

  4. python爬虫之路——正则表达式初识

    正则表达式:是一个特殊的符号系列,检查字符串是否与指定模式匹配. python中的re模块拥有全部的正则表达式功能. 判断字符: 类型: 数目:有无:   个数:单值     区间      离散 判 ...

  5. python爬虫之路——变量和变量类型

    变量类型: ①单值:int ②多值:数组 ③复杂:类 变量类型:就是变量的数据结构,表示这个变量所代表的内容的格式是怎样的. (多值)四种基本数据结构: 列表,字典,元组,集合 列表: ①元素可变,  ...

  6. Python学习之路3 - 字符串操作&字典

    本节内容: 常用的字符串处理. 格式化输出字符串. 字符串的替换. 字符串和二进制的相互转化. 字典的操作 字符串操作 常用的字符串处理 name = 'vector' print(name.capi ...

  7. python爬虫之路——Python的re模块及其方法

    介绍常用的三种方法:search(),sub(),findall() search():匹配并提取第一个符合规律的内容,然后返回一个正则表达式的对象 #提取字符串中的第一个数字 import re a ...

  8. python爬虫之路——初识爬虫三大库,requests,lxml,beautiful.

    三大库:requests,lxml,beautifulSoup. Request库作用:请求网站获取网页数据. get()的基本使用方法 #导入库 import requests #向网站发送请求,获 ...

  9. python爬虫之路——初识爬虫原理

    爬虫主要做两件事 ①模拟计算机对服务器发起Request请求 ②接收服务器端的Response内容并解析,提取所需的信息 互联网页面错综复杂,一次请求不能获取全部信息.就需要设计爬虫的流程. 本书主要 ...

随机推荐

  1. SharePoint 2013 set site mailbox

    Automating Site Mailboxes in SharePoint 2013 and Exchange 2013 One of the completely new features to ...

  2. MS SQL PIVOT数据透视表

    以前曾经做过练习<T-SQL PIVOT 行列转换>https://www.cnblogs.com/insus/archive/2011/03/05/1971446.html 今天把拿出来 ...

  3. [51nod] 1091 线段的重叠 贪心

    X轴上有N条线段,每条线段包括1个起点和终点.线段的重叠是这样来算的,[10 20]和[12 25]的重叠部分为[12 20]. 给出N条线段的起点和终点,从中选出2条线段,这两条线段的重叠部分是最长 ...

  4. TSubclassOf的一些说明

    注:补充下SpawnActor的用法 TSubclassOf<AActor> TS = LoadClass<AActor>(NULL, TEXT("Blueprint ...

  5. unity 代码添加AnimationEvent

    经过测试只要Animator跟继承monoBehaviour的类A在同一个节点上,就可以注册类A中的public 方法,含0或1个参数(int,float,object,string),注意:只能是0 ...

  6. 洛谷P3431 [POI2005]AUT-The Bus

    P3431 [POI2005]AUT-The Bus 题目描述 The streets of Byte City form a regular, chessboardlike network - th ...

  7. 洛谷P5173 传球(暴力)

    传送门 真·暴力艹过去 不难发现这个转移其实就是一个循环卷积的形式,设有多项式\(A=x+x^{n-1}\),那么\(f_m=f_0\times A^m\) 直接暴力计算并卡常就行了 //minamo ...

  8. Codeforces Round #558 (Div. 2)

    目录 Codeforces Round #558 (Div. 2) 题解 A Eating Soup B Cat Party C Power Transmission D Mysterious Cod ...

  9. TaskFactory单例模式利用xml

    /** * * Copyright (c) 1995-2009 Wonders Information Co.,Ltd. * 1518 Lianhang Rd,Shanghai 201112.P.R. ...

  10. #1369 : 网络流一·Ford-Fulkerson算法 模板题

    http://hihocoder.com/problemset/problem/1369?sid=1108721 别人都说先学网络流再学二分图,但是我先学了二分图的,感觉网络流好高端啊. 首先对于原图 ...