Python处理HTML转义字符】的更多相关文章

Python处理HTML转义字符 转 [http://www.cnblogs.com/xuxn/archive/2011/08/12/parse-html-escape-characters-in-python.html] 抓网页数据经常遇到例如>或者 这种HTML转义符,抓到字符串里很是烦人. 比方说一个从网页中抓到的字符串 html = '<abc>' 用Python可以这样处理: import HTMLParser html_parser = HTMLParser.HTMLPars…
Python语法的转义字符 转义字符 说 明 \ 续行符 \n 换行符 \0 空  \t 水平制表符,用于横向跳到下一制表位 \'' 双引号 \' 单引号 \\ 一个反斜杠 \f 换页 \0dd 八进制数,dd 代表字符,如\012 代表换行 \xhh 十六进制数,hh 代表字符,如\x0a 代表换行…
Python转义字符同C语言的转义字符…
在Pycharm里使用转义字符\r和在IDLE里使用\r产生的结果是不一样的. 例子如下: print("你好!\r我是Python!") 输出结果为: 我是Python! 前面的“你好!"不见了. 而在IDLE里输入同样的语句,输出的结果则为: 你好!我是Python! 这个问题让我一度纠结很久,在查阅资料之后得到如下解释: \n  和  \r 都是特殊控制符,这些都是来自于老式电传打字机的功能. \n 是newline开个新行. \r 是Carriage return, …
当我们需要在字符中添加特殊符号时,我们需要用\(即反斜杠来转义字符) 常用的转义字符: 注:如果不想转义添加的特殊字符,需要显示字符串原来的意思的时候,需要用r或R来定义 结果是这样的…
抓网页数据经常遇到例如>或者 这种HTML转义符,抓到字符串里很是烦人. 比方说一个从网页中抓到的字符串: html = '<abc>' 用Python可以这样处理: import HTMLParser html_parser = HTMLParser.HTMLParser() txt = html_parser.unescape(html) #这样就得到了txt = '<abc>' 如果还想转回去,可以这样: import cgi html = cgi.escape(txt…
r"hi" 这里字符串前面加了r,是raw的意思,它表示对字符串不进行转义.为什么要加这个?你可以试试print "\bhi"和r"\bhi"的区别. >>> print "\bhi" hi >>> print r"\bhi" \bhi 可以看到,不加r的话,\b就没有了.因为python的字符串碰到""就会转义它后面的字符.如果你想在字符串里打&qu…
转义字符 描述 \(在行尾时) 续行符 \\ 反斜杠符号 \’ 单引号 \” 双引号 \a 响铃 \b 退格(Backspace) \e 转义 \000 空 \n 换行 \v 纵向制表符 \t 横向制表符 \r 回车 \f 换页 \oyy 八进制数yy代表的字符,例如:\o12代表换行 \xyy 十进制数yy代表的字符,例如:\x0a代表换行 \other 其它的字符以普通格式输出…
"abc\n" 前面加 r,表示原生输出,不转义.实际上是用 \代替 \\,其实是已经转义过了,并不是不转义. 看这个例子: print(r"abc \n") => abc \n 相当于 print("abc \\n") => abc \n 也就是说这里 r"abc \n" <=> "abc \\n" 但是也有例外,print(r"\") 中的引号会被转义,表达式…
在前面的章节中,我们曾经简单学习过转义字符,所谓转义,可以理解为“采用某些方式暂时取消该字符本来的含义”,这里的“某种方式”指的就是在指定字符前添加反斜杠 \,以此来表示对该字符进行转义. 举个例子,在 Python 中单引号(或双引号)是有特殊作用的,它们常作为字符(或字符串)的标识(只要数据用引号括起来,就认定这是字符或字符串),而如果字符串中包含引号(例如 'I'm a coder'),为了避免解释器将字符串中的引号误认为是包围字符串的“结束”引号,就需要对字符串中的单引号进行转义,使其在…
python.exe -v / python3 -v安装python3时, 会得到一个 IDLE(提示符>>>), 简单, 有用, 包含语法编辑器(颜色可变), 调试工具, python shell, python3在线文档.如同linux一样, 按tab键, 可以出现提示python '' 与 "" 一样 , \ 转义字符 alt+N, alt+p 类似 LINUX 的 "上"键 python 变量没有类型. 列表简介 没有变量标识符, 下标从…
前言 这篇文章,并不是对正则表达式的介绍,而是对Python中如何结合re模块使用正则表达式的介绍.文章的侧重点是如何使用re模块在Python语言中使用正则表达式,对于Python表达式的语法和详细的介绍,可以参考别的文章,这篇文章只是给出一些常用的正则表达式语法,以方便对re模块的使用进行讲解. 对正则表达式的介绍,可以参看这两篇文章: 正则表达式30分钟入门教程 正则表达式之道 注意:实验环境为 Python 3.4.3 正则表达式简介 正则表达式,又称正规表示式.正规表示法.正规表达式.…
Python零散收集 转义字符 描述 \(在行尾时) 续行符 \\ 反斜杠符号 \’ 单引号 \” 双引号 \a 响铃 \b 退格(Backspace) \e 转义 \000 空 \n 换行 \v 纵向制表符 \t 横向制表符 \r 回车 \f 换页 \oyy 八进制数yy代表的字符,例如:\o12代表换行 \xyy 十进制数yy代表的字符,例如:\x0a代表换行 \other 其它的字符以普通格式输出  …
        于Python最重要的数据类型包含字符串.名单.元组和字典.本文重点介绍Python基础知识. 一.字符串基础         字符串指一有序的字符序列集合,用单引號.双引號.三重(单双均可)引號引起来.如:         s1='www.csdn.net'   s2="www.csdn.net"   s3='''aaabbb'''         当中字符串又包含:         1.转义字符串         像C语言中定义了一些字母前加"\"…
2.2节讲过,Python中有字符串类型.在Python中,字符串用'或"括起,例如'abc'."qwerty"等都是字符串.注意'和"并不是字符串的内容. ASCII(American Standard Code for Information Interchange)码 电脑可以存储数字,那字符怎么办?答案是可以给字符编码,这样只要存储数字,显示时转成字符就可以了.由于电脑是美国人发明的,因此电脑最初只有128个(不是很确定)字符被编码,叫做ASCII码,范围为…
一. Python字符串 1. 下面来看一下python中常见字符串常量和表达式: Python中用来编写字符串的方法有以下几种: (1) 单引号:'speade' (2) 双引号:"speade" (3) 三引号:''' ....read me ... ''',    """  ....read me .... """ (4) 转义字符:"s\tnn\na\ome", \t, \n, \o为转义字符 (5…
2月22日更新:   0.Python从零开始系列连载: Python从零开始系列连载(1)——安装环境 Python从零开始系列连载(2)——jupyter的常用操作 Python从零开始系列连载(3)——Python的基本数据类型(上) Python从零开始系列连载(4)——Python的基本数据类型(下) Python从零开始系列连载(5)——Python的基本运算和表达式(上) Python从零开始系列连载(6)——Python的基本运算和表达式(下) Python从零开始系列连载(7)…
用python处理html代码的转义与还原   转义 escape: import cgi s = cgi.escape("""& < >""") # s = '& < >'   反转义 unescape: #使用标准库 from htmllib import HTMLParser  h = HTMLparser.HTMLParser()  s = h.unescape('& < >')…
第六章 字符串操作 前言 这一章节讲了关于 Python 中字符串类型的知识.与字符串有关的操作符,方法等等. 处理字符串:字符串的写入.打印.访问的知识 原始字符串 格式:r'string'作用:在其中的\ 不会被 Python 认为是转义字符的开始,而是字符串的一部分 三重引号 格式:“”“ ”“”作用: 三重引号之间的所有引号.制表符或换行,都被认为是字符串的一部分. 作为多行注释 注意:三重引号中的转义字符是 optional 的 双引号&转义字符 双引号内的‘会被打印出来,''中不能有…
最近在做一个数字图像的小项目,在最后的界面与程序结合阶段总是出现单个程序可以运行,但是使用界面传递的参数就运行不了的情况.在网上查了很多相关错误,最终确定是文件命名问题. 错误如下: cv2.error: OpenCV(3.4.1) C:\Miniconda3\conda-bld\opencv-suite_1533128839831\work\modules\imgproc\src\color.cpp:11214: error: (-215) (scn == 3 || scn == 4) &&am…
本系列教程供个人学习笔记使用,如果您要浏览可能需要其它编程语言基础(如C语言),why?因为我写得烂啊,只有我自己看得懂!! 字符串定义和访问 1.字符串基础 a.字符串可以用单引号.双引号.三引号(单.双)定义,其中,单引号和双引号定义的字符串没啥区别,三引号有点区别.下面通过例子来看.例子: str1= 'hello' str2= "hello" str3= 'hello3 hello' print str1,str2,str3 #以上三种没有区别 print type(str1)…
这周老师布置了一项作业,让我们回去将自己喜欢的小说里面的主角出场次数统计出来,我对这个充满了兴趣,但我遇到了三个问题: (1)一开始选了一部超长的小说(最爱之一),但是运行时老是不行,老是显示下图错误: (2)我一开始是像书本那样直接把txt文件名打上去,类似于open(‘two.txt’,'r').read(),但总是出现一下一行字: (3)三个字的人名总是会有几个人只打了两个字 一.撇开这些问题,开始写代码: 我刚开始以为是小说太长了,运行不了,就找了一部短一些的小说,我最爱的小说——<我和…
1. 编码格式 在python3以上版本中,py文件默认采用UTF-8格式编码,所有的字符串都是unicode字符串.当然,我们也可以自己为源码文件指定不同的编码,以utf-8为例,相关代码如下所示: 2. 设置代码原作者信息 我们知道,在企业中,由于一个项目很大,不可能一个人完成一整个项目,都是由多位开发人员协同完成.如果不给代码做上标记,这样的后果就是后期维护起来很麻烦.开一个页面做一个标记,是一件非常麻烦的事情,而且容易遗忘.那么我们有没有什么一劳永逸的办法呢.答案是当然有啊,看博主慢慢操…
linux下的目录 绝对路径:是以根目录(" / ")为起点的完整路径,以你所要到的目录为终点. 相对路径:是你当前的目录(" .")为起点的路径,以你所要到的目录为终点. 使用 cd 目录名 进到指定目录,如果指定的“目录名”是 .    表示当前目录 ..   表示当前目录的上一级目录 -    表示上一次所在目录 -   表示当前用户的 home 目录(即刚login时所在的目录) 比如: cd ..      返回上级目录 cd../..   返回上两级目录…
windows中的路径是反斜杠\,然而反斜杠\在python中有着转义字符的意义,所以在py文件中写windows文件路径的时候,要特别注意反斜杠\的使用. 下面有三种解决方式: 方式一:转义的方式 'c:\\users\xxx\desktop\a.txt' 方式二:显式声明字符串不用转义 r'c:\users\xxx\desktop\a.txt' 方式三:使用linux的路径 'c:/users/xxx/desktop/a.txt' 以上三种方式都是正确的,可以解决当下的这个错误. 然而第三种…
变量和赋值语句 在同一条赋值语句中可以引入多个变量 交换变量a 和b 的值 a,b = b,a Python换行可以使用转义字符\,下一行的缩进量相同 )\ 帮助文档 help() 控制语句 条件式语句 如果只有一条语句,可以不用换行 :print('smaller') 模块测试语句 if __name__ == "__main__": main() 字符串及其运算 运算符 ] #Retruns "eat" 格式化字符串 格式 <formtt string&g…
计算机由硬件系统和软件系统组成,硬件系统分为由CPU(运算器+控制器)+内存储器(电信号)组成的主机部分,由输入设备+输出设备+外存储器(硬盘(磁信号).U盘)组成的外设部分.软件系统由系统软件和应用软件组成,系统软件包括了OS+设备驱动程序+编译器(语言处理程序),OS是用来管理硬件和支持其他软件的运行,可以更好的分配系统的软硬件资源,OS提供了图形界面.命令行窗口.以及为开发人员提供的系统接口.创建python项目,不要使用virtual,否则创建过程会慢.python使用#进行单行代码注释…
算术运算符 +   -   *  **   /   //   % 比较运算符 >  <  ==   >=   <=   != Python中提供一种更加简单的比较方式. 当判断一个数是否在某个区间时,可以写成b<a<c,用于判断a是否在(b,c)区间内. 赋值运算符 =  +=  -=   *=  **=  /=  //=  %= 逻辑运算符 and  or  not 优先级 not > and > or 短路原则 条件1 and 条件2   当条件1为假时…
[第五章]思考题答案,仅供参考: 思考题1:第一种方法更快,原因就是{}不需要去调用相关的函数: 思考题2:用列表作为key在这里是不被允许的,因为列表是一个动态变化的数据结构,字典当中的key要求是不可变的,原因也很好理解,key首先是不重复的,如果key是可以变化的话,那么随便key的变化,这里就有可能会有重复的key,那么这就和字典的定义相违背:如果把这里的列表换成元组是可以的,元组是不可变的. 深入浅出字符串 Python 的程序中充满了字符串(string),在平常阅读代码时也屡见不鲜…
人生苦短,我选Python 引言 前文传送门 小白学 Python(1):开篇 小白学 Python(2):基础数据类型(上) 前面我们介绍过了数字,本篇我们接着聊另一个常用的基础数据类型:字符串. 什么是字符串? 字符串是由字符组成的一串有限序列,如: 'geekdigging' . "geekdigging" ,当然,符号也是可以的,如: 'https://www.geekdigging.com/' . "https://www.geekdigging.com/"…