python数据格式化之pprint
python数据格式化之pprint
简介
pprint模块 提供了打印出任何Python数据结构类和方法。
模块方法:
1.class pprint.PrettyPrinter(indent=1,width=80,depth=None, stream=None)
创建一个PrettyPrinter对象
indent --- 缩进,width --- 一行最大宽度,
depth --- 打印的深度,这个主要是针对一些可递归的对象,如果超出指定depth,其余的用"..."代替。
eg: a=[1,2,[3,4,],5] a的深度就是2; b=[1,2,[3,4,[5,6]],7,8] b的深度就是3
stream ---指输出流对象,如果stream=None,那么输出流对象默认是sys.stdout
2.pprint.pformat(object,indent=1,width=80, depth=None)
返回格式化的对象字符串
3.pprint.pprint(object,stream=None,indent=1, width=80, depth=None)
输出格式的对象字符串到指定的stream,最后以换行符结束。
4.pprint.isreadable(object)
判断对象object的字符串对象是否可读
5.pprint.isrecursive(object)
判断对象是否需要递归的表示
eg: pprint.isrecursive(a) --->False
pprint.isrecursive([1,2,3])-->True
6.pprint.saferepr(object)
返回一个对象字符串,对象中的子对象如果是可递归的,都被替换成<Recursionontypename withid=number>.这种形式。
PrettyPrinter 对象具有的方法与上面类似,不在赘述。
- import pprint
- data = (
- "this is a string", [1, 2, 3, 4], ("more tuples",
- 1.0, 2.3, 4.5), "this is yet another string"
- )
- pprint.pprint(data)
输出:
('this is a string',
[1, 2, 3, 4],
('more tuples', 1.0, 2.3, 4.5),
'this is yet another string')
pprint – 美观打印
作用:美观打印数据结构
pprint 包含一个“美观打印机”,用于生成数据结构的一个美观视图。格式化工具会生成数据结构的一些表示,不仅可以由解释器正确地解析,而且便于人类阅读。输出尽可能放在一行上,分解为多行时则需要缩进。
以下实例用用到的data包含一下数据
data = [(1,{'a':'A','b':'B','c':'C','d':'D'}),
(2,{'e':'E','f':'F','g':'G','h':'H',
'i':'I','j':'J','k':'K','l':'L'
}),
]
1、 打印
要使用这个模块,最简单的方法就是利用pprint()函数
|
1
2
3
4
5
6
|
from pprint import pprintprint 'PRINT:'print dataprint print 'PPRINT:'pprint(data) |
运行结果:
|
1
2
3
4
5
6
7
8
9
10
11
12
13
|
PRINT:[(1, {'a': 'A', 'c': 'C', 'b': 'B', 'd': 'D'}), (2, {'e': 'E', 'g': 'G', 'f': 'F', 'i': 'I', 'h': 'H', 'k': 'K', 'j': 'J', 'l': 'L'})]PPRINT:[(1, {'a': 'A', 'b': 'B', 'c': 'C', 'd': 'D'}), (2, {'e': 'E', 'f': 'F', 'g': 'G', 'h': 'H', 'i': 'I', 'j': 'J', 'k': 'K', 'l': 'L'})] |
pprint()格式化一个对象,并把它写至一个数据流,这个数据流作为参数传入(或者是默认的sys.stdout)
注意为什么第二个字典中会显示一竖列,因为pprint打印支持8个对象以上的竖列打印
2、 格式化
格式化一个数据结构而不把它直接写至一个流(例如用于日志记录),可以使用pformat()来构造一个字符串表示。
|
1
2
3
4
5
6
7
8
9
|
import loggingfrom pprint import pformatlogging.basicConfig(level = logging.DEBUG, format = '%(levelname)-8s %(message)s', )logging.debug('Logging pformatted data')formatted = pformat(data)for line in formatted.splitlines(): logging.debug(line.rstrip()) |
运行结果:
|
1
2
3
4
5
6
7
8
9
10
11
|
DEBUG Logging pformatted dataDEBUG [(1, {'a': 'A', 'b': 'B', 'c': 'C', 'd': 'D'}),DEBUG (2,DEBUG {'e': 'E',DEBUG 'f': 'F',DEBUG 'g': 'G',DEBUG 'h': 'H',DEBUG 'i': 'I',DEBUG 'j': 'J',DEBUG 'k': 'K',DEBUG 'l': 'L'})] |
然后可以单独低打印格式化的字符串或者计入日志
splitlines() 按行分割()
rstrip()去除右边的空格 lstrip()去除左边的空格 strip()去除两边空格。默认为去除空格,也可以传入需要从两边或者其中一边去除的字符,如strip(‘a’)就是去除字符串两边的字符’a’
3、 任意类
如果定制类定义了一个__repr__()方法,pprint()使用的PrettyPrinter类还可以处理这些定制类。
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
from pprint import pprint class node(object): def __init__(self,name,contents =[]): self.name = name self.contents = contents[:] def __repr__(self): return ('node(' + repr(self.name) + ',' + repr(self.contents) + ')' )trees = [node('node-1'), node('node-2',[node('node-2-1')]), node('node-3',[node('node-3-1')]), ]pprint(trees) |
运行结果:
|
1
2
3
|
[node('node-1',[]), node('node-2',[node('node-2-1',[])]), node('node-3',[node('node-3-1',[])])] |
由PrettyPrinter组合嵌套对象的表示,从而返回完整字符串表示。
4、 递归
递归数据结构有指向原数据源的引用来表示,形式为<Recursion on typename with id=number>。
|
1
2
3
4
5
6
|
from pprint import pprint local_data = ['a','b',1,2]local_data.append(local_data)print 'id(local_data) =>',id(local_data)pprint(local_data)print local_data |
运行结果:
|
1
2
3
|
id(local_data) => 47458332363520['a', 'b', 1, 2, <Recursion on list with id=47458332363520>]['a', 'b', 1, 2, [...]] |
在这个例子中,列表local_data增加到了其自身,这会创建一个递归引用
内置函数id()作用是获得对象的id值,理论上讲每个对象都有一个id值,如果是整数和字符串((相对较小的时候)),那么相同的值会有相同的id值,但是如果是类,及时相同也会有不同的id值。测试如下:
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
|
#int or float or lon 都一样(比较小的时候)a = 65464131311513lb = 65464131311513lc = 65464131311513lprint id(a)print id(b)print id(c)printa = '12312312'b = '12312312'c = '12312312'print id(a)print id(b)print id(c)print a = 65464131311513l*11b = 65464131311513l*11c = 65464131311513l*11print id(a)print id(b)print id(c)printa = '12312312'*11b = '12312312'*11c = '12312312'*11print id(a)print id(b)print id(c)print class Test(object): def __init__(self): passa = Test()b = Test()c = Test()print id(a)print id(b)print id(c)print |
测试结果:
47010342174992
47010342174992
47010342174992
47010343272096
47010343272096
47010343272096
47010343261568
47010343261648
47010343261688
47010343200944
47010343199152
47010343202352
47010343252304
47010343252944
47010343253008
5、 限制嵌套输出
对于非常深的数据结构,可能不要求输出包含所有细节。有可能数据没有是当地格式化,也可能格式化文本过大而无法管理,或者默写数据时多余的。
|
1
2
3
4
5
6
7
8
9
|
from pprint import pprint print 'depth 1 :'pprint(data,depth=1)print print 'depth 2 :'pprint(data,depth=2)print print 'depth 3 :'pprint(data,depth=3) |
运行结果:
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
depth 1 :[(...), (...)]depth 2 :[(1, {...}), (2, {...})]depth 3 :[(1, {'a': 'A', 'b': 'B', 'c': 'C', 'd': 'D'}), (2, {'e': 'E', 'f': 'F', 'g': 'G', 'h': 'H', 'i': 'I', 'j': 'J', 'k': 'K', 'l': 'L'})] |
使用depth参数可以控制美观打印机递归处理嵌套数据结构的深度。输出中未包含的层次由一个省略号表示
6、 控制输出宽度
格式化文本的默认输出宽度为80列。要调整这个宽度,可以再pprint()中使用参数width。
|
1
2
3
4
5
|
from pprint import pprintfor width in [80,5]: print 'WIDTH = ', width pprint(data,width = width) print |
运行结果:
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
WIDTH = 80[(1, {'a': 'A', 'b': 'B', 'c': 'C', 'd': 'D'}), (2, {'e': 'E', 'f': 'F', 'g': 'G', 'h': 'H', 'i': 'I', 'j': 'J', 'k': 'K', 'l': 'L'})]WIDTH = 5[(1, {'a': 'A', 'b': 'B', 'c': 'C', 'd': 'D'}), (2, {'e': 'E', 'f': 'F', 'g': 'G', 'h': 'H', 'i': 'I', 'j': 'J', 'k': 'K', 'l': 'L'})] |
宽度大小不能适应格式化数据结构时,如果斩断或转行会引入非法的语法,就不会进行截断或转行
python数据格式化之pprint的更多相关文章
- 【转】python数据格式化之pprint
pprint – 美观打印 作用:美观打印数据结构 pprint 包含一个“美观打印机”,用于生成数据结构的一个美观视图.格式化工具会生成数据结构的一些表示,不仅可以由解释器正确地解析,而且便于人类阅 ...
- Python数据格式化
Python有两种格式化字符串的方式,使用%或者使用内置format()函数. 使用%格式化字符串 在Python中使用%来格式化字符串,用法和效果类似于C语言中的%.格式为:%特定的转换类型 %da ...
- python json.dumps()函数输出json格式,使用indent参数对json数据格式化输出
在python中,要输出json格式,需要对json数据进行编码,要用到函数:json.dumps json.dumps() :是对数据进行编码 #coding=gbkimport json dict ...
- python 文件与数据格式化
https://www.cnblogs.com/li-zhi-qiang/p/9269453.html 文件和数据格式化 https://www.cnblogs.com/li-zhi-qi ...
- Python基础篇(五)_文件和数据格式化
Python基础篇_文件和数据格式化 文件的使用:文件打开.关闭.读写 文件打开:通过open()函数打开文件,并返回一个操作文件的变量. 使用语法:<变量名> = (<文件路径以及 ...
- Python 注释和键盘输入,输出数据格式化
Python中的注释有单行注释和多行注释: Python中单行注释以 # 开头,例如: # 这是一个注释 print("Hello, World!") 多行注释用三个单引号 ''' ...
- python基础之 数据格式化
%还是format 皇城PK Python中格式化字符串目前有两种阵营:%和format,我们应该选择哪种呢? 自从Python2.6引入了format这个格式化字符串的方法之后,我认为%还是form ...
- Python 字符串格式化
Python 字符串格式化 Python的字符串格式化有两种方式: 百分号方式.format方式 百分号的方式相对来说比较老,而format方式则是比较先进的方式,企图替换古老的方式,目前两者并存 一 ...
- python字符串格式化方法 format函数的使用
python从2.6开始支持format,新的更加容易读懂的字符串格式化方法, 从原来的% 模式变成新的可读性更强的 花括号声明{}.用于渲染前的参数引用声明, 花括号里可以用数字代表引用参数的序 ...
随机推荐
- PythonWEB框架之Tornado
前言 Tornado(龙卷风)和Django一样是Python中比较主流的web框架,Tornado 和现在的主流 Web 服务器框架也有着明显的区别:Tornado自带socket,并且实现了异步非 ...
- [BZOJ2427]软件安装
Problem 每个软件都要安装某些软件才能安装,而且都有体积和价值,求安装的价值最大值 Solution 对于每个环,我们可以知道必须全部一起取或者不取,因此我们先用Tarjan缩点 然后我们用一个 ...
- Edge 浏览器 调用
ShellExecute(0, 'open', PChar('Microsoft-Edge:' + Edit1.Text), nil, nil, SW_SHOW);
- teamview修改id
怎么修改 TeamViewer ID 呢?按照下列的操作步骤,就能很简单的改变TeamViewer的id哦!1. 开始 > 运行,录入%appdata%,删除TeamViewer的文件夹: ...
- <? extends T> <? super T>
拿前者来说,这其实就是一个指定的泛型,不过这个泛型可以是T及T的任何子类, 如果一个set方法,是把一个泛型对象T赋值给一个泛型T属性,现在这个T变成了<? extends T>,那么se ...
- get 乱码解决方案
1.针对Post方式提交的请求如果出现乱码,可以每次在request解析数据时设置编码格式: request.setCharacterEncoding("utf-8"); 也可以使 ...
- 小组互评Alpha版本
Thunder——爱阅app(测评人:任思佳) 一.基于NABCD评论作品,及改进建议 每个小组评论其他小组Alpha发布的作品:1.根据(不限于)NABCD评论作品的选题:2.评论作品对选题的实现效 ...
- Selenium - 搭建环境
1. 在Python中安装第三方库 1)安装Selenium 通过pip安装 2). 下载geckodriverckod 从selenium3开始,webdriver/firefox/webdri ...
- Oracle数据库-sqlplus命令下出现SP2-0640: Not connected
可以正常登录sqlplus,通过sys as sysdba 但在sql>输入语句,反馈如下 解决方法: sql>输入conn sys/as sysdba Enter password: c ...
- JVM的基本结构及其各部分详解(二)
3.2 栈帧组成之操作数栈 操作数栈是栈帧的主要内容之一,它主要用于保存计算过程中的中间结果,同时作为计算过程中变量临时的存储空间. 操作数栈也是一个先进后出的数据结构,只支持入栈和出栈两种操作,许多 ...