如何使用 Python 進行字串格式化

前言:
Python有几种方法可以显示程序的输出;数据可以以人类可读的形式打印出来,或者写入文件以供将来使用。
在开发应用程式时我们往往会需要把变数进行字串格式化,也就是说把字串中的变数替换成变量值。事实上,在 Python 中有许多方式可以进行,其中最常见的有四种方式:
- 旧式字串格式化
- 新式字串格式化
- 字串插值
- 样板字串
字串插值是在 Python 3.6 之后有支援的方法,若是你的版本是在 Python 3.6 之后的话建议可以使用。若是需要让使用者可以输入变数来转换成字串格式化的话,建议可以使用样板字串来避免一些资讯安全上的问题。
以下就上述提到的四种方法来各自说明其特色和使用方式:
旧式字串格式化(%)
相对于Python 版本之后推荐使用的新式字串格式化,旧式版本使用 % 运算子来进行字串格式化,若是有C 语言撰写经验的读者或许会觉得的似曾相似(是不是有点像 printf ?) 。使用 % 格式是告诉 Python 直译器要在那边替换文字 text 并使用字串呈现。这就是所谓的旧式字串格式化(%s 是以字串输出,%f 是以浮点数输出、%d 是以十进位整数输出):
text = 'world'
print('hello $s' % text)
# hello world
若是希望把內容轉成十六進位的話可以使用:
print('%x' % 23)
# 17
若是有多個變數要替換則使用 tuple 傳遞需要替代的內容值:
print('hello %s %s' % ('world', 'go'))
# hello world go
新式字串格式化(format())
在Python3以后,开始引入新串格式化,也就是使用 format()函式来让字串格式化,其功能和旧式格式化相差无几,但主要是舍去 % 让字串格式化使用上可以更加 正常,正常,预期性也相对提升。
一般基本用法:
text = 'world'
print('hello {}'.format(text))
# hello world
也可以使用名称来指定变数变换顺序:
name = 'Jack'
text = 'world'
print('hello {name}, hello {text}'.format(name=name, text=text))
# hello Jack, hello world
若是希望把内容转成十六进位的话可以使用 format spec 在 {} 新增 :x:
更漂亮的输出格式:字串插值(Formatted String Literal)
虽然已经有了新式字串格式化,而在Python 3.6又添加了格式字串字面值(Formatted String Literal)此一作法可以把Python运算式嵌入在字串常数中。
眼尖的读者可能会发现,咦,怎么跟隔壁棚的 JavaScript ES6字串模版有点像呀?
现在我们来看一下一般的使用方式:
text = 'world'
print(f'Hello, {text}')
新的字串插值语法相当强大的点是,可以在里面嵌入任何 Python的运算式,表示来说,我们想要呈现整数相加:
x = 10
y = 27
print(f'x + y = {x + y}')
# 37
同样,若是希望把内容转成十六进位的话可以使用 format spec 在 {} 新增 :x:
print('{:x}'.format(23))
# 17
读者可能会觉得很字串插值神奇,但实际上其背后原理是由Python语法解析器把f-string字串插值格式字串转成一连串的字串常数和运算式,最后结合成最终的字串 。
def hello(text, name):
return f'hello {text}, hello {name}'
# 实际上Python会把它变成字串常数和变数(过程中有优化)
def hello(text, name):
return 'hello ' + text + ', hello' + name
模板字串(Template String)
模板字串(Template String)机制相对简单,也比较安全。
以下是一般的使用情境,需要从Python内建模组string 引入:
from string import Template
text = 'world'
t = Template('hello, $text')
t.substitute(text=text)
# hello, world
然而若是希望把内容变成成十六进位的话需要自己使用hex函式自己转换:
from string import Template
number = 23
t = Template('hello, $number')
t.substitute(number=hex(number))
# hello, 0x17
由于其他的字串格式化功能强大,所以反而会造成恶意用户输入变数替换成字串时造成不可预期的错误(一般来说使用者的输入都是不可信的,要进行过滤)。
体现为恶意使用者可能可以透过字串格式的恶意输入来获取敏感资讯(例如:密码,令牌,金钥等)?
SECRET_TOKEN = 'my-secret-token'
# Error func
class Error:
def __init__(self):
pass
err = Error()
malicious_input = '{error.__init__.__globals__[SECRET_TOKEN]}'
malicious_input.format(error=err)
# my-secret-token
没想到,透过字串格式的方式竟然可以透过 __globals__ 字典检索我们的SECRET_TOKEN,若是一不留神,很可能机密资料就泄漏出去。此时若是使用范本String发生错误,是比较安全的选项 :
from string import Template
SECRET_TOKEN = 'my-secret-token'
# Error func
class Error:
def __init__(self):
pass
err = Error()
malicious_input = '${error.__init__.__globals__[SECRET_TOKEN]}'
t = Template(malicious_input)
t.substitute(error=err)
# ValueError: Invalid placeholder in string: line 1, col 1
总结
虽然Python相信是能用简单唯一的方式来完成任务,而字串格式化却有多种方式,也各有其优缺点,其本身或许在于版本不同变迁所致。所以你有可能在公司内部 专案不同专案看到使用不同的字串格式化方式,若是看到同一个专案使用不同字串格式化方式也不要混淆。
一般情况我们会根据不同Python版本和使用情境去使用不同字串格式化方式,例如:若是使用Python 3.6之后的话建议可以使用字串插值,若版本比3.6旧,则使用新式字串格式化(format ())。若是需要让使用者可以输入变数来转换成字串格式化的话,建议可以使用样板字串来避免一些资讯安全上的问题。
參考文件
- python string — Common string operations
- (那些過時的) Python 字串格式化以及 f-string 字串格式化
- 字串格式化
- Python String Formatting Best Practices
- Python 字串格式化教學與範例
- A Quick Guide to Format String in Python
- 菜鸟教程python格式化问题
如何使用 Python 進行字串格式化的更多相关文章
- Python 字串处理
#!/usr/bin/python #-*- coding:utf-8 –*- import os import sys import re import shutil import xlrd imp ...
- python之字串
python字串声明: 单引('), 双引("), 三引(''' 或 """"). python字串前缀: r表示原生字串, 字串内容: (1)不能包 ...
- 动态规划--求最大连续子数组的和(Python实现)&求解最大连续乘积字串(Python实现)
def MaxSum(self,array,n): sum=array[0] result=array[0] for i in range(0,n): if sum<0: sum=a[i] el ...
- python笔记--2--字符串、正则表达式
字符串 ASCII码采用1个字节来对字符进行编码,最多只能表示256个符号. UTF-8以3个字节表示中文 GB2312是我国制定的中文编码,使用1个字节表示英语,2个字节表示中文:GBK是GB231 ...
- 孤荷凌寒自学python第九天Python的输出print的格式化
孤荷凌寒自学python第九天Python的输出print的格式化 (完整学习过程屏幕记录视频地址在文末,手写笔记在文末) (今天感觉手写笔记整得清楚些,汇总电子 笔记时,自己思路凌乱了,练习过程也还 ...
- char s[]字串和char *s字串有什麼区别?
C語言有兩種字串宣告方式char s[]和char *s,兩者有什麼差異呢? Introduction char s[] = "Hello World"; (只是用字符串常量初始化 ...
- #Windows Phone:在HTML5专案中,如何从Javascript传送字串到C#的APP端
原文:#Windows Phone:在HTML5专案中,如何从Javascript传送字串到C#的APP端 #Windows Phone:在HTML5专案中,如何从Javascript传送字串到C#的 ...
- Python用类实现串以及对串的方法进行单元测试
串是一种常见的数据结构,这里使用Python定义类来实现相应的方法.先看代码,再对相关知识进行讲解. # coding=utf-8 __all__=['ADTString'] class ADTStr ...
- Python第一行代码
Python版本:Python 3.6.1 0x01 命令行交互 在交互式环境的提示符>>>下,直接输入代码,按回车,就可以立刻得到代码执行结果.现在,试试输入100+200,看看计 ...
随机推荐
- [转]camera教程
camera教程 Lens一般由几片透镜组成透镜结构,按材质可分为塑胶透镜(plastic)或玻璃透镜(glass),玻璃镜片比树脂镜片贵.塑胶透镜其实是树脂镜片,透光率和感光性等光学指标比不上镀膜镜 ...
- Latex — 写作编译过程中遇到问题记录与总结
最近在训练的时候,又开始用Latex进行写作.碰到了很多问题,将问题进行记录与总结. 一.输出中文的问题 由于写作的时候用的是中文,而之前用的是英文,故碰到的第一个问题就是中文的问题.我之前下的是Wi ...
- latex:公式环境
1.单行公式环境 equation 单行公式环境equation可将一个公式,不管多长都可排版为一行,并给出一个序号.而由系统提供的displaymath环境等效于公式宏包提供的equation*环境 ...
- Shell编程—结构化命令(2)
1for命令 for命令的基本格式: for var in list do commands done 在list参数中,你需要提供迭代中要用到的一系列值. 1.1读取列表中的值 例子: $ vim ...
- 【C艹】关于sort用法之重构cmp(comp)函数的笔记
众所周知,balabalabalabala············. 所以掌握sort函数(库文件:<algorithm>)的用法还是很有必要的. 一般选手只会简单地用用sort排一排数组 ...
- 2020,8种必备Selenium编写自动化用例的技巧
在开始自动化时,您可能会遇到各种可能包含在自动化代码中的方法,技术,框架和工具.有时,与提供更好的灵活性或解决问题的更好方法相比,这种多功能性导致代码更加复杂.在编写自动化代码时,重要的是我们能够清楚 ...
- 招新裁老,两面派互联网大厂,培训三个月,就拿15K,凭什么?
看到一位朋友在发帖子求问:亲身经历,(如有谎言我名字倒过来写)一个大学同学18年毕业的.在兰州一个二本学的兽医农牧,毕业难找工作,去深圳一个机构培训了三个月吧,然后就去做大数据 算法了,然后又去做ja ...
- Labview学习之路(十三)数组函数
本文章介绍一下函数选版中的数组函数,一眼看懂没什么特殊地方的就不说了 (一)数组大小 返回I32类型的数或者数组. 什么是I32类型?就是32位有符号整型, 有符号什么意思?就是在32位数据中最高做符 ...
- 解决 SQL 注入和 XSS 攻击(Node.js 项目中)
1.SQL 注入 SQL 注入,一般是通过把 SQL 命令插入到 Web 表单提交或输入域名或页面请求的查询字符串,最终达到欺骗服务器执行恶意的 SQL 命令. SQL 注入示例 在登录界面,后端会根 ...
- 跟我一起学.NetCore之中间件(Middleware)简介和解析请求管道构建
前言 中间件(Middleware)对于Asp.NetCore项目来说,不能说重要,而是不能缺少,因为Asp.NetCore的请求管道就是通过一系列的中间件组成的:在服务器接收到请求之后,请求会经过请 ...