常用的标准库

在我们常用的系统windowsLinux系统中有很多支持的压缩包格式,包括但不限于以下种类:rarziptar,以下的标准库的作用就是用于压缩解压缩其中一些格式的压缩包。

zip格式

import zipfile

zipfile模块操作压缩包使用ZipFile类进行操作,使用方法和open的使用方法很相似,也是使用rwxa四种操作模式。基本步骤也是大致分为三步:打开文件、操作文件、关闭文件。可以使用with语法进行上下文自动操作。

注意一:zipfile也是rwxa四种模式,表示也会有文件操作中光标指针的概念。

注意二:在Python中,几乎所有涉及到文件相关的操作都是打开、操作、关闭三个步骤。

ZipFile参数说明

语法:ZipFile(file, mode='r', compression=ZIP_STORED, allowZip64=True)

参数 含义
file 文件路径
mode 操作含义,与文件操作中相同,默认为r。
compression 压缩方法,默认为ZIP_STORED。
allowZip64 操作的压缩包文件大小大于2G时应该True, 默认为True,不用管它。

操作含义

模式 含义
w 创建一个新的压缩包文件。
r 读取已有的压缩包文件。
a 向已有的压缩包文件中压缩文件。

压缩方法

在上面的compression参数中可以看到,默认的压缩方法为ZIP_STORED。其实在zipfile模块中定义了一些压缩方法常量,其中最常用的为以下两种:

ZIP_STORED = 0  # 打包归档(不压缩)
ZIP_DEFLATED = 8 # 压缩文件(压缩)

注意,压缩方法指的是将文件写入压缩包中采用的方法,所以,如果是解压缩文件,就没必要指定这个压缩方法了。

常用方法

write -- 指定文件写入压缩包(压缩文件)

语法:write(filename, arcname=None)

语法:write(压缩文件路径,写入压缩包后的路径和名字(默认原名))

写入文件如果是文件夹,那么不会将文件夹中的内容一同写入。

close -- 关闭对象(保存文件)

这是我要压缩的文件夹。

使用ZIP_STORED压缩。

import zipfile

# 文件路径
zip_file_path = r'D:\test.zip' # 压缩包路径
file_path = r'D:\10-中日欧美信息解析' # 被压缩文件 # 默认使用ZIP_STORED
zf = zipfile.ZipFile(zip_file_path, 'w') # 写入文件(文件夹的话,不会将文件夹中的文件一同写入)
zf.write(file_path) # 关闭文件
zf.close()

可以看到,如果文件夹直接压缩的话,不会将其中的文件一同压缩。

让文件夹中的所有文件迭代写入压缩包中。

import os
import zipfile def writeZip(zf, file, arc_path=None):
"""迭代压缩文件夹"""
# 设置压缩路径
if arc_path is None:
arc_path = rf'\{os.path.basename(file)}' # 先压缩本文件
zf.write(file, arc_path) # 如果是文件夹
if os.path.isdir(file): # 获取它所有的子文件
inner_files = os.listdir(file) # 将所有的子文件压缩
for inner_file in inner_files:
inner_file = f'{file}{os.sep}{inner_file}'
arc = fr'{arc_path}\{os.path.basename(inner_file)}'
writeZip(zf, inner_file, arc) # 文件路径
zip_file_path = r'D:\test.zip' # 压缩包路径
file_path = r'D:\10-中日欧美信息解析' # 被压缩文件 # 默认使用ZIP_STORED
zf = zipfile.ZipFile(zip_file_path, 'w') # 写入文件(自定义一个函数,迭代压缩文件夹)
writeZip(zf, file_path) # 关闭文件
zf.close()

现在就可以看到,虽然所有的文件已经全部写入压缩包中,但是ZIP_STORED方法并没有压缩文件。

改用ZIP_DEFLATED方法压缩文件。

import os
import zipfile def writeZip(zf, file, arc_path=None):
"""迭代压缩文件夹"""
# 设置压缩路径
if arc_path is None:
arc_path = rf'\{os.path.basename(file)}' # 先压缩本文件
zf.write(file, arc_path) # 如果是文件夹
if os.path.isdir(file): # 获取它所有的子文件
inner_files = os.listdir(file) # 将所有的子文件压缩
for inner_file in inner_files:
inner_file = f'{file}{os.sep}{inner_file}'
arc = fr'{arc_path}\{os.path.basename(inner_file)}'
writeZip(zf, inner_file, arc) # 文件路径
zip_file_path = r'D:\test.zip' # 压缩包路径
file_path = r'D:\10-中日欧美信息解析' # 被压缩文件 # 使用ZIP_DEFLATED压缩
zf = zipfile.ZipFile(zip_file_path, 'w', zipfile.ZIP_DEFLATED) # 写入文件(自定义一个函数,迭代压缩文件夹)
writeZip(zf, file_path) # 关闭文件
zf.close()

可以看到,文件是压缩写入内部的。

解压缩

解压缩有如下两种方法,注意,解压缩就是在读文件,要将操作模式变更为r

方法 说明
extract 解压缩单个指定的文件。
extractall 解压缩所有的文件。

语法:extract(member,path=None, pwd=None)

语法:extract(指定文件(压缩包中的路径),解压到的位置(默认为当前工作目录),指定的密码(有些压缩包有密码,格式为字节流))

语法:extractall(path=None, pwd=None)

语法:extractall(解压到的位置, 密码)

注意:解压文件和路径中的文件夹同名会报错,因为文件无法重置文件夹。

namelist -- 迭代返回压缩包中的文件
import zipfile

with zipfile.ZipFile(r'D:\test.zip') as zf:
res = zf.namelist()
print(res)
# ['10-中日欧美信息解析/', '10-中日欧美信息解析/1-代码/', ...]
infolist -- 迭代返回压缩包中的文件信息

比如文件的权限等。

printdir -- 查看压缩包中的文件的信息

查看压缩包中的文件信息,比如文件的大小、创建日期等。默认查看所有的文件。

语法:printdir(file=None)

tar包 和 gz、bz2、xz格式

import tarfile

tarfile的使用和文件操作更加的相似,只是在压缩模式上略有不同。

使用linux系统的朋友都知道,tar是Linux的一种打包方式,打包成为tar包之后,才可以使用其它的压缩程序去压缩。最常用的压缩方式是gzip,压缩率最高的方式bzip2,此外还支持另一种比较小众的xzip格式。

主要操作方法为tarfile.TarFile.open(),可以直接tarfile.open()

语法:open(name, mode='r')

当初在学习的时候,老师还教有encoding='UTF-8'参数,但是文件操作要什么编码格式?感觉他是为了方便直接从文件操作的代码上直接复制过来的,然后没有删掉。

操作tar包

模式为rwax四种为主,外加使用add方法写入文件,退出依然使用close方法。

add(name, arcname)

add(压缩文件,压缩别名)

注意,压缩别名一定不要以路径分隔符为结尾,否则只会创建一个文件夹。

import tarfile

with tarfile.open('test.tar', 'w') as tf:
tf.add('test.txt')
压缩

压缩的方式主要是将模式改变,在rwx的基础上加上各个压缩的方式,变成:r:gzw:bz2x:xz等样式,然后在将刚才创建的tar包压缩,当然也可以直接将文件压缩成为压缩包。

注意,a模式不能配备任何压缩模式,因为gzip、bzip2、xzip不能直接往里面追加文件,所以如果要追加文件,将tar包解压缩出来,然后追加再压缩。

import tarfile

# tar包以gzip格式压缩
with tarfile.open('test.tar.gz', 'w:gz') as tf:
tf.add('test.tar')
解压缩

tarfile的解压缩方法和zipfile的一模一样。

方法 含义
extract 解压缩指定文件
extractall 解压缩所有文件
getnames -- 返回压缩包中的文件(list)

删除压缩包中的文件

zipfile和tarfile不支持删除压缩包中的文件,所以如果有需要删除压缩包中的文件,可以将压缩包解压出来,然后删除其中的文件,再压缩。

python常用标准库(压缩包模块zipfile和tarfile)的更多相关文章

  1. python常用标准库(os系统模块、shutil文件操作模块)

    常用的标准库 系统模块 import os 系统模块用于对系统进行操作. 常用方法 os模块的常用方法有数十种之多,本文中只选出最常用的几种,其余的还有权限操作.文件的删除创建等详细资料可以参考官方文 ...

  2. python常用标准库(math数学模块和random随机模块)

    常用的标准库 数学模块 import math ceil -- 上取整 对一个数向上取整(进一法),取相邻最近的两个整数的最大值. import math res = math.ceil(4.1) p ...

  3. Python常用标准库(pickle序列化和JSON序列化)

    常用的标准库 序列化模块 import pickle 序列化和反序列化 把不能直接存储的数据变得可存储,这个过程叫做序列化.把文件中的数据拿出来,回复称原来的数据类型,这个过程叫做反序列化. 在文件中 ...

  4. python常用标准库(时间模块 time和datetime)

    常用的标准库 time时间模块 import time time -- 获取本地时间戳 时间戳又被称之为是Unix时间戳,原本是在Unix系统中的计时工具. 它的含义是从1970年1月1日(UTC/G ...

  5. python 常用标准库

    标准库和第三方库第一手资料: 在线: 官方文档(https://docs.python.org/) 离线:交互式解释器(dir().help()函数),IPython(tab键提示.?.??) 一.  ...

  6. python常用标准库

    -------------------系统内建函数------------------- 1.字符串     str='这是一个字符串数据测试数据'对应     str[0]:获取str字符串中下标为 ...

  7. Python常用标准库之datetime、random、hashlib、itertools

    库:具有相关功能模块的集合 import sys.builtin_module_names #返回内建模块的名字modules 查看所有可用模块的名字 1.1.1获取当前日期和时间 from date ...

  8. python常用函数库及模块巧妙用法汇总

    在用python编写脚本或写程序过程中总要遇到一些对大文件或数据进行排序,计算,循环跌代等.我想下面这些函数库一定能用得到,总结如下:便于以后备查 列表去重(传说是列表去重最高效的方法): al = ...

  9. Python的标准库介绍与常用的第三方库

    Python的标准库介绍与常用的第三方库 Python的标准库: datetime:为日期和时间的处理提供了简单和复杂的方法. zlib:以下模块直接支持通用的数据打包和压缩格式:zlib,gzip, ...

随机推荐

  1. PyQt5 基本语法(四)

    目录 2. 输入控件(一) 2.1 纯键盘 2.1.1 QLineEdit 2.1.1.1 描述 2.1.1.2 控件创建 2.1.1.3 输出模式 2.1.1.4 提示字符串 2.1.1.5 清空按 ...

  2. 线程的概念及Thread模块的使用

    线程 一.什么是线程? 我们可以把进程理解成一个资源空间,真正被CPU执行的就是进程里的线程. 一个进程中最少会有一条线程,同一进程下的每个线程之间资源是共享的. 二.开设线程的两种方式 开设进程需要 ...

  3. Blazor 在开发环境保存机密(User Secrets)

    前言 在应用程序开发的过程中,有的时候需要在代码中保存一些机密的信息,比如微信appkey, 连接字符串,加密密钥,字符串,或者是用户名密码等.通常的做法是保存到一个配置文件中,例如 appsetti ...

  4. .NET 6 史上最全攻略

    欢迎使用.NET 6.今天的版本是.NET 团队和社区一年多努力的结果.C# 10 和F# 6 提供了语言改进,使您的代码更简单.更好.性能大幅提升,我们已经看到微软降低了托管云服务的成本..NET ...

  5. Python 康德乐大药房网站爬虫,使用bs4获取json,导入mysql

    自学两天,写个low点的爬虫代码.自己获取商品价格接口的过程,使用软件 Fiddler 进行抓包进行分析.调用接口进行异常判断

  6. 1.5 Linux中大量使用脚本语言,而不是C语言!

    说到在 Linux 下的编程,很多人会想到用C语言,Linux 的内核.shell.基础命令程序,也的确是用C语言编写的,这首先证明了一点,C语言很强很通用. 到目前为止,C语言依然垄断着计算机工业中 ...

  7. grafana v8.0+ 隐藏表格字段

    Select panel title → Inspect → Panel JSON Set "type" to "table-old" Apply The vi ...

  8. 【Pandas vs SQL】数据分析代码逐行比对,孰优孰劣?

    在数据分析领域,pandas是python数据分析基础工具,SQL是数据库最常用分析语言.二者有相通的地方,也有很大的语法不同,做起数据分析来,谁将更胜一筹呢? 做过业务开发.跟数据库打交道比较多的小 ...

  9. Nginx代理websocket为什么要这样做?

    Nginx反向代理websocket 示例: http { map $http_upgrade $connection_upgrade { default upgrade; '' close; } s ...

  10. 羽夏 MakeFile 简明教程

    写在前面   此系列是本人一个字一个字码出来的,包括示例和实验截图.该文章根据 GNU Make Manual 进行汉化处理并作出自己的整理,一是我对 Make 的学习记录,二是对大家学习 MakeF ...