Python标准库pathlib及实例操作

https://docs.python.org/zh-cn/3.9/library/pathlib.html 官网

讲的比较好的文章 https://zhuanlan.zhihu.com/p/139783331

简介

  • 该模块提供表示文件系统路径的类,其语义适用于不同的操作系统

优点(对比os.path)

  • 老的路径操作函数管理比较混乱,有的是导入 os, 有的又是在 os.path 当中,而新的用法统一可以用 pathlib 管理。
  • 老用法在处理不同操作系统 win,mac 以及 linux 之间很吃力。换了操作系统常常要改代码,还经常需要进行一些额外操作。
  • 老用法主要是函数形式,返回的数据类型通常是字符串。但是路径和字符串并不等价,所以在使用 os 操作路径的时候常常还要引入其他类库协助操作。新用法是面向对象,处理起来更灵活方便。
  • pathlib 简化了很多操作,用起来更轻松

详解

获取文件路径

  • 语法

    Path(__file__)   #__file__是当前文件的绝对路径
    
    Path(__file__).parent  #所在目录
    Path(__file__).parent.parent #所在目录的父目录 Path(文件的相对路径)
    Path(__file__).resolve() #仍然可以得到绝对路径 Path(__file__).parent / 'filename' #目录拼接文件名 用/
  • 示例1

    from pathlib import Path
    print(Path.cwd()) #你当前py文件的所在目录,类似于pwd
    print(Path.home()) #你当前用户的家目录(windows比如C:\Users\用户名)
  • 示例2

    # demo_pathlib.py
    from pathlib import Path
    file_abs_path = Path(__file__)
    print('对象类型是: ',type(file_abs_path)) #pathlib.WindowsPath
    print('当前文件的绝对路径:',file_abs_path)
    file_relative_path = Path('demo_pathlib.py')
    print('当前文件的相对路径:',file_relative_path)
    print('当前文件的绝对路径(另外一种写法):',file_relative_path.resolve()) parent_dir = Path(__file__).parent #还可以继续.parent,相当于cd ..和cd ../..
    print('当前文件的父目录:',parent_dir)
    print('路径拼接用/(忽略操作系统差异): ',parent_dir / file_relative_path) #
  • 注意

    • 不管字符串使用的是正斜杠 / 还是反斜杠 \, 在 windows 系统里,得到的路径都是反斜杠\, pathlib 会根据操作系统智能处理

获取路径组成部分

from pathlib import Path
saolei_apk = Path(r'd:\com.kejia.mine.apk')
print(saolei_apk.name)
属性 说明
name 文件名,包含后缀名,如果是目录则获取目录名
stem 文件名,不包含后缀。
suffix 后缀,比如 .txt, .png
parent 父级目录,相当于 cd ..
anchor 锚,目录前面的部分 C:\ 或者 /
  • 多级目录

    from pathlib import Path
    saolei_apk = Path(r'D:\software\aDrive\locales\am.pak')
    for parent in saolei_apk.parents:
    print(parent)
    D:\software\aDrive\locales
    D:\software\aDrive
    D:\software
    D:\
    • 如果是os模块,要获取其父目录用的是os.path.dirname(),多级目录的话就麻烦,对比一下

      import os
      os_saolei_apk_dir = os.path.dirname(r'D:\software\aDrive\locales\am.pak')
      print(os_saolei_apk_dir)
      os_saolei_apk_parent_dir = os.path.dirname(os.path.dirname(r'D:\software\aDrive\locales\am.pak'))
      print(os_saolei_apk_parent_dir) from pathlib import Path
      pathlib_saolei_apk = Path(r'D:\software\aDrive\locales\am.pak')
      print(pathlib_saolei_apk.parent)
      print(pathlib_saolei_apk.parent.parent) #就相当于cd..多次
      print(pathlib_saolei_apk.parents[1]) #你还可以用parents,注意0是第一层所在目录,1是父目录,2是爷目录....

获取文件属性

from pathlib import Path

saolei_apk = Path(r'd:\com.kejia.mine.apk')
print(saolei_apk.stat())
#os.stat_result(st_mode=33206, st_ino=562949953558668, st_dev=3393479561, st_nlink=1, st_uid=0, st_gid=0, st_size=698179, st_atime=1648601046, st_mtime=1631589296, st_ctime=1631952752) mtime = saolei_apk.stat().st_mtime
print(arrow.get(mtime).format('YYYY-MM-DD HH:MM:SS'))
属性 说明
st_mode 权限模式
st_ino inode number
st_dev device
st_nlink 硬链接数
st_uid 所属用户的user id
st_gid 所属用户的group id
st_size 文件的大小,以位为单位
st_atime 文件访问时间
st_mtime 文件修改时间
st_ctime 文件创建时间
  • 注意3个时间都是时间戳,要获取好看的时间就用arrow(详见我的另外一篇博文Python第三方库_arrow)来获取。

文件(夹)操作

  • 慎用!推荐用shutil

  • 示例

    from pathlib import Path
    newfile = Path(r'D:\20220402.txt')
    if not newfile.exists():
    print('创建文件')
    newfile.touch(exist_ok=False)
    else:
    print('删除文件')
    newfile.unlink()
操作 说明
exists() 是否存在
is_dir() 是否是文件
is_file() 是否是目录
touch(mode=0o666, exist_ok=True) 创建文件,默认权限666,如果exist_ok为True,文件存在不做任何事情,若为False,文件存在执行touch会报错FileExistsError
unlink() 删除文件!危险操作!
rmdir() 删除目录非常危险,并且没有提示,一定要谨慎操作。一次只删除一级目录,且当前目录必须为空
mkdir() 创建目录
read_text() 读文件内容,不再需要重复去打开文件和管理文件的关闭了,下同
read_bytes() 读取bytes
write_text 写入文本,注意是w 模式,如果之前已经有文件内容,将会被覆盖
write_bytes 写入bytes
replace(文件新路径) 移动文件
  • 重命名

    txt_path = Path('archive/demo.txt')
    new_file = txt_path.with_name('new.txt')
    txt_path.replace(new_file)
  • 改后缀

    txt_path = Path('archive/demo.txt')
    new_file = txt_path.with_suffix('.json')
    txt_path.replace(new_file)

实例

批量移动

  • 现在有这个目录

    E:\test (6.5KB)
    +-- 1 (6.5KB)
    | +-- 1.txt (0b)
    | `-- 1.xls (6.5KB)
    `-- 2
    `-- 2.txt (0b)
  • 移动所有子目录下的.txt文件到E:\test这个根目录下

    from pathlib import Path
    def move_file_to(srcdir,dstdir,file_pattern):
    file = Path(srcdir).rglob(file_pattern)
    for _ in file:
    Path(_).replace(Path(dstdir) / Path(_).name) move_file_to(srcdir=r'e:\test',dstdir=r'e:\test',file_pattern='*.txt')

批量修改后缀

  • 还是上面的目录结构

    E:\test (6.5KB)
    +-- 1 (6.5KB)
    | +-- 1.txt (0b)
    | `-- 1.xls (6.5KB)
    `-- 2
    `-- 2.txt (0b)
    from pathlib import Path
    def change_suffix(dst_dir,old_suffix,new_suffix):
    file = Path(dst_dir).rglob('*.'+old_suffix)
    if list(file):
    for _ in file:
    new_ = Path(_).with_suffix('.'+new_suffix)
    Path(_).replace(new_)
    else:
    raise Exception(f'file-type:{old_suffix} not found(recursive) in {dst_dir}')
    change_suffix(dst_dir=r'e:\test',old_suffix='txt',new_suffix='docx')
  • 修改后

    $ tree
    E:\test (6.5KB)
    +-- 1 (6.5KB)
    | +-- 1.docx (0b)
    | `-- 1.xls (6.5KB)
    `-- 2
    `-- 2.docx (0b)
    • rglob是递归,glob只会找一个目录下
    • glob得到的是一个生成器,可以用list来转化成列表

统计目录下的文件类型

  • 还是刚才的目录结构

    E:\test (6.5KB)
    +-- 1 (6.5KB)
    | +-- 1.txt (0b)
    | `-- 1.xls (6.5KB)
    `-- 2
    `-- 2.txt (0b)
  • 示例代码

    import collections
    from pathlib import Path
    path = Path(r'e:\test\1')
    files = [f.suffix for f in path.iterdir() if f.is_file()]
    print(dict(collections.Counter(files))) #{'.txt': 1, '.xls': 1}
  • 但是上面的代码不能递归,就是当前目录下的文件的类型

  • 改造一下

    import collections
    from pathlib import Path
    path = Path(r'e:\test')
    files = [f.suffix for f in path.rglob('*.*') if f.is_file()]
    print(dict(collections.Counter(files)))

统计某个目录下最近修改的文件

  • 转载知乎原文的代码

    from pathlib import Path
    path = Path.cwd()
    print(max(
    [(f.stat().st_mtime, f)
    for f in path.iterdir()
    if f.is_file()]
    ))
    • 也不能递归,你知道怎么改吗?

Python标准库pathlib及实例操作的更多相关文章

  1. python第六天 函数 python标准库实例大全

    今天学习第一模块的最后一课课程--函数: python的第一个函数: 1 def func1(): 2 print('第一个函数') 3 return 0 4 func1() 1 同时返回多种类型时, ...

  2. 一个超好用的 Python 标准库,彻底玩透路径操作

    pathlib 学习 Python 时,尤其是在进行文件操作和数据处理时,经常会处理路径问题.最常用和常见的是 os.path 模块,它将路径当做字符串进行处理,如果使用不当可能导致难以察觉的错误,而 ...

  3. python标准库之字符编码详解

    codesc官方地址:https://docs.python.org/2/library/codecs.html 相关帮助:http://www.cnblogs.com/huxi/archive/20 ...

  4. [python标准库]Pickle模块

    Pickle-------python对象序列化 本文主要阐述以下几点: 1.pickle模块简介 2.pickle模块提供的方法 3.注意事项 4.实例解析 1.pickle模块简介 The pic ...

  5. Python 标准库一览(Python进阶学习)

    转自:http://blog.csdn.net/jurbo/article/details/52334345 写这个的起因是,还是因为在做Python challenge的时候,有的时候想解决问题,连 ...

  6. Python标准库笔记(9) — functools模块

    functools 作用于函数的函数 functools 模块提供用于调整或扩展函数和其他可调用对象的工具,而无需完全重写它们. 装饰器 partial 类是 functools 模块提供的主要工具, ...

  7. Python 标准库之 xml.etree.ElementTree

    Python 标准库之 xml.etree.ElementTree Python中有多种xml处理API,常用的有xml.dom.*模块.xml.sax.*模块.xml.parser.expat模块和 ...

  8. Python标准库、第三方库和外部工具汇总

    导读:Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库.函数和外部工具.其中既有Python内置函数和标准库,又有第三方库和工具. 这些库可用于文件读写.网络抓取和解析.数据连 ...

  9. Python 标准库、第三方库

    Python 标准库.第三方库 Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库.函数和外部工具.其中既有Python内置函数和标准库,又有第三方库和工具.这些库可用于文件读写 ...

  10. 140种Python标准库、第三方库和外部工具

    导读:Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库.函数和外部工具.其中既有Python内置函数和标准库,又有第三方库和工具. 这些库可用于文件读写.网络抓取和解析.数据连 ...

随机推荐

  1. Java8新特性—四大内置函数式接口

    Java8新特性--四大内置函数式接口 预备知识 背景 Lambda 的设计者们为了让现有的功能与 Lambda 表达式良好兼容,考虑了很多方法,于是产生了函数接口这个概念. 什么是函数式接口? 函数 ...

  2. 干货,深入剖析ReentrantLock源码,推荐收藏

    ReentrantLock和Synchronized都是Java开发中最常用的锁,与Synchronized这种JVM内置锁不同的是,ReentrantLock提供了更丰富的语义.可以创建公平锁或非公 ...

  3. 操作系统课程设计pintos project1实验摘记

    第一部分 项目概述 一.Pintos简介 Pintos是一个基于80x86架构的简单操作系统框架,它支持内核级线程.能够加载和运行用户程序,也拥有文件系统,不过,这些功能均以一种简单的形式实现. 二. ...

  4. 为什么你的static_assert不能按预期的工作?

    static_assert是c++11添加的新语法,它可以使我们在编译期间检测一些断言条件是否为真,如果不满足条件将会产生一条编译错误信息. 使用静态断言可以提前暴露许多问题到编译阶段,极大的方便了我 ...

  5. php + layui 文件上传 以及 拖拽上传

    HTML: <div id="box"> <div id="drop_area">将文件拖拽到此区域</div> <d ...

  6. CopyOnWriteArrayList 是如何保证线程安全的?

    本文已收录到 AndroidFamily,技术和职场问题,请关注公众号 [彭旭锐] 提问. 前言 大家好,我是小彭. 在上一篇文章里,我们聊到了ArrayList 的线程安全问题,其中提到了 Copy ...

  7. 在链表上实现 Partition 以及荷兰国旗问题

    在链表上实现 Partition 以及荷兰国旗问题 作者:Grey 原文地址: 博客园:在链表上实现 Partition 以及荷兰国旗问题 CSDN:在链表上实现 Partition 以及荷兰国旗问题 ...

  8. 在Linux配置git

    生成ssh ssh-keygen -t rsa 可以不设置密码,一路回车就行,会在 ~/.ssh/下生成两个ssh key: ssh-add ~/.ssh/id_rsa.pub 这一步是使用刚才生成那 ...

  9. linux配置 python 开发环境sublime text及一些使用心得

    前言 一直以来我都使用 sublime text 作为主流开发的 ide ,但其实我开始在我的 linux mint 系统使用 sublime text 配置 python3 的开发环境踩过的坑又何止 ...

  10. 喜欢用Map却从未遭遇内存泄露的Java程序员上辈子都是神仙

    前言 点进来这篇文章的大概有两种人,一种是喜欢用Map的想看看自己是不是有可能也会踩雷,一种是不喜欢用Map的想进来看看那些喜欢用的人是怎么踩雷的. 那你要失望了,我只是单纯把公司最近代码审查时一个关 ...