"""
要求:
1.读取cdm文件的所有子文件夹,然后每个文件夹里面是抽出一个一个mp3后缀的文件。
遍历所有的子文件,然后将这些mp3文件,保存到一个新的文件夹。文件夹后缀是当前文件的年代的
基础加后缀_single,例如:来自2000年文件夹就命名2000_single。
"""
import shutil
import pathlib
import pprint
from typing import List, Generator, Iterable, Tuple
from itertools import chain, islice
import os
from concurrent.futures import ThreadPoolExecutor, ProcessPoolExecutor
from functools import partial
import traceback
import time
from multiprocessing import cpu_count DIR_PATH = pathlib.Path("/Users/chennan/CDM")
MAX_CONCCURENT = cpu_count() * 4 - 2 def multiple_file_types(file_path: Generator, *patterns: Tuple[str]) \
-> Iterable:
"""
因为glob不支持多个匹配规则,所以这里做一个适配。
:param file_path: 文件的路径
:param patterns: 匹配规则
:return:
"""
return (file_path.glob(pattern) for pattern in patterns) def get_all_list_by_year(y: str) -> Generator:
"""
:param y: 年代
:return: 返回结果迭代器类型
"""
file_path = DIR_PATH / y
result = file_path.glob("*")
return result def get_mp3_list(cdm_path: str) -> Generator:
"""
获取当前文件下面的所有音频文件,mp3,wav,ape,flac等
:param cdm_path:专辑的路径
:return:
"""
mp3_gen = multiple_file_types(cdm_path, *("*.mp3", "*.ape", "*.wav", "*.flac"))
return mp3_gen def select_mp3(y: str) -> List[pathlib.Path]:
"""
:param y:
:return:
"""
selected_mp3_list = []
sa = selected_mp3_list.append
cdm_list = get_all_list_by_year(y)
for dir_path in cdm_list:
mp3_gen = get_mp3_list(dir_path)
try:
single = mp3_gen.send(None)
sa(list(single)[0])
except StopIteration as e:
pass
except IndexError as e:
pass
return selected_mp3_list def create_target_file(y):
target = DIR_PATH / f"{y}_new"
if not os.path.exists(target):
os.makedirs(target)
return target def copy_file_to_new_path(source, y, target):
"""
shutil复制文件
:return:
"""
try:
shutil.copy(source, target / source.name)
except Exception as e:
print(traceback.format_exc()) if __name__ == '__main__':
start = time.time()
year = "2000"
mp3_list = select_mp3(year)
target = create_target_file(year)
if target:
with ThreadPoolExecutor(max_workers=MAX_CONCCURENT) as pool:
pool.map(partial(copy_file_to_new_path, y=year, target=target), mp3_list)
print(f"并发{MAX_CONCCURENT}次,用时", time.time() - start) #关于并发的问题有待观察。。。
# 线程池并发结果
# 并发2次,用时 6.518146991729736
# 并发10次,用时 7.732945919036865
# 并发30次,用时 7.956831932067871
# 并发100次,用时 7.956831932067871 # 进程池并发结果
# 并发2次,用时 6.013077974319458
# 并发8次,用时 6.863225221633911
# 并发14次,用时 4.6188788414001465
# 并发30次,用时 4.858534812927246

Python选择指定文件夹的文件然后复制出其中几个文件到新的文件夹的更多相关文章

  1. XCopy复制文件夹命令及参数详解以及xcopy拷贝目录并排除特定文件

    XCOPY是COPY的扩展,可以把指定的目录连文件和目录结构一并拷贝,但不能拷贝系统文件:使用时源盘符.源目标路径名.源文件名至少指定一个:选用/S时对源目录下及其子目录下的所有文件进行COPY.除非 ...

  2. [转帖]XCopy复制文件夹命令及参数详解以及xcopy拷贝目录并排除特定文件

    XCopy复制文件夹命令及参数详解以及xcopy拷贝目录并排除特定文件 https://www.cnblogs.com/smartsmile/p/7665979.html xcopy dirA dir ...

  3. Eclipse设置所有新创建文件默认格式为UTF-8

    一.为什么需要设置所有新创建文件默认格式为UTF-8 Eclipse编码默认是ISO-8859-1,不支持中文.而很多时候,我们的文件中含有中文,或者需要在创建文件时就需要是UTF-8编码格式的.在创 ...

  4. zzw原创_根据某一文件复制出大量固定位数后缀名的递增的文件

    1.trre.sh   :根据某一文件复制出大量固定位数后后缀递增的文件.   如将 SPINFO_190516_20170109.001 复制成SPINFO_190516_20170109.002  ...

  5. Python压缩指定文件及文件夹为zip

    Python压缩指定的文件及文件夹为.zip 代码: def zipDir(dirpath,outFullName): """ 压缩指定文件夹 :param dirpat ...

  6. Python——合并指定文件夹下的所有excel文件

    前提:该文件夹下所有文件有表头且具有相同的表头. import glob # 同下 from numpy import * #请提前在CMD下安装完毕,pip install numppy impor ...

  7. python实现指定目录下批量文件的单词计数:并发版本

    在 文章 <python实现指定目录下批量文件的单词计数:串行版本>中, 总体思路是: A. 一次性获取指定目录下的所有符合条件的文件 -> B. 一次性获取所有文件的所有文件行 - ...

  8. Python学习笔记(20)-文件和文件夹的移动、复制、删除、重命名

    一,概述 python中对文件和文件夹进行移动.复制.删除.重命名,主要依赖os模块和shutil模块,要死记硬背这两个模块的方法还是比较困难的,可以用一个例子集中演示文件的移动.复制.删除.重命名, ...

  9. python 读取指定文件信息并拼接

    python 读取指定文本并拼接成指定的格式 # -*- coding: utf-8 -*- import os def getHelloWorld(path, fileName): "&q ...

随机推荐

  1. 华为机试题:仿LISP

    package com.nowcoder.huawei; import java.util.*; public class LISP { // 只通过80% // (+ (* 2 3) (^ 4)) ...

  2. 垃圾分类常见APP

    垃圾分类指南app 上海就要实行垃圾分类了,垃圾分类指南app你需要吗,这里有相关的各种垃圾分类的介绍与上海垃圾分类投放指南,这里是垃圾分类指南手机入口能够让你更好的去完成垃圾分类呢.垃圾分类指 .. ...

  3. 安卓开发之sql语句增删改查2(利用谷歌封装好的API进行增删改查)

    <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android=&quo ...

  4. SQL优化的总结和一些避免全盘扫描的注意事项

    1.应尽量避免在 where 子句中使用 != 或 <> 操作符,否则将引擎放弃使用索引而进行全表扫描. 2.应尽量避免在 where 子句中使用 or 来连接条件,如果一个字段有索引,一 ...

  5. 【atcoder】GP 2 [agc036C]

    题目传送门:https://atcoder.jp/contests/agc036/tasks/agc036_c 题目大意:给你一个长度为$N$初始全0的序列,每次操作你可以找两个不同的元素,一个自增1 ...

  6. oracle内核参数详解

    一.前言 在生产中,我们安装oracle数据库时,为达到最优我们需要对操作系统的内核参数进行一定的调整.主要从内存.cpu.io以及网络等方面,根据实际情况进行调整.以下参数可供大家参考,如有不当之处 ...

  7. idea自动在文件头中添加作者和创建时间

    设置路径 : File -> Settings -> Editor -> File and Code Templates 定制头模板: /** * @Author: chancy * ...

  8. 十三:MVC-HTML辅助方法-输出表单

    ASP.NET MVC框架内置多个表单相关的HTML辅助方法 HTML辅助方法 说明 Html.BeginForm() 输出<form>标签 Html.CheckBox() 输出<i ...

  9. 10_Hive自定义函数UDF

    Hive官方的UDF手册地址是:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF 1.使用内置函数的快捷方法: 创 ...

  10. JSON 对象和字符串

    JSON 对象和字符串 粘贴自:https://www.cnblogs.com/cstao110/p/3762056.html Q:什么是"JSON字符串",什么是"JS ...