Python开发【笔记】：从海量文件的目录中获取文件名--方法性能对比

Python获取文件名的方法性能对比

前言：平常在python中从文件夹中获取文件名的简单方法 os.system('ll /data/') 但是当文件夹中含有巨量文件时，这种方式完全是行不通的；

在/dd目录中生成了近6百万个文件，接下来看看不同方法之间的性能对比快速生成文件的shell脚本

for i in $(seq 1 1000000);do echo text >>$i.txt;done

1、系统命令 ls -l

# 系统命令 ls -l

import time

import subprocess

start = time.time()

result = subprocess.Popen('ls -l /dd/', stdout=subprocess.PIPE,shell=True)

for file in result.stdout:

    pass

print(time.time()-start)

# 直接卡死

2、glob 模块

# glob 模块

import glob

import time

start = time.time()

result = glob.glob("/dd/*")

for file in result:

    pass

print(time.time()-start)

# 49.60481119155884

3、os.walk 模块

# os.walk 模块

import os

import time

start = time.time()

for root, dirs, files in os.walk("/dd/", topdown=False):

        pass

print(time.time()-start)

# 8.906772375106812

4、os.scandir 模块

# os.scandir 模块

import os

import time

start = time.time()

path = os.scandir("/dd/")

for i in path:

    pass

print(time.time()-start)

# 4.118424415588379

5、shell find命令

# shell find命令

import time

import subprocess

start = time.time()

result = subprocess.Popen('find /dd/', stdout=subprocess.PIPE,shell=True)

for file in result.stdout:

    pass

print(time.time()-start)

# 6.205533027648926

6、shell ls -1 -f 命令不进行排序

# shell ls -1  -f 命令

import time

import subprocess

start = time.time()

result = subprocess.Popen('ls -1 -f /dd/', stdout=subprocess.PIPE,shell=True)

for file in result.stdout:

    pass

print(time.time()-start)

# 3.3476643562316895

7、os.listdir

# os.listdir

import os

import time

start = time.time()

result = os.listdir('/dd')

for file in result:

    pass

print(time.time()-start)

# 2.6720399856567383

Python开发【笔记】：从海量文件的目录中获取文件名--方法性能对比的更多相关文章

python学习笔记八：文件与目录
一.文件的打开和创建 1.打开 open(file,mode): >>>fo = open('test.txt', 'r') >>>fo.read() 'hello ...
Java学习-043-获取文件在目录中的路径
我们在日常的电脑使用中,经常需要在当前目录或当期目录及其子目录中查找文件,并获取相应的文件路径名.在我们的自动化测试中,也经常需要确认文件在目录中是否成功生成或已存在,因而我写了一个小方法来实现. 获 ...
python笔记4-遍历文件夹目录os.walk()
前言如何遍历查找出某个文件夹内所有的子文件呢?并且找出某个后缀的所有文件 walk功能简介 1.os.walk() 方法用于通过在目录树种游走输出在目录中的文件名,向上或者向下. 2.walk()方 ...
Java开发笔记（序）章节目录
现将本博客的Java学习文章整理成以下笔记目录,方便查阅. 第一章初识JavaJava开发笔记(一)第一个Java程序Java开发笔记(二)Java工程的帝国区划Java开发笔记(三)Java帝国的 ...
lib/sqlalchemy/cextension/processors.c:10:20: 致命错误： Python.h：没有那个文件或目录
本文地址:http://www.cnblogs.com/yhLinux/p/4063444.html $ sudo easy_install sqlalchemy [sudo] password fo ...
致命错误： Python.h：没有那个文件或目录
In file included from greenlet.c:5:0: greenlet.h:8:20: 致命错误: Python.h:没有那个文件或目录编译中断. error: Setup s ...
Python开发【第一篇】：目录
本系列博文包含 Python基础.前端开发.Web框架.缓存以及队列等,希望可以给正在学习编程的童鞋提供一点帮助!!! Python开发[第一篇]:目录 Python开发[第二篇]:初识Python ...
Python基于Python实现批量上传文件或目录到不同的Linux服务器
基于Python实现批量上传文件或目录到不同的Linux服务器 by:授客 QQ:1033553122 实现功能 1 测试环境 1 使用方法 1 1. 编辑配置文件conf/rootpath_fo ...
解决 Python.h：没有那个文件或目录错误的方法
http://www.cnblogs.com/yuxc/archive/2012/05/13/2498019.html ———————————————————————————————————————— ...

随机推荐

JVM——Java HotSpot VM Options
JVM常用参数参数名称含义默认值描述 -Xms 初始堆大小物理内存的1/64(<1GB) 默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时,JVM就会增大堆 ...
linux基础知识【转】
linux目录架构 / 根目录 /bin 常用的命令 binary file 的目錄 /boot 存放系统启动时必须读取的档案,包括核心 (kernel) 在内 /boot/grub/menu.lst ...
30. Substring with Concatenation of All Words
题目: You are given a string, s, and a list of words, words, that are all of the same length. Find all ...
Fedora Server 21 安装搜狗拼音输入法
最新文章:Virson’s Blog 借鉴文章:博客园-怒杀神殿 ChinaUnix-firo 百度贴吧-fedora吧方法一:解压deb安装包方式安装: 如果本机已安装ibus,需要先卸载, ...
关于Solaris 的磁盘的分区
也许是深受LINUX Windows fdisk 影响,每次看完Solaris的format命令,总是云里雾里.我今天总结一下,各位给点指点一. Linux.Windows 传统的磁盘区层级, ...
MATLAB plot()、scatter()的RGB颜色设置以及生成渐变色
1.转载:https://blog.csdn.net/wh1312142954/article/details/80796764 plot(x,y,'Color',[R G B]);%只要设置颜色中R ...
WebView与 JS 交互方式
前言现在很多App里都内置了Web网页(Hybrid App),比如说很多电商平台,淘宝.京东.聚划算等等,如下图上述功能是由Android的WebView实现的,其中涉及到Android客户端与 ...
DOS、Mac 和 Unix 文件格式+ UltraEdit使用
文件格式区分DOS.Mac 和 Unix分别对应三种系统从文件编码的方式来看,文件可分为ASCII码文件和二进制码文件两种文件模式区分ASCII模式和Binary模式通常由系统决定,大多数 ...
使用Android拨打电话功能
1.要使用Android系统中的电话拨号功能,首先必须在AndroidManifest.xml功能清单中加入允许拨打电话的权限: <uses-permission android:name=&q ...
【hadoop】 hdfs shell 命令交互
1.put 本地文件上传至hdfs中 2. cat 查看内容 3. 删除文件,文件夹 4. ls 5. copyFromLocal 复制本地文件到HDFS , copyToLocal hdfs 复制到 ...

Python开发【笔记】：从海量文件的目录中获取文件名--方法性能对比

Python获取文件名的方法性能对比

Python开发【笔记】：从海量文件的目录中获取文件名--方法性能对比的更多相关文章

随机推荐

热门专题