python 检索文件内容工具
公司内部需求一个工具检索目录下的文件在另外的目录中使用次数, 用来优化包体的大小。
此代码效率并不高效, 另添加对应的 后缀检索。 用python 实现比较快速, 另还有缺点是只支持 utf-8 格式内容。
各位用到的可以自己摘一下。
(本人习惯使用c\c++,目前发现这种脚本类的确实实现方便,接口齐全, 我能想到的接口, 真的全都有, 用python 写工具, 应该是一个调试起来还可以的过程)
代码如下:
#coding=utf-8 import os
import sys
import time #private:
def checkSuffix(strFileName, strCompareSuffix):
strPreFileName = ''
strFileSuffix = ''
bIsCheckOk = False
strArray = strFileName.split('.')
if len(strArray) > 1:
strPreFileName = strArray[0]
strFileSuffix = strArray[1]
#print(strFileSuffix)
#print(strCompareSuffix)
if strCompareSuffix == '*' or strFileSuffix == strCompareSuffix:
bIsCheckOk = True
return bIsCheckOk, strPreFileName def readFileName(file_dir):
for root, dirs, files in os.walk(file_dir):
return files,dirs, root
return '', '', '' def findString(pathFile, findKey):
#print("open pathFile:", pathFile)
fp = open(pathFile, "r", encoding='utf-8')
strr = fp.read()
if(strr.find(findKey) != -1):
return True
return False def startFind(files, dirs, root, findKey, strSuffix):
for fileName in files:
try:
bIsCheckOk, strPreFileName = checkSuffix(fileName, strSuffix)
if bIsCheckOk == False:
#print("fileName", fileName, " is not suffx :", strSuffix)
continue
if(findString(root + "\\" + fileName, findKey)):
return True, fileName
except Exception as err:
continue for jj in dirs:
fi, di, ro = readFileName(root + jj)
bIsFind, fileName = startFind(fi, di, ro, findKey, strSuffix)
if(bIsFind == True):
return bIsFind, fileName
return False, '' #public:
def findUse(dirPath, findKey, strSuffix):
files, dirs, root = readFileName(dirPath)
return startFind(files, dirs, root, findKey, strSuffix) def getDirsFiles(dirPath):
dirfiles = [];
for root, dirs, files in os.walk(dirPath):
dirfiles += files;
return dirfiles def writeResult(strFileName, strWriteSign, list):
fp = open(strFileName, 'a+')
fp.write(strWriteSign)
#fp.writelines(list)
for str in list:
fp.write(str)
fp.write('\n')
fp.close() if __name__ == '__main__':
"""
findDir = u"E:\\mmo2018001\\artist\\open\\ui\\free\\"
findAimDir = u"E:\\mmo2018001\\artist\\open\\effect\\"
findsuffix = "prefab" # 哪些要搜索的文件的后缀
findAimsuffix = "*" # 搜索那些后缀的文件
"""
bt = time.clock() # 记录时间 findDir = sys.argv[1]
findAimDir = sys.argv[2]
findsuffix = sys.argv[3]
findAimsuffix = sys.argv[4] thisPath = os.getcwd()
print("this path is ", thisPath)
print(findDir)
print(findAimDir)
print(findsuffix)
print(findAimsuffix) dirFiles = getDirsFiles(findAimDir)
useFiles = []
notUseFiles = []
nLen = len(dirFiles)
i = 0
for filesName in dirFiles : bIsCheckOk, strPreFileName = checkSuffix(filesName, findsuffix)
if bIsCheckOk == True:
isFind, fileName = findUse(findDir, strPreFileName, findAimsuffix)
#print("filesName:\t", filesName, " \nIsFind:\t\t", isFind)
if(isFind):
useFiles.append(filesName)
else:
notUseFiles.append(filesName)
i += 1
p = round(i * 100 / nLen)
duration = round(time.clock() - bt, 2)
remaining = round(duration * 100 / (0.01 + p) - duration, 2)
print("进度:{0}%,已耗时:{1}s,预计剩余时间:{2}s".format(p, duration, remaining), end="\r") writePath = thisPath + "\\Result.txt"
try:
os.remove(writePath)
except Exception as err:
print(err)
writeResult(writePath, "***************NotUseFiles:***************\n", notUseFiles)
writeResult(writePath, "***************UseFiles:***************\n", useFiles)
useTime = time.clock() - bt
print("已完成 总耗时:", useTime)
python 检索文件内容工具的更多相关文章
- Linux中利用grep命令如何检索文件内容详解
前言 Linux系统中搜索.查找文件中的内容,一般最常用的是grep命令,另外还有egrep命令,同时vi命令也支持文件内容检索.下面来一起看看Linux利用grep命令检索文件内容的详细介绍. 方法 ...
- Python 输出文件内容到网络端口
Python 输出文件内容到网络端口 $ cat mySocketTest.py import sys import time import socket if __name__ == "_ ...
- python 修改文件内容
python 修改文件内容 一.修改原文件方式 1 def alter(file,old_str,new_str): 2 """ 3 替换文件中的字符串 4 :param ...
- python实现文件搜索工具(简易版)
在python学习过程中有一次需要进行GUI 的绘制, 而在python中有自带的库tkinter可以用来简单的GUI编写,于是转而学习tkinter库的使用. 学以致用,现在试着编写一个简单的磁文件 ...
- Linux中通过grep命令检索文件内容和指定内容前后几行
原文链接: https://www.linuxidc.com/Linux/2017-11/148390.htm Linux系统中搜索.查找文件中的内容,一般最常用的是grep命令,另外还有egrep命 ...
- python改动文件内容,不须要read,write多个动作。
python 要改动文件内容,经常使用 是先read.后write , 再 rename.非常不爽. 比方:须要 把 yuv_dir ="../HD/" # &q ...
- python 修改文件内容3种方法
原文链接:https://www.cnblogs.com/wc-chan/p/8085452.html def alter(file,old_str,new_str): ""&qu ...
- python ini文件内容的读取
(1)新建一个项目,再次新建一个文件 test_cfg.ini (2)再次新建 get_test_cfg.py,用来读取/写入/更改 ini的文件内容 #!/usr/bin/env python # ...
- Python修改文件内容
工作中要写个脚本来修改文件的内容,然后就写了一个刷子: #coding:utf8 import os def modify_file(old_file, new_version, old_versio ...
随机推荐
- MIPI CSI-2
目录 1 MIPI简介 2 MIPI CSI-2简介 2.1 MIPI CSI-2 的层次结构 2.2 CSI-2协议层 2.3 打包/解包层 2.4 LLP(Low Level Protocol)层 ...
- 「从零单排canal 02」canal集群版 + admin控制台 最新搭建姿势(基于1.1.4版本)
canal [kə'næl],译意为水道/管道/沟渠,主要用途是基于 MySQL 数据库增量日志解析,提供增量数据 订阅 和 消费.应该是阿里云DTS(Data Transfer Service)的开 ...
- xdoj 2020校赛复盘
平时写东西都不喜欢复盘,这肯定不是一个好习惯,感觉每次花好几个小时甚至好几天写题目然后没写出来也不去看题解是一种很蠢的行为( 花了这么久时间打校赛,虽然水平很low,数据结构也不太会用,还是记录一下自 ...
- ZWave 数据包格式
ZWave Device 的过程中,其实就是对不同的 COMMAND CLASS 进行解析处理.在刚开始进入ZWAVE 开发时,为了弄清楚数据包的格式,做了下面的参考表格.不过后来发现用来抓包的 sn ...
- IntelliJ IDEA中项目import与open的区别
场景: 从原来公司离职来到新的公司,接手公司项目,先将项目从git或svn项目版本管理上clone下来,如果项目原先是用Eclipse开发的,而你更习惯于使用IntelliJ IDEA,下面是针对使用 ...
- vulstack红队评估(五)
一.环境搭建: ①根据作者公开的靶机信息整理 虚拟机密码: Win7: heart 123.com #本地管理员用户 sun\Administrator dc123.com #域管用户,改 ...
- VNC连接cnetos图形化界面
VNC连接cnetos图形化界面 Linux系统在服务器上一般都直接最小化安装,是不安装图形界面的,但是有时候,有一些特殊情况,需要使用图形界面,而下面就利用VNC来实现类似windows的远程桌面功 ...
- 10.实战交付一套dubbo微服务到k8s集群(3)之二进制安装Maven
maven官网:https://maven.apache.org/ maven二进制下载连接:https://archive.apache.org/dist/maven/maven-3/3.6.1/b ...
- vue父路由高亮不显示
vue父路由高亮不显示 首页和考试中心作为父路由,点击时发现不高亮,是因为路由配置有问题 因为首页和考试中心已经重定向到homepage和tpersonal-data这两个路由,当点击首页和考试中心的 ...
- redis配置文件中slave-serve-stale-data的解释
redis.conf文件中可以看到slave-serve-stale-data这个参数,作用是什么? 原文解释: # When a slave loses its connection with th ...