python 检索文件内容工具
公司内部需求一个工具检索目录下的文件在另外的目录中使用次数, 用来优化包体的大小。
此代码效率并不高效, 另添加对应的 后缀检索。 用python 实现比较快速, 另还有缺点是只支持 utf-8 格式内容。
各位用到的可以自己摘一下。
(本人习惯使用c\c++,目前发现这种脚本类的确实实现方便,接口齐全, 我能想到的接口, 真的全都有, 用python 写工具, 应该是一个调试起来还可以的过程)
代码如下:
#coding=utf-8 import os
import sys
import time #private:
def checkSuffix(strFileName, strCompareSuffix):
strPreFileName = ''
strFileSuffix = ''
bIsCheckOk = False
strArray = strFileName.split('.')
if len(strArray) > 1:
strPreFileName = strArray[0]
strFileSuffix = strArray[1]
#print(strFileSuffix)
#print(strCompareSuffix)
if strCompareSuffix == '*' or strFileSuffix == strCompareSuffix:
bIsCheckOk = True
return bIsCheckOk, strPreFileName def readFileName(file_dir):
for root, dirs, files in os.walk(file_dir):
return files,dirs, root
return '', '', '' def findString(pathFile, findKey):
#print("open pathFile:", pathFile)
fp = open(pathFile, "r", encoding='utf-8')
strr = fp.read()
if(strr.find(findKey) != -1):
return True
return False def startFind(files, dirs, root, findKey, strSuffix):
for fileName in files:
try:
bIsCheckOk, strPreFileName = checkSuffix(fileName, strSuffix)
if bIsCheckOk == False:
#print("fileName", fileName, " is not suffx :", strSuffix)
continue
if(findString(root + "\\" + fileName, findKey)):
return True, fileName
except Exception as err:
continue for jj in dirs:
fi, di, ro = readFileName(root + jj)
bIsFind, fileName = startFind(fi, di, ro, findKey, strSuffix)
if(bIsFind == True):
return bIsFind, fileName
return False, '' #public:
def findUse(dirPath, findKey, strSuffix):
files, dirs, root = readFileName(dirPath)
return startFind(files, dirs, root, findKey, strSuffix) def getDirsFiles(dirPath):
dirfiles = [];
for root, dirs, files in os.walk(dirPath):
dirfiles += files;
return dirfiles def writeResult(strFileName, strWriteSign, list):
fp = open(strFileName, 'a+')
fp.write(strWriteSign)
#fp.writelines(list)
for str in list:
fp.write(str)
fp.write('\n')
fp.close() if __name__ == '__main__':
"""
findDir = u"E:\\mmo2018001\\artist\\open\\ui\\free\\"
findAimDir = u"E:\\mmo2018001\\artist\\open\\effect\\"
findsuffix = "prefab" # 哪些要搜索的文件的后缀
findAimsuffix = "*" # 搜索那些后缀的文件
"""
bt = time.clock() # 记录时间 findDir = sys.argv[1]
findAimDir = sys.argv[2]
findsuffix = sys.argv[3]
findAimsuffix = sys.argv[4] thisPath = os.getcwd()
print("this path is ", thisPath)
print(findDir)
print(findAimDir)
print(findsuffix)
print(findAimsuffix) dirFiles = getDirsFiles(findAimDir)
useFiles = []
notUseFiles = []
nLen = len(dirFiles)
i = 0
for filesName in dirFiles : bIsCheckOk, strPreFileName = checkSuffix(filesName, findsuffix)
if bIsCheckOk == True:
isFind, fileName = findUse(findDir, strPreFileName, findAimsuffix)
#print("filesName:\t", filesName, " \nIsFind:\t\t", isFind)
if(isFind):
useFiles.append(filesName)
else:
notUseFiles.append(filesName)
i += 1
p = round(i * 100 / nLen)
duration = round(time.clock() - bt, 2)
remaining = round(duration * 100 / (0.01 + p) - duration, 2)
print("进度:{0}%,已耗时:{1}s,预计剩余时间:{2}s".format(p, duration, remaining), end="\r") writePath = thisPath + "\\Result.txt"
try:
os.remove(writePath)
except Exception as err:
print(err)
writeResult(writePath, "***************NotUseFiles:***************\n", notUseFiles)
writeResult(writePath, "***************UseFiles:***************\n", useFiles)
useTime = time.clock() - bt
print("已完成 总耗时:", useTime)
python 检索文件内容工具的更多相关文章
- Linux中利用grep命令如何检索文件内容详解
前言 Linux系统中搜索.查找文件中的内容,一般最常用的是grep命令,另外还有egrep命令,同时vi命令也支持文件内容检索.下面来一起看看Linux利用grep命令检索文件内容的详细介绍. 方法 ...
- Python 输出文件内容到网络端口
Python 输出文件内容到网络端口 $ cat mySocketTest.py import sys import time import socket if __name__ == "_ ...
- python 修改文件内容
python 修改文件内容 一.修改原文件方式 1 def alter(file,old_str,new_str): 2 """ 3 替换文件中的字符串 4 :param ...
- python实现文件搜索工具(简易版)
在python学习过程中有一次需要进行GUI 的绘制, 而在python中有自带的库tkinter可以用来简单的GUI编写,于是转而学习tkinter库的使用. 学以致用,现在试着编写一个简单的磁文件 ...
- Linux中通过grep命令检索文件内容和指定内容前后几行
原文链接: https://www.linuxidc.com/Linux/2017-11/148390.htm Linux系统中搜索.查找文件中的内容,一般最常用的是grep命令,另外还有egrep命 ...
- python改动文件内容,不须要read,write多个动作。
python 要改动文件内容,经常使用 是先read.后write , 再 rename.非常不爽. 比方:须要 把 yuv_dir ="../HD/" # &q ...
- python 修改文件内容3种方法
原文链接:https://www.cnblogs.com/wc-chan/p/8085452.html def alter(file,old_str,new_str): ""&qu ...
- python ini文件内容的读取
(1)新建一个项目,再次新建一个文件 test_cfg.ini (2)再次新建 get_test_cfg.py,用来读取/写入/更改 ini的文件内容 #!/usr/bin/env python # ...
- Python修改文件内容
工作中要写个脚本来修改文件的内容,然后就写了一个刷子: #coding:utf8 import os def modify_file(old_file, new_version, old_versio ...
随机推荐
- Vue使用js鼠标蜘蛛特效
1. 在src下新建文件夹utils,里面新建文件canvas-nest.js,将代码复制进去.(可以自己定义存放路径) !function() { function n(n, e, t) { ret ...
- PL/SQL编程急速上手
结构化查询语言(SQL)是第四代编程语言的典型,这种命令式的语言更像一种指令,使用它,你只需要告诉计算机“做什么”,而不用告诉计算机“怎么做”.第四代编程语言普遍具有简单.易学.能更快的投入生产等优点 ...
- 【Jmeter】分布式压测环境配置
注意:以下四点都必须一致 1.jmeter版本 2.内置插件 3.jdk版本1.8以上 4.同属一个局域网 助攻机设置 本机助攻机Linux系统,首先需要安装JDK并配置环境 JDk基本安装及配置环境 ...
- pc端网站如何自动跳转到移动wap端网站
<script type="text/javascript"> var uaTest = /Android|webOS|Windows Phone|iPhone|ucw ...
- MQ系列(0)——MQ简介
mq简介 mq 就是消息队列(Message Queue).想必大家对队列的数据结构已经很熟悉了,消息队列可以简单理解为:把要传输的数据放在队列中,mq 就是存放和发送消息的这么一个队列中间件.在消息 ...
- TensorFlow从0到1之TensorFlow损失函数(12)
正如前面所讨论的,在回归中定义了损失函数或目标函数,其目的是找到使损失最小化的系数.本节将介绍如何在 TensorFlow 中定义损失函数,并根据问题选择合适的损失函数. 声明一个损失函数需要将系数定 ...
- [Cadence] 10个Cadence AD PADS经典案例 2-12层板设计
[Cadence] 10个Cadence Allegro经典案例 2-12层板设计 自己保存的PCB例程资料分享 Allegro AD PADS看下面截图需要的拿去 下载链接 链接: https:// ...
- Linux下配置tomcat
我们可以在用户目录下新建一个tomcat目录 mkdir tomcat ls cd tomcat/ 使用wget命令下载tomcat的压缩包 wget https://downloads.apache ...
- Zookeeper——Watcher原理详解
文章目录 引言 正文 一.如何注册监听 二.如何触发监听事件 三.事件类型有哪些 四.Watcher可以被无限次触发么?为什么要这么设计? 五.Watcher实现原理 1. 客服端发送请求 a. 初始 ...
- CSS中link和@import的区别
1.link属于HTML标签,而@import是CSS提供的 2.页面被加载时link会同时被加载:而@import引用的CSS会等到页面被加载完再加载 3.@import只在IE5以上才能识别,而l ...