使用python递归子目录处理日志文件

重要说明：

（1）python使用4个空格进行层次缩进的（不是tab），在eclipse里面可以直接使用tab缩进，是因为eclipse会实时地将tab转成4个空格

（2）在eclipse中安装pyDev插件，就可以调试python脚本了

（3）如果在python文件中存在中文字符，需要在python文件的开头处指明文件的编码类型，形式如：#coding=gbk

（4）以下代码使用的是python2.7.3版本

+++++++++ main.py +++++++++

#coding=gbk

# filename : main.py

# author : kekec

# date : 20140813

import os,sys

import filedir

import filter

file_suffix = '*.txt'

root_path   = 'F:\\新建文件夹\\20140714'

result_path = unicode('result.txt' , "utf8")

wfile = open(result_path, 'w')

for i in filedir.search_file(file_suffix, root_path):

    print i

    bfile = False;

    rfile = open(i, 'r')

    while 1:

        line = rfile.readline()

        if not line:

            break

        if (False == filter.is_filter(line)):

            if (False == bfile):

                wfile.write(i)

                wfile.write('\n')

                bfile = True

            print line

            wfile.write(line)

            wfile.flush()

    rfile.close()

wfile.close()

+++++++++ filedir.py +++++++++

#coding=gbk

# filename : filedir.py

# author : kekec

# date : 20140813

import os,sys,fnmatch

def search_file(pattern="*.txt", root=os.curdir):

    for path, dirs, files in os.walk(os.path.abspath(root)):

        for filename in fnmatch.filter(files, pattern):

            yield os.path.join(path, filename)

+++++++++ filter.py +++++++++

#coding=gbk

# filename : filter.py

# author : kekec

# date : 20140813

ALOG_0 = '[ERROR]'

BLOG_0 = 'OnGameUpdateDB'

CLOG_0 = 'Field25'

DLOG_0 = 'execute'

ELOG_0 = 'failed'

def is_filter(line):

    a = line.find(ALOG_0) >= 0

    b = line.find(BLOG_0) >= 0

    c = line.find(CLOG_0) >= 0

    d = line.find(DLOG_0) >= 0

    e = line.find(ELOG_0) >= 0

    return (a and b and c and d and e)

使用python递归子目录处理日志文件的更多相关文章

使用python脚本实现统计日志文件中的ip访问次数
使用python脚本实现统计日志文件中的ip访问次数,注意此脚本只适用ip在每行开头的日志文件,需要的朋友可以参考下适用的日志格式: 106.45.185.214 - - [06/Aug/2014: ...
Python中将打印输出导向日志文件
a. 利用sys.stdout将print行导向到你定义的日志文件中,例如: import sys # make a copy of original stdout route stdout_back ...
Linux系统——日志文件
日志文件的分类 (1)内核及系统日志由系统服务rsyslog管理,根据去主配置文件/etc/rsyslog.conf中的设置决定将内核消息及各种系统程序消息记录到什么位置. /etc/rsyslog ...
docker容器中日志文件过大处理方法
背景 :在日常工作中一个基于centos镜像构建起来的python爬虫程序,日志文件在两个月内到了500G,日志存放在根目录下面,在不扩容的情况下把这个问题给解决掉.通过定时任务和脚本的方法,定期的清 ...
python递归列出目录及其子目录下所有文件
python递归列出目录及其子目录下所有文件一.前言函数的递归,简单来说,就是函数内部调用自己先举个小例子,求阶乘 def factorial(n): if n == 0: return 1 e ...
C#递归遍历子目录与子目录中的文件
[转载]作者:weixingstudio 采用C#,通过指定一个路径,来递归的遍历所有的子目录以及子目录中的文件,建一个类似资源管理器的目录树先递归的遍历所有的子目录,如果没有子目录以后,则遍历所有 ...
python 实时遍历日志文件
首先尝试使用 python open 遍历一个大日志文件, 使用 readlines() 还是 readline() ? 总体上 readlines() 不慢于python 一次次调用 readlin ...
Python同时向控制台和文件输出日志logging的方法 Python logging模块详解
Python同时向控制台和文件输出日志logging的方法http://www.jb51.net/article/66756.htm 1 #-*- coding:utf-8 -*- 2 import ...
Linux(9)后台运行python程序并输出到日志文件
后台运行python程序并标准输出到文件现在有test.py程序要后台部署, 里面有输出内容使用命令: nohup python -u test.py > test.log 2>&am ...

随机推荐

java File delete()执行失败原因
java.io.File里的delete操作很实用也很常用,可以用来删除单独的文件和某一目录.但有时候会出现delete失败的情况,出现这种情况的原因一般有以下几种: 1.删除时还有其他程序在使用该文 ...
Hibernate中的GetCurrentSession()方法
从3.0.1版本开始,Hibernate增加了SessionFactory.getCurrentSession()方法. 采用getCurrentSession()创建的session在commit ...
ubuntu 下mongodb安装
1.下载: mongodb.org/download 2. 将下载的压缩文件加压到/usr/lib下 3. 建立软链接 ln -s /usr/lib/mongodb-linux-i686-2.6.7/ ...
bootstrap按钮
按钮基类 -btn 样式 btn-default(默认) btn-link(链接) 大小 btn-*[lg,sm,xs] 状态 active disabled <!DOCTYPE HTML&g ...
统计代码git提交的行数
$ git log --author="$(git config --get user.name)" --pretty=tformat: --numstat | gawk '{ a ...
【leetcode】Minimum Path Sum
Minimum Path Sum Given a m x n grid filled with non-negative numbers, find a path from top left to b ...
oracle，mybatis主键自增长
<insert id="insert" parameterType="resource"> <selectKey resultType=&qu ...
robotFramework——截屏
测试执行过程中进行截屏并且保存,是任何一款自动化测试工具或者框架必备的功能.那么Robotframework如何进行截屏呢?Robotframework提供了一个“Screenshot”库. 使 ...
C++基础知识面试精选100题系列(21-30)[C++ basics]
[本文链接] http://www.cnblogs.com/hellogiser/p/100-interview-questions-of-cplusplus-basics-21-30.html [题 ...
Unity3D 降低IL2CPP编译可执行文件大小
项目开始使用IL2CPP编译,后果是可执行文件急剧增加. google后发现国外一大神写的方法,原帖在这http://forum.unity3d.com/threads/suggestion-for- ...

使用python递归子目录处理日志文件

使用python递归子目录处理日志文件的更多相关文章

随机推荐

热门专题