mysql全日志添加时间戳以及SQL多行问题处理（更新）

需求引入

在日常运维中，DBA可能经常会查看某个Query_Id对应哪些SQL，例如追查大事务问题；也可能业务端需要查看某时间端内所有SQL。

然而mysql在输入全日志的时候没有在每行SQL前打印时间戳，对于存在多行的SQL也没有处理，故需要额外的工具解决这个问题，

为此写了这个脚本。

处理脚本

主要操作类：

1、完成换行补齐

2、时间戳添加

#!/usr/bin/env python26

#-*- coding:utf-8 -*-

import os

import sys

import re

query_key_list = ["Sleep","Quit","Init DB","Query","Field List","Create DB","Drop DB","Refresh","Shutdown","Statistics","Processlist","Connect","Kill","Debug","Ping","Time","Delayed insert","Change user","Binlog Dump","Table Dump","Connect Out","Register Slave","Prepare","Execute","Log Data","Close stmt","Reset stmt","Set option","Fetch","Daemon","Error"]

class MySQL_Log_Parse(object):

    logfile_path=""

    time_prefix=""

    query_key = ""

    def __init__(self,logfile_path,output_file):

        self.logfile_path = logfile_path

        if not output_file:

            self.logfile_parsed_path = logfile_path+"_tmp"

        else:

            self.logfile_parsed_path = output_file

        self.logfile_parsed = open(self.logfile_parsed_path,"w")

        self.query_key = '|'.join(query_key_list)

    def _sql_completed(self,sql_log):

        re_key = "(^\d{6} \d{2}:\d{2}:\d{2})?( )*\d* "+self.query_key

        pattern = re.compile(re_key)

        match = pattern.search(sql_log)

        if match:

            return True

        return False

    def _print_line(self,sql_log):

        time_parttern = re.compile(r'^\d{6} \d{2}:\d{2}:\d{2}')

        match = time_parttern.search(sql_log)

        if match:

            new_line = sql_log.strip()

            self.time_prefix = match.group()

        else:

            new_line = self.time_prefix+"   "+sql_log.strip()

        self.logfile_parsed.write(new_line+'\n')    

    def log_parse(self):

        try:

            logfile = open(self.logfile_path,"r")

            time_prefix = ""

            first_line = True

            total_sql = ""

            for line in logfile.readlines():

                sql_is_completed = self._sql_completed(line)

                if first_line:

                    total_sql = line

                else:

                    if sql_is_completed:

                        self._print_line(total_sql)

                        total_sql = line

                    else:

                        total_sql = total_sql.rstrip() +" "+line.strip()

                first_line = False

            self._print_line(total_sql)

        except Exception, e:

            print e

        finally:

            logfile.close()

            self.logfile_parsed.close()

入口：

#!/usr/bin/env python26

#-*- coding: utf-8 -*-

import re

import sys

import os

import getopt

from GeneralLogParser import *

def usage():

        help_msg='''Usage: ./mysql_log_parser.py [option][value]...

        -h or --help

        -s or --source_log="原始general log"

        -o or --output_file = "添加时间戳以及多行处理后的log，默认是在原始general log路径后加_parsed后缀"'''

        print help_msg

        return 0

def option_parse(argv):

        shortargs = 'hs:o:'

        longargs = ['help','source_log=','output_file']

        opts_list,args = getopt.getopt(argv,shortargs,longargs)

        source_log = None

        output_file = None

        for opt,arg in opts_list:

                if opt in ('-h','--help'):

                        usage()

                        sys.exit()

                elif opt in ('-s','--source_log'):

                        source_log = arg

                elif opt in ('-o','--output_file'):

                        output_file = arg

        return source_log,output_file

def main():

        if len(sys.argv) == 1:

                usage()

                sys.exit(1)

        source_log,output_file = option_parse(sys.argv[1:])

        mysql_log = MySQL_Log_Parse(source_log,output_file)

        mysql_log.log_parse()

if __name__ == "__main__":

        main()

后续工作

1、多线程分块读取并发转换

2、代码规范化

3、mysql 打印日志过程分析

mysql全日志添加时间戳以及SQL多行问题处理（更新）的更多相关文章

mysql全日志(general log)的命令名称
在源码sql/sql_parse.cc中定义 const LEX_STRING command_name[]={ { C_STRING_WITH_LEN("Sleep") }, { ...
MySQL 表中添加时间戳字段
场景: 有张表的数据需要用同步工具同步至其他库,需要 update_time 时间戳字段来做增量同步. 解决方法: alter table quant_stk_calc_d_wxcp add upd ...
mysql通过查看跟踪日志跟踪执行的sql语句
在SQL SERVER下跟踪sql采用事件探查器,而在mysql下如何跟踪sql呢? 其实方法很简单,开启mysql的日志log功能,通过查看跟踪日志即可. 开启mysql的日志log方法: wind ...
MySQL慢日志查询全解析：从参数、配置到分析工具【转】
转自: MySQL慢日志查询全解析:从参数.配置到分析工具 - MySQL - DBAplus社群——围绕数据库.大数据.PaaS云,运维圈最专注围绕“数据”的学习交流和专业社群http://dbap ...
MySQl之最全且必会的sql语句
创建一个名称为mydb1的数据库,如果有mydb1数据库则直接使用,如果无则创建mydb1数据库 create database if not exists mydb1; create databas ...
mysql错误日志及sql日志的区别
my.ini # power by phpStudy 2014 www.phpStudy.net 官网下载最新版 [client] port=3306 [mysql] default-characte ...
MySQL binlog日志操作详解
MySQL的二进制日志可以说是MySQL最重要的日志了,它记录了所有的DDL和DML(除了数据查询语句)语句,以事件形式记录,还包含语句所执行的消耗的时间,MySQL的二进制日志是事务安全型的. bi ...
MySQL慢日志简介及Anemometer工具介绍
作者:王航威 - fordba.com 来源:http://fordba.com/box-anemometer-visual-mysql-slow.html,叶师傅对原文内容略有调整备注:王航威是知 ...
神奇的 SQL 之 MySQL 性能分析神器 → EXPLAIN，SQL 起飞的基石！
前言开心一刻某人养了一头猪,烦了想放生,可是猪认识回家的路,放生几次它都自己回来了.一日,这个人想了个狠办法,开车带着猪转了好多路进山区放生,放生后又各种打转,然后掏出电话给家里人打了个电话,问道 ...

随机推荐

JavaScript 版数据结构与算法（四）集合
今天,我们要讲的是数据结构与算法中的集合. 集合简介什么是集合?与栈.队列.链表这些顺序数据结构不同,集合是一种无序且唯一的数据结构.集合有什么用?在 Python 中,我经常使用集合来给数组去重: ...
http中错误代码的含义整理
HTTP网页错误代码大全带解释 HTTP 400 - 请求无效HTTP 401.1 - 未授权:登录失败HTTP 401.2 - 未授权:服务器配置问题导致登录失败HTTP 401.3 - ACL 禁 ...
[ZJOI2005]九数码游戏
[ZJOI2005]九数码游戏题目描述输入输出格式输入格式: 输入文件中包含三行三列九个数,同行的相邻两数用空格隔开,表示初始状态每个方格上的数字.初始状态不会是目标状态. 输出格式: 如果目标 ...
Linux 进程状态概念 Process State Definition
From : http://www.linfo.org/process_state.html 进程状态是指在进程描述符中状态位的值. 进程,也可被称为任务,是指一个程序运行的实例. 一个进程描述符是一 ...
WordCount项目
采用的源码来自http://blog.csdn.net/lnz001/article/details/54851551 经修改后,已上传至GitHub.https://github.com/FengX ...
类的封装（property）
封装封装程序的主要原因:保护隐私:而封装方法的主要原因是:隔离复杂的执行过程 property的特性将一个类的函数定义成特性以后,对象再去使用的时候obj.name,根本无法察觉自己的name是执 ...
Linux入门(3)——Ubuntu16.04下安装VMware
下载linux版本 http://www.vmware.com/cn/products/workstation/workstation-evaluation.html 激活秘钥:5A02H-AU243 ...
【转】地址空间、内核空间、IO地址空间
http://blog.csdn.net/wuxinke_blog/article/details/8769131 有这么一系列的问题,是否在困扰着你:用户程序编译连接形成的地址空间在什么范围内?内核 ...
Codeforces Round #439 (Div. 2) C DP(图论）
C. The Intriguing Obsession time limit per test 1 second memory limit per test 256 megabytes input s ...
使用angular4和asp.net core 2 web api做个练习项目(一)
这是一篇学习笔记. angular 5 正式版都快出了, 不过主要是性能升级. 我认为angular 4还是很适合企业的, 就像.net一样. 我用的是windows 10 安装工具: git for ...

mysql全日志添加时间戳以及SQL多行问题处理（更新）

mysql全日志添加时间戳以及SQL多行问题处理（更新）的更多相关文章

随机推荐

热门专题