用ELK分析每天4亿多条腾讯云MySQL审计日志(1)--解决过程

前言：

该文章将会介绍以下：

1，快速分析SQL日志的几种方法

2，使用mysql的全文索引快速分析少量SQL审计

3，准确快速分析4亿多条审计SQL日志（过程和最终解决方案）

公司核心库拆库拆表，对表和账号分析，大量系统连接，1主13个从库，几十个账号，后来都开通了全SQL审计，14个实例的审计日志条数每天超过4.5亿条+

要求

1，怎么分析出这几百个表是哪些账号在用？

2，这些表那些账号在读，哪些在写？

面临的问题：

1，如何能准确分析出表，账号和实例的关系

2，如何在14个实例中，能快速分析出结果

这件事情如何做，谁来做。弄来弄去，最后领导把这事硬丢给我，都不想接，但没办法硬着头皮做。

想想这些年都是做别人都不愿意做的事快速成长起来的，有时收获很多，现在想想的确是。

正如中国军事战略家金一南将军说的：做难事，必有所得！

这几个月做下来，收获总结成以下文档：

方法：

1，方法一

手工下载csv文件，使用正则表达式，分析腾讯云导出这些审计日志csv文件（分析很慢，而且不能把表对应具体的账号） （此方法不行）

2，使用JSqlParser这样对SQL语义分析，解析出SQL的表名

手工下载csv文件，测试了一下，的确可以，有少量SQL无法解析，但是有4.5亿条，即使一条花费0.01秒，也要4百万秒分析完（超过1千多小时），即使100个线程并发，也需要10个多小时，而且只是一天的量，效率太低太慢，而且如果中间出错，重新分析时间更长，而且还有部分SQL无法解析 （此方法不行）

是否有其他方法，能快速分析出SQL语句的表和账号关系，突然想起了，可以把csv导入到MySQL表中，在SQL字段建立全文索引，通过python来分析全文索引，获取表和账号的关系，测试了MySQL的表全文索引，的确很好用

如查询表： ol_order ，如： lt_ol_order 表这个查询就不会查询处理，他查的是词，很好用。

如查询表，insert的用户和表的分析，取一条sql样例：

 SELECT count(*) num,user,'insert','ol_order',`sql`,date(`Timestamp`) dt FROM cc_0128 WHERE

MATCH(`sql`)  AGAINST('+ol_order  +insert' IN BOOLEAN MODE) group by user

对于delete，select，update和replace都可以这样分析出来。写5条SQL，一起union all，就可以

分析完后，分析有些异常数据：比如这样的语句： insert into 表 select 1,2 这样，如果再上面的语句加上： `sql` like 'insert%' ，几百个表，5条SQL，查询比以前变慢很多！

怎么办？分析效率和准确率如何平衡

后来看了看，异常数据有些，但不多，可以针对异常数据的分析，以前的分析就不用改。修复的语句：

SELECT count(*) num,user,'insert','ol_order',`sql`,date(`Timestamp`)  FROM cc_0128 WHERE MATCH(`sql`)

AGAINST('+ol_order  +insert' IN BOOLEAN MODE) and  `sql` like 'insert%'  group by user

这样就可以分析出表，账号还用调用次数的关系。

还能分析出表的字段被那些账号update更新。但几百个表。有1万多个字段，如果Python遍历，太低效，有没有更好的办法？

根据分析的update和表的关系，其实几百个表有更新的只有2百多个，只需遍历这200多个表的分析就可以了，这样既解决效率问题。

其实这个方法也可用，但是每次要下载csv文件，导表，建全文索引，再分析，太耗时间，后面把程序自动下载csv，通过filebeat导到ELK，在ELK直接查询，效率更高。

虽然用MySQL的表全文索引的方法未最终使用，但在分析少量数据（百万条)，的确还是比较方便，如下：

额外收获：

 如某一时刻，MySQL的QPS高，如何快速查出QPS高的表，导出范围日志csv到表，简单查一下（一般百万级别）

  select tab,count(*) from (select id,substring_index(substring_index(LOWER(`sql`), 'where', 1),'from'
,-1) tab,`sql` from ol_sk1 ) t  GROUP BY tab order by 2 desc

 查询具体表的调用SQL：

 select `User`,count(*), `sql` from ol_sk1 where MATCH(`sql`) AGAINST ('ol_admin_config') GROUP BY `User`
, `sql` order by 2 desc

旧分析方法：

SQL审计日志手工下载导入--MySQL全文索引--Python分析全文索引（最快遍历940张+表分析6000多万条需3个多小时，不能跨天，手工导出导入耗费大量人力时间）

新分析方法：

SQL审计日志Python程序化下载--filebeat--Kafka--ELK（14个实例每天4.5亿+条SQL执行日志）

新系统和ELK带来巨大便利：

1，能全实例（14个实例)，跨天长时间复杂查询分析（便利性和准确性远超腾讯云提供的审计日志查询）

2, 新实例审计日志加到ELK，只需表中配置一条记录

3，能快速准确的分析出表在online全实例账号调用情况，请求数量等

4，审计日志导ELK程序系统化和配置化，无需人工介入，节省大量人力时间.

......

额外带来好处便利：

1，更高效便利的线上bug数据分析

2，数据安全审查的快速跟踪和分析

......

相关文档：

用ELK分析每天4亿多条腾讯云MySQL审计日志(1)--解决过程的更多相关文章

jquery的$.extend和$.fn.extend作用及区别/用span实现进度条/腾讯云IIS端口号修改
jQuery为开发插件提拱了两个方法,分别是: jQuery.fn.extend(); jQuery.extend(); 虽然 javascript 没有明确的类的概念,但是用类来理解它,会更方便. ...
服务质量分析：腾讯会议&腾讯云Elasticsearch玩出了怎样的新操作？
导语 | 腾讯会议于2019年12月底上线,两个月内日活突破1000万,被广泛应用于疫情防控会议.远程办公.师生远程授课等场景,为疫情期间的复工复产提供了重要的远程沟通工具.上线100天内,腾讯会议快 ...
[日志分析]Graylog2采集mysql慢日志
之前聊了一下graylog如何采集nginx日志,为此我介绍了两种采集方法(主动和被动),让大家对graylog日志采集有了一个大致的了解. 从日志收集这个角度,graylog提供了多样性和灵活性,大 ...
使用Docker快速部署ELK分析Nginx日志实践（二）
Kibana汉化使用中文界面实践一.背景笔者在上一篇文章使用Docker快速部署ELK分析Nginx日志实践当中有提到如何快速搭建ELK分析Nginx日志,但是这只是第一步,后面还有很多仪表盘需要 ...
4：ELK分析tomcat日志
五.ELK分析tomcat日志 1.配置FIlebeat搜集tomcat日志 2.配置Logstash从filebeat输入tomcat日志 3.查看索引 4.创建索引
使用Docker快速部署ELK分析Nginx日志实践
原文:使用Docker快速部署ELK分析Nginx日志实践一.背景笔者所在项目组的项目由多个子项目所组成,每一个子项目都存在一定的日志,有时候想排查一些问题,需要到各个地方去查看,极为不方便,此前 ...
elk是指logstash,elasticsearch,kibana三件套，这三件套可以组成日志分析和监控工具
Logstash是一个完全开源的工具,他可以对你的日志进行收集.分析,并将其存储供以后使用(如,搜索),您可以使用它.说到搜索,logstash带有一个web界面,搜索和展示所有日志.kibana 也 ...
Python脚本收集腾讯云CDN日志，并入ELK日志分析
负责搭建公司日志分析,一直想把CDN日志也放入到日志分析,前些日志终于达成所愿,现在贴出具体做法: 1.收集日志腾讯云CDN日志一般一小时刷新一次,也就是说当前只能下载一小时之前的日志数据,但据本人 ...
ELK 构建 MySQL 慢日志收集平台详解
ELK 介绍 ELK 最早是 Elasticsearch(以下简称ES).Logstash.Kibana 三款开源软件的简称,三款软件后来被同一公司收购,并加入了Xpark.Beats等组件,改名为E ...
ELK构建MySQL慢日志收集平台详解
上篇文章<中小团队快速构建SQL自动审核系统>我们完成了SQL的自动审核与执行,不仅提高了效率还受到了同事的肯定,心里美滋滋.但关于慢查询的收集及处理也耗费了我们太多的时间和精力,如何在这 ...

随机推荐

MyBatis02：CRUD操作
CRUD操作 namespace 这个是命名空间,不可缺少,更不能写错配置文件中namespace中的名称为对应Mapper接口或者Dao接口的全限定类名,完整包名,必须一致! Select(用于查 ...
Oracle 监控客户端的连接数量趋势
Oracle 监控客户端的连接数量趋势背景前期简单总结了table方式将表信息展示出来的方法但是感觉这样非常不直观. 想着能够做出一个趋势来. 时序数据库的最佳的使用方式. 之前的确是太靠自己的 ...
[转帖]CentOS 8已经停止维护,怎么检查CentOS的版本
https://rumenz.com/rumenbiji/centos-check-version.html CentOS 8 在2021年12月31日停止更新并停止维护(EOL). CentOS 7 ...
[转帖]金仓数据库KingbaseES V8R6 索引膨胀
索引膨胀对于索引,随着业务不断的增删改,会造成膨胀,尤其Btree索引,也会涉及索引分裂.合并等,导致索引访问效率降低.维护成本增加.另外,索引页的复用与HEAP PAGE不一样,因为索引的内容是有 ...
[转帖]oracle如何删除datafile,误删除Oracle datafile 无法打开数据库
1.在Oracle open方式下,直接从OS上删除了datafile文件. rm /u02/rmants.dbf 2.数据库关闭后,无法打开数据库,只能到mount状态. SQL> alter ...
CentOS7升级Glibc到超过2.17版本无法启动的解决办法
CentOS7升级Glibc到超过2.17版本无法启动的解决办法背景今天有同事告知服务器宕机无法启动. 提示信息为: [sda] Assuming drive cache: write throu ...
基于CefSharp开发浏览器（十）浏览器CefSharp.Wpf中文输入法偏移处理
一.前言两年多来未曾更新博客,最近一位朋友向我咨询中文输入法问题.具体而言,他在使用CefSharp WPF版本时遇到了一个问题,即输入法突然出现在屏幕的左上角.在这里记录下处理这个问题的过程,希望 ...
ChatGPT背后的AI背景、技术门道和商业应用(万字长文，建议收藏)
作者:京东科技李俊兵各位看官好,我是球神(江湖代号). 自去年11月30日ChatGPT问世以来,迅速爆火出圈. 起初我依然以为这是和当年Transformer, Bert一样的"热点& ...
web端用户的输入都应该做如下限制
web端中,所有可以输入的地方.都应该做如下操作. 1=>不能够输入script关键字,如果用户输入了.进行提示.然后删除用户输入的值 (这样比较粗暴,不太友好) 2=>用户输入了含有sc ...
PicoPixel贴图查看器
Pico Pixel Pico Pixel是一款纹理查看器,支持查看以下文件格式:TGA,BMP,JPG,DDS,PNG,OpenEXR, KTX, HDR, GIF, TIF. 此外,Pico Pi ...

用ELK分析每天4亿多条腾讯云MySQL审计日志(1)--解决过程

用ELK分析每天4亿多条腾讯云MySQL审计日志(1)--解决过程的更多相关文章

随机推荐

热门专题