接到了一个新的需求,拿到需求的时候瞬间有点头大,因为实在是有些棘手。

我们这个系统本身是个接口系统,总接口数大概在200个左右。外部会有很多用户在

不同的时间拿着不同参数去调我们的这些接口,用户的调集记录会写在数据库的一个

日志表里。日志表字段大概有url(带参数),用户id,调用时间,返回结果等等等

等。现在的需求是,查询一定时间范围内(12月)里,同一个用户在7天之内调用的

接口url和时间。

麻烦的是接口url本身比较复杂。它的长度大约在200-500,里面有几个麻烦的参数:

一个是时间戳,时间戳有可能是传递,也有可能是生成的,它铁定不重复。另一个是

数字签名,它会根据参数和时间戳通过算法生成,也铁定不重复。所以解决这个问题

的第一步,是把url进行处理。去掉这两个铁定不重复的参数。
这个系统还有个让人蛋疼的地方,就是它是两个系统合二为一的。两个系统的时间戳

和数字签名参数名称是不一样的,也就是说有四个参数需要判断是否存在+处理。这

一步肯定是用函数做。新建函数如下:

CREATE FUNCTION ReplaceUrl (strUrl varchar(800))
RETURNS varchar(800)
BEGIN
DECLARE v_Tmp_1 varchar(800) default '';
DECLARE v_Tmp_2 varchar(800) default '';
DECLARE v_Tmp_3 varchar(800) default '';
DECLARE v_Tmp_4 varchar(800) default '';

SET v_Tmp_1 = if(locate('timeStamp',strUrl)>0,REPLACE

(strUrl,SUBSTRING_INDEX(SUBSTRING_INDEX(strUrl,'timeStamp',-

1),'&',1),''),strUrl);
SET v_Tmp_2 = if(locate('time_stamp',v_Tmp_1)>0,REPLACE

(v_Tmp_1,SUBSTRING_INDEX(SUBSTRING_INDEX(v_Tmp_1,'time_stamp',-

1),'&',1),''),v_Tmp_1);
SET v_Tmp_3 = if(locate('access_signature',v_Tmp_2)>0,REPLACE

(v_Tmp_2,SUBSTRING_INDEX(SUBSTRING_INDEX(v_Tmp_2,'access_signature',-

1),'&',1),''),v_Tmp_2);
SET v_Tmp_4 = if(locate('accessSignature',v_Tmp_3)>0,REPLACE

(v_Tmp_3,SUBSTRING_INDEX(SUBSTRING_INDEX(v_Tmp_3,'accessSignature',-

1),'&',1),''),v_Tmp_3);
RETURN v_Tmp_4;
END;

MYSQL中if函数使用方法是if(参数1,参数2,参数3),如果参数1正确则执行参数2,

不正确执行参数3。这里先判断url是否含有参数A,如果含有则执行替换,不含有则

什么都不处理。
替换的逻辑是REPLACE函数,REPLACE(参数1,参数2,参数3),参数1是等待执行的

参数,参数2是被替换的字段,参数3是替换为的字段。我们把指定参数替换为空就可

以了。
里面还有个参数是SUBSTRING_INDEX——按关键字截取字符串,用法是

substring_index(被截取字段,关键字,关键字出现的次数),次数为正是往右数

,次数为负是往左数。我们直接把次数设置为-1,也就是参数分隔符&左边的该参数

全部被截取就可以了。

连续执行4次之后,url的四个随机生成参数全部被清除,可以执行查重了。

第二步,排重。
难的不是排重,而是排重之后还要加上7天检索的算法。问题可以简化为,有一张表

,表里只有3个字段,id,name,time。现在要检索重复的name,还要加上time必须在

7天之内,否则就不算重复。
那么答案是:

select t1.* from table_name t1 join table_name t2 on t1.name=t2.name and

t1.id!=t2.id
where abs(t1.time-t2.time)<=7

这是一张表当两张表关联查询,虽然我知道会很慢,目前也没有更好的办法能解决这

个问题。

那么,这个问题最终的解决语句是,新建函数——将范围内的日志调取出来新建表——把新表处理后的url执行md5——再查重

CREATE FUNCTION ReplaceUrl (strUrl varchar(800))
RETURNS varchar(800)
BEGIN
DECLARE v_Tmp_1 varchar(800) default '';
DECLARE v_Tmp_2 varchar(800) default '';
DECLARE v_Tmp_3 varchar(800) default '';
DECLARE v_Tmp_4 varchar(800) default '';

SET v_Tmp_1 = if(locate('timeStamp',strUrl)>0,REPLACE(strUrl,SUBSTRING_INDEX(SUBSTRING_INDEX(strUrl,'timeStamp',-1),'&',1),''),strUrl);
SET v_Tmp_2 = if(locate('time_stamp',v_Tmp_1)>0,REPLACE(v_Tmp_1,SUBSTRING_INDEX(SUBSTRING_INDEX(v_Tmp_1,'time_stamp',-1),'&',1),''),v_Tmp_1);
SET v_Tmp_3 = if(locate('access_signature',v_Tmp_2)>0,REPLACE(v_Tmp_2,SUBSTRING_INDEX(SUBSTRING_INDEX(v_Tmp_2,'access_signature',-1),'&',1),''),v_Tmp_2);
SET v_Tmp_4 = if(locate('accessSignature',v_Tmp_3)>0,REPLACE(v_Tmp_3,SUBSTRING_INDEX(SUBSTRING_INDEX(v_Tmp_3,'accessSignature',-1),'&',1),''),v_Tmp_3);
RETURN v_Tmp_4;
END;

CREATE TABLE api_table (
SELECT ReplaceUrl(T5)
as temp,T1,DATE(T6) as daytemp,T5,T6
FROM
`v2-api-log`WHERE DATE(t6) BETWEEN '2017-11-24' AND '2017-12-24')

alter table api_table add column md5temp varchar(50);
UPDATE api_table set md5temp = MD5(temp);
ALTER TABLE api_table ADD INDEX tempindex (md5temp);

create table api_repeat(
SELECT
t1.temp,t1.T1,t1.T6
FROM
api_table t1
JOIN api_table t2 ON t1.md5temp = t2.md5temp
AND t1.T1 = t2.T1
AND t1.T6 != t2.T6
WHERE
abs(t1.daytemp - t2.daytemp) <= 7
GROUP BY T6)

《MYSQL》----字符串的复杂函数,检索的七-天-排-重的更多相关文章

  1. MySQL 字符串截取SUBSTRING()函数

    MySQL 字符串截取相关函数: 1.从左开始截取字符串 left(str, length) 说明:left(被截取字段,截取长度) 例: select left(content,200) as ab ...

  2. MySQL 字符串连接CONCAT()函数

    MySQL字符串连接函数 使用方法:CONCAT(str1,str2,-) 返回结果为连接参数产生的字符串.如有任何一个参数为NULL ,则返回值为 NULL. 注意:如果所有参数均为非二进制字符串, ...

  3. mysql字符串的常用函数(截取和拼接)

    #截取字符串(先正序取2个,再倒序取1个)SELECT SUBSTRING_INDEX(SUBSTRING_INDEX('aaa-gg-cc-dd','-',2),'-',-1) #获取子表某个字段的 ...

  4. 025、MySQL字符串大小写转化函数,文本转化大写,文本转化小写

    #变大写 SELECT UPPER('abcdABCD123a'); #ABCDABCD123A SELECT UCASE('abcdABCD123a'); #ABCDABCD123A #变小写 SE ...

  5. MySQL字符串函数substring:字符串截取

    MySQL 字符串截取函数:left(), right(), substring(), substring_index().还有 mid(), substr().其中,mid(), substr() ...

  6. Mysql字符串截取函数SUBSTRING的用法说明

    感觉上MySQL的字符串函数截取字符,比用程序截取(如PHP或JAVA)来得强大,所以在这里做一个记录,希望对大家有用. 函数: 1.从左开始截取字符串 left(str, length) 说明:le ...

  7. MySQL字符串函数

    字符串大写和小写转换 MySQL 字符串大写和小写转化函数有两对: lower(), uppper() 和 lcase(), ucase() mysql> select lower('DDD') ...

  8. mysql字符串连接,重复等字符串函数总结

    mysql concat()函数 MySQL的concat函数可以连接一个或者多个字符串,如 select concat('10'); 输出 10 select concat('11','22','3 ...

  9. MySQL字符串函数、日期时间函数

    MySQL字符串函数.日期时间函数 一.常见字符串函数: 1.CHAR_LENGTH  获取长度(字符为单位) 2.FORMAT  格式化 3.INSERT  替换的方式插入 4.INSTR  获取位 ...

随机推荐

  1. Java IO(2)阻塞式输入输出(BIO)的字节流与字符流

    在上文中<Java IO(1)基础知识——字节与字符>了解到了什么是字节和字符,主要是为了对Java IO中有关字节流和字符流有一个更好的了解. 本文所述的输出输出指的是Java中传统的I ...

  2. 16. 使用Exhibitor管理ZooKeeper

    Exhibitor是管理ZooKeeper服务实例的主管服务.由Netflix开发和开放源码,对于ZooKeeper的实例监控.备份/恢复.清理和可视化非常有用. Note Netflix Exhib ...

  3. Linux驱动调试-根据oops的栈信息,确定函数调用过程

    上章链接入口: http://www.cnblogs.com/lifexy/p/8006748.html 在上章里,我们分析了oops的PC值在哪个函数出错的,那如何通过栈信息来查看出错函数的整个调用 ...

  4. 在Linux中使用线程

    我并不假定你会使用Linux的线程,所以在这里就简单的介绍一下.如果你之前有过多线程方面的编程经验,完全可以忽略本文的内容,因为它非常的初级. 首先说明一下,在Linux编写多线程程序需要包含头文件p ...

  5. The authenticity of host 'github.com (192.30.253.113)' can't be established.

    在初始化git之后(git init),同时在github建立好仓库之后,本地也新增了ssh kye(ssh-keygen -t rsa -C 'mail address'),同时也在本地新增了远程仓 ...

  6. IIS网站本机可以访问但局域网其他机器无法访问 解决方法

    在IIS部署网站的时候,发现只有本机可以访问,通过localhost和IP地址都可以,但是当局域网其他机器访问我的网站的时候,无响应. 我的是WIN10的系统 解决方法:   网站所对应的端口必须对外 ...

  7. 数据库文件*.sdf文件定时备份,但是大小的增量在不断增长的问题排查

    在某项目上,使用SQL Server数据库,现场反馈每天定时备份数据库文件,每天的数据量是400多个申请单的量.之前每天增长量是50M,但是后来两天增长量是80M,每天的数据量差不多. 到底从什么地方 ...

  8. 【luogu P1396】营救

    https://www.luogu.org/problem/show?pid=1396 弱化版的货车运输,用并查集维护连通块,将边按权值升序排序后依次插入直到两点连通,最后插入的边的权值就是最小的拥挤 ...

  9. ubuntu16.04 Qt5.8 如何使用opecv3.2

    关于opencv3.2的编译有一大堆教程.可自寻查看.在Qt中使用opencv需要在pro文件中添加 相应的头文件和 动态链接库.如下 INCLUDEPATH += . INCLUDEPATH += ...

  10. springMVC(1)---获取前段数据

    springMVC(1)---获取前段数据 首先说明,如果你学过Struts2,那么在学springMVC就会简单很多,我也不最基础的开始写了,我前篇文章搭建了个ssm框架,算是springmvc入门 ...