1.需求

业务中需要实现在两个集合中搜索数据,并返回交集。

用SQL的伪代码可以描述如下:

select key from set1 where sorted_key between min and max
INTERSECT
select key from set2 where sorted_key between min and max

2.现有存储格式

业务使用了redis的有序集合(sorted set)来存储数据:

set1 ->
field1 -> value1
field2 -> value2
set2 ->
field1 -> value1
field2 -> value2

常规的思路是:

# 分页拉取KEY1,然后分页拉取KEY2,然后计算交集
ZRANGEBYSCORE set1 ${min} ${max} WITHSCORES LIMIT 0 1000
ZRANGEBYSCORE set1 ${min} ${max} WITHSCORES LIMIT 1000 1000

3.lua实现

看了一下redis的lua脚本功能,可以完全在redis服务器端完成:


--like sql: insert ...select, 实现类似SQL中的insert select语句
local function select_and_insert(from_key, min_value, max_value, to_key)
local cnt = redis.call("ZCOUNT", from_key, min_value, max_value)
local start = 0
local limit = 1000
while(start<cnt)
do
local value = redis.call("ZRANGEBYSCORE", from_key, min_value, max_value, "WITHSCORES", "LIMIT", start, limit)
start = start + (#value)/2
local idx = 1
while( idx<=#value )
do
value[idx], value[idx+1] = value[idx+1], value[idx]
idx = idx + 2
end
local ret = redis.call("ZADD", to_key, unpack(value))
if(ret==false)
then
return false, "zadd fail"
end
end
return true,"success"
end --like select intersect,实现类似SQL中的select intersect
local function intersect(key1, min1, max1, key2, min2, max2, to_key)
local temp_key_1 = "___temp_1"
redis.call("DEL", temp_key_1)
local ret,msg = select_and_insert(key1, min1, max1, temp_key_1)
if(ret==false)
then
return false, key1.." fail:"..msg
end
--
local temp_key_2 = "___temp_2"
redis.call("DEL", temp_key_2)
ret,msg = select_and_insert(key2, min2, max2, temp_key_2)
if(ret==false)
then
redis.call("DEL", temp_key_1)
return false, key2.." fail:"..msg
end
--
ret = redis.call("ZINTERSTORE", to_key, 2, temp_key_1, temp_key_2)
redis.call("DEL", temp_key_1)
redis.call("DEL", temp_key_2)
if(ret==false)
then
return false, "ZINTERSTORE fail"
end
return true, string.format("intersect count is %d", ret)
end local function main()
return intersect("set1", 10, 100, "set2", 200, 400, "my_result")
end return main()

在命令行测试一下:

redis-cli -h 192.168.0.2 -p 6379 -a "my_password" --eval test_intersect.lua

达到了预期的效果。

4.做一个script load工具

按照网上的方法这样导入脚本,始终不成功:

redis-cli -h 192.168.0.2 -p 6379 -a "my_password" SCRIPT LOAD "`cat test_intersect.lua`"

于是用golang基于gin框架来做一个脚本保存功能:

上传表单:

//注册
my_gin.GET("/redis_script_form", redisScriptForm) func redisScriptForm(c *gin.Context){
c.Data(200, "text/html; charset=utf-8", []byte(`
<html>
<body>
<form method="POST" enctype="application/x-www-form-urlencoded" action="/redis_script_load">
<textarea name="lua" style="width:100%; height:300px"></textarea><br/>
<input type="submit" value="upload script"/>
</form>
</body>
</html>
`))
}

保存接口

//
import "github.com/go-redis/redis/v7"
//
my_gin.POST("/redis_script_load", redisScriptLoad)
func redisScriptLoad(c *gin.Context){
code := c.PostForm("lua")
redis := utils.GetRedisClient()
val, err := redis.ScriptLoad(code).Result()
if err!=nil{
c.Data(200, "text/plain", []byte(fmt.Sprintf("redis.ScriptLoad fail:%s", err.Error() )))
return
}
c.Data(200, "text/plain", []byte(fmt.Sprintf("redis.ScriptLoad success:sha=%s", val )))
}

保存成功会返回代码的SHA hash值。

5.用golang调用redis中的lua脚本

lua的main()改一改

首先要再修改之前lua代码中的main(),不要写死参数:

local function main()
local set1_param={KEYS[1], ARGV[1], ARGV[2]}
local set2_param={KEYS[2], ARGV[3], ARGV[4]}
local temp_key = "__temp_3"
--
redis.call("DEL", temp_key)
local ret,msg = intersect(set1_param[1], set1_param[2], set1_param[3], set2_param[1], cpu_param[2], set2_param[3], temp_key)
if(ret==false)
then
return msg
end local values = redis.call("ZRANGE", temp_key, "0", "100000000000")
redis.call("DEL", temp_key)
return values
end

命令行测试

再次保存代码,得到SHA值。

用命令行进行测试:

EVALSHA f2f7d1b5439b8bb4c8320a7dce4b54c133a3d47d 2 "set1" "set2" "10" "1000" "100" "3000"

得到了预想的结果。

golang代码测试:

//注册
my_gin.GET("/redis_eval_script", redisEvalScript) func redisEvalScript(c *gin.Context){
redis := utils.GetRedisClient()
val, err := redis.Do("EVALSHA",
"f2f7d1b5439b8bb4c8320a7dce4b54c133a3d47d",
2, "set1", "set2", 10, 1000,
100, 3000).Result()
if err!=nil{
ResponseError(c, err.Error())
return
}
j,err := json.Marshal(val)
if err!=nil{
c.Data(200, "text/plain", []byte(fmt.Sprintf("EVALSHA:%s", err.Error() )))
return
}
c.Data(200, "text/plain; charset=utf-8",
[]byte(fmt.Sprintf("json:\n%s", string(j))))
}

have fun!

======

2020-05-11补充:

  • 这个东东可以玩玩,使用前需要认真测试
  • 建议运行在slave上,不要在master上
  • 创造临时KEY的时候可能会产生大量的IO,而目前我还没找到一种临时KEY只存在于内存的方法

使用redis+lua实现SQL中的select intersect的效果的更多相关文章

  1. 教您如何使用SQL中的SELECT LIKE like语句

    LIKE语句在SQL有着不可替代的重要作用,下文就将为您介绍SQL语句中SELECT LIKE like的详细用法,希望对您能有所帮助. LIKE语句的语法格式是:select * from 表名 w ...

  2. mysql中select into 和sql中的select into 对比

    现在有张表为student,我想将这个表里面的数据复制到一个为dust的新表中去.answer 01: create table dust select * from student;//用于复制前未 ...

  3. 关于SQL中SELECT *(星号)的危害论

    听闻有许多人是禁止开发人员在SQL中使用SELECT *的,这里翻译一下StackOverflow的一篇提问,个人认为相当客观 [SELECT *]危害主要有以下几点: 给数据消费者传数据的低效.当你 ...

  4. oracle PL/SQL(procedure language/SQL)程序设计(在PL/SQL中使用SQL)

    在PL/SQL程序中,允许使用的SQL语句只有DML和事务控制语句,使用DDL语句是非法的.使用SELECT语句从数据库中选取数据时,只能返回一行数据.使用COMMIT,  ROLLBACK, 和SA ...

  5. Mysql训练:两个表中使用 Select 语句会导致产生 笛卡尔乘积 ,两个表的前后顺序决定查询之后的表顺序

    力扣:超过经理收入的员工 Employee 表包含所有员工,他们的经理也属于员工.每个员工都有一个 Id,此外还有一列对应员工的经理的 Id. +----+-------+--------+----- ...

  6. 正则表达式小技巧,sql中in的字符串处理

    工作中我经常写sql,当写带in的语句时,需要敲好多单引号,逗号,敲写起来容易易出错.因此,我写了一个小工具,处理这种繁琐工作.原理简单,利用正则表达式匹配.替换. 先看界面,一个html页面,包含三 ...

  7. 【代码分享】用redis+lua实现多个集合取交集并过滤,类似于: select key from set2 where key in (select key from set1) and value>=xxx

    redis中的zset结构可以看成一个个包含数值的集合,或者认为是一个关系数据库中用列存储方式存储的一列. 需求 假设我有这样一个数据筛选需求,用SQL表示为: select key from set ...

  8. SQL中SET和SELECT赋值的区别

    最近的项目写的SQL比较多,经常会用到对变量赋值,而我使用SET和SELECT都会达到效果. 那就有些迷惑,这两者有什么区别呢?什么时候哪该哪个呢? 经过网上的查询,及个人练习,总结两者有以下几点主要 ...

  9. sql 中set和select区别

    基于SQL中SET与SELECT赋值的区别详解 2012年09月06日 ⁄ 综合 ⁄ 共 912字 ⁄ 字号 小 中 大 ⁄ 评论关闭 最近的项目写的SQL比较多,经常会用到对变量赋值,而我使用SET ...

随机推荐

  1. AT2686 [ARC080A] 4-adjacent 题解

    Content 给定一个长度为 \(n\) 的数列 \(a\),请将其重新排列,使得 \(\forall i\in[1,n-1]\),都有 \(4\mid (a_i\cdot a_{i+1})\),或 ...

  2. Tornado WEB服务器框架 Epoll-- 【Mysql数据库】

    5.1 数据库 与Django框架相比,Tornado没有自带ORM,对于数据库需要自己去适配.我们使用MySQL数据库. 在Tornado3.0版本以前提供tornado.database模块用来操 ...

  3. springboot等javaweb项目将jar包安装(打包)到本地Maven仓库

    在开发过程中有时会用到maven仓库里没有的jar包或者本地的jar包 1.打开jar所在文件夹,假设我们要将 taobao-sdk-java-auto_1479188381469-20200121. ...

  4. Qt5使用QSqlQuery读写sqlite3数据库

    概述 本文将介绍使用 Qt5使用QSqlQuery读写sqlite3. 设计初衷: 项目需要使用配置文件,配置文件使用的是sqlite3 , 这是V1.0.0, 后期增加其他功能. 需要C++11支持 ...

  5. 【九度OJ】题目1126:打印极值点下标 解题报告

    [九度OJ]题目1126:打印极值点下标 解题报告 标签(空格分隔): 九度OJ [LeetCode] http://ac.jobdu.com/problem.php?pid=1126 题目描述: 在 ...

  6. 【LeetCode】665. 非递减数列 Non-decreasing Array(Python & C++)

    作者: 负雪明烛 id: fuxuemingzhu 公众号:每日算法题 本文关键词:数组,array,非递减,遍历,python,C++ 目录 题目描述 题目大意 解题方法 一.错误代码 二.举例分析 ...

  7. 【剑指Offer】矩阵覆盖 解题报告(Python)

    [剑指Offer]矩阵覆盖 解题报告(Python) 标签(空格分隔): LeetCode 题目地址:https://www.nowcoder.com/ta/coding-interviews 题目描 ...

  8. RASP Runtime Application Self-protection 运行时应用自我保护 介绍及优缺点

    RASP 介绍 Runtime Application Self-protection 运行时应用自我保护 [图源:绿盟科技] 概念 Gartner (著名信息技术研究和分析厂商) 在2014年提出了 ...

  9. 第十个知识点:RSA和强RSA问题有什么区别?

    第十个知识点:RSA和强RSA问题有什么区别 这个密码学52件事数学知识的第一篇,也是整个系列的第10篇.这篇介绍了RSA问题和Strong-RSA问题,指出了这两种问题的不同之处. 密码学严重依赖于 ...

  10. <学习opencv>图像、视频和数据文件

    /*=========================================================================*/ // openCV中的函数 /*====== ...