使用 RediSearch 在 Redis 中进行全文检索
原文链接: 使用 RediSearch 在 Redis 中进行全文检索
Redis 大家肯定都不陌生了,作为一种快速、高性能的键值存储数据库,广泛应用于缓存、队列、会话存储等方面。
然而,Redis 在原生状态下并不支持全文检索功能,这使得处理文本数据变得相对困难。但是在有一些场景下还需要这样的功能,有什么好办法呢?答案就是 RediSearch。
RediSearch 是 Redis 的一个插件,它为 Redis 数据库添加了全文搜索和查询功能,使开发人员能够在 Redis 中高效地执行全文检索操作。
它基于 Redis Module API 构建,通过使用自定义的数据结构和索引算法,实现了高效的全文搜索功能。
安装
如果单纯用来测试的话,可以直接通过 docker 来启动;如果是生产环境,就需要根据公司的实际情况来支持了。
$ docker run -p 6379:6379 redis/redis-stack-server:latest
启动服务之后,可以使用 FT.* 命令集来体验搜索功能。
概览
为了使用全文搜索功能,我们必须将文档存储在哈希中,使用命令 FT.CREATE 创建索引并使用 FT.SEARCH 做文本搜索。
这样说可能会比较懵,看下面的示意图就明白了:

现在,让我们插入两条文档:
redis-cli 'hset post:1 title "hello world" body "this is a cool document"'
redis-cli 'hset post:2 title "goodbye everybody" body "this is the best document"'
上面命令创建两个哈希值,分别是 post:1 和 post:2,其中包含的字段是 title 和 body。
创建索引
接下来创建索引:
FT.CREATE post_index prefix 1 post: SCHEMA title TEXT body text

在这里,我们创建了 post_index 索引,它将索引以 post: 前缀开头的所有 Redis 哈希键。只有 title 和 body 字段才会被索引,并且索引立即生效。
搜索索引
使用 FT.SEARCH 命令,参数是索引名称和需要搜索的关键词:
FT.SEARCH post_index "world"

实时索引
当新增一个文档时,它会被自动添加到索引:
redis-cli 'hset post:3 title "really?" body "yeah"'
立即可以被搜索到:
> ft.search post_index "really"
1) (integer) 1
2) "post:3"
3) 1) "title"
2) "really?"
3) "body"
4) "yeah"
搜索特定字段
可以选择要搜索的字段,比如 title:
ft.search post_index "@title:world"
按列表中的任何单词搜索
类似于逻辑 OR 操作,比如要查找与 hello 或 goodbye 匹配的所有文档:
ft.search post_index "hello|goodbye"
搜索结果分页
和 SQL 是一样的,使用 LIMIT 关键词,比如:
ft.search post_index "world" LIMIT 10, 5
反向搜索
在搜索关键词前使用 - 来排除结果中包含该字段的信息:
ft.search post_index "-foo"
部分搜索
还可以使用 * 只搜索单词的一部分,比如要查找以 good 开头的单词的所有文档:
ft.search post_index "good*"
需要注意的是,这样做仅限于前缀,比如关键词是这样的话 *good,是不支持的。
模糊匹配
这个功能很强大,它是一种近似的搜索手段,使用 %。
假设你把想要查找的单词写错了,把 world 写成了 wold,它依然能查出来,比如:
ft.search post_index "%wold%"
总结
最近在工作中遇到了一个问题,因为数据都存储在了 Redis 中,而且大部分功能都可以满足。但其中有一个接口需要模糊查询,这在 Redis 原生方法中是不容易的。
所以查找了一些资料,了解到 RediSearch,使用一下还是挺方便的,并且完美地解决了我的问题。也把这篇文章分享给大家,希望对大家有帮助。
以上就是本文的全部内容,如果觉得还不错的话欢迎点赞,转发和关注,感谢支持。
参考文章:
- https://github.com/RediSearch
- https://medium.com/datadenys/full-text-search-in-redis-using-redisearch-31df0deb4f3e
推荐阅读:
使用 RediSearch 在 Redis 中进行全文检索的更多相关文章
- 在redis中使用lua脚本让你的灵活性提高5个逼格
在redis的官网上洋洋洒洒的大概提供了200多个命令,貌似看起来很多,但是这些都是别人预先给你定义好的,但你却不能按照自己的意图进行定制, 所以是不是感觉自己还是有一种被束缚的感觉,有这个感觉就对了 ...
- Redis系列之key操作命令与Redis中的事务详解(六)
序言 本篇主要目的有二: 1.展示所有数据类型中key的所有操作命令,以供大家学习,查阅,更深入的挖掘redis潜力. 2.掌握redis中的事务,让你的数据完整性一致性拥有更优的保障. redis命 ...
- redis中的key设置过期时间
EXPIRE key seconds 为给定 key 设置生存时间,当 key 过期时(生存时间为 0 ),它会被自动删除. 在 Redis 中,带有生存时间的 key 被称为『易失的 ...
- Redis中struct运用
c#操作缓存例如redis比较推荐ServiceStack 在redis中运用key-value存储数据,但是遇到结构体该如何处理,是类可通过get<type>(key)获得,那struc ...
- redis中setbit的用法
原文地址:http://www.zhihu.com/question/27672245 在redis中,存储的字符串都是以二级制的进行存在的.举例:设置一个 key-value ,键的名字叫“andy ...
- Redis中的简单事物以及消息订阅发布
Redis支持简单的事物,但是没有mysql的Innodb支持的那么的完善 我们接下来看一下Redis和Mysql的事物的一个对比: MySQL Redis 开启 start transactio ...
- Redis中5种数据结构的使用场景介绍
转载于:http://www.itxuexiwang.com/a/shujukujishu/redis/2016/0216/108.html?1455861435 一.redis 数据结构使用场景 原 ...
- redis中使用java脚本实现分布式锁
转载于:http://www.itxuexiwang.com/a/shujukujishu/redis/2016/0216/115.html?1455860390 edis被大量用在分布式的环境中,自 ...
- ServiceStack.Redis 中关系操作的局限与bug
redis是文档型的,nosql中难处理的是关系. 比如人可以发博客,博客可以有分类.按照传统sql中,用户表和分类表都是主表,博客表是从表,有用户的外键和分类的外键 如果使用文档型的思考方式. 为用 ...
- 关于Redis中的数据类型
一. Redis常用数据类型 Redis最为常用的数据类型主要有以下: String Hash List Set Sorted set 一张图说明问题的本质 图一: 图二: 代码: /* Object ...
随机推荐
- [ZJOI2020] 序列 线性规划做法/贪心做法
线性规划做法 同时也作为线性规划对偶的一个小小的学习笔记. 以下 \(\cdot\) 表示点积,\(b,c,x,y\) 是行向量. \(A\) 是矩阵,对于向量 \(u,v\) 若 \(\forall ...
- SQLlabs less1-10通关笔记
SQLlabs 通关笔记 mysql数据结构 在练习靶场前我们需要了解以下mysql数据库结构,mysql数据库5.0以上版本有一个自带的数据库叫做information_schema,该数据库下面有 ...
- 2022-11-21:第N高的薪水。表结构和数据的sql语句如下。请问sql语句如何写? DROP TABLE IF EXISTS employee; CREATE TABLE employee (
2022-11-21:第N高的薪水.表结构和数据的sql语句如下.请问sql语句如何写? DROP TABLE IF EXISTS employee; CREATE TABLE employee ( ...
- 2020-10-29:使用redis实现分布式限流组件,要求高并发场景同一IP一分钟内只能访问100次,超过限制返回异常,写出实现思路或伪代码均可。
福哥答案2020-10-29: 简单回答:固定窗口:string.key存ip,value存次数.滑动窗口:list.key存ip,value=list,存每次访问的时间. 中级回答:固定窗口:用re ...
- 2022-03-03:课程表 III。 这里有 n 门不同的在线课程,按从 1 到 n 编号。给你一个数组 courses ,其中 courses[i] = [durationi, lastDayi]
2022-03-03:课程表 III. 这里有 n 门不同的在线课程,按从 1 到 n 编号.给你一个数组 courses ,其中 courses[i] = [durationi, lastDayi] ...
- 2021-05-23:给定一个字符串str,str表示一个公式,公式里可能有整数、加减乘除符号和左右括号。返回公式的计算结果,难点在于括号可能嵌套很多层。str=“48*((70-65)-43)+8*
2021-05-23:给定一个字符串str,str表示一个公式,公式里可能有整数.加减乘除符号和左右括号.返回公式的计算结果,难点在于括号可能嵌套很多层.str="48*((70-65)-4 ...
- 2021-07-31:给定数组father,大小为N,表示一共有N个节点,father[i] = j 表示点i的父亲是点j, father表示的树一定是一棵树而不是森林,给定数组values,大小为N
2021-07-31:给定数组father,大小为N,表示一共有N个节点,father[i] = j 表示点i的父亲是点j, father表示的树一定是一棵树而不是森林,给定数组values,大小为N ...
- 基于Sentinel自研组件的系统限流、降级、负载保护最佳实践探索
作者:京东物流 杨建民 一.Sentinel简介 Sentinel 以流量为切入点,从流量控制.熔断降级.系统负载保护等多个维度保护服务的稳定性. Sentinel 具有以下特征: 丰富的应用场景:秒 ...
- 从零玩转之JPOM自动化部署本地构建 + SSH 发布 java 项目
简而轻的低侵入式在线构建.自动部署.日常运维.项目监控软件 一键部署Jpom 本文主要介绍: 如何从零开始使用一键安装的方式安装 Jpom 服务端+插件端配置 本文中服务端和插件端是安装在同一个服务器 ...
- python爬虫防止IP被封的一些措施(转)
python爬虫防止IP被封的一些措施(转) 在编写爬虫爬取数据的时候,因为很多网站都有反爬虫措施,所以很容易被封IP,就不能继续爬了.在爬取大数据量的数据时更是瑟瑟发抖,时刻担心着下一秒IP可能就被 ...