SpringBoot整合Elasticsearch游标查询（scroll）

游标查询（scroll）简介

scroll 查询可以用来对 Elasticsearch 有效地执行大批量的文档查询，而又不用付出深度分页那种代价。

游标查询会取某个时间点的快照数据。查询初始化之后索引上的任何变化会被它忽略。它通过保存旧的数据文件来实现这个特性，结果就像保留初始化时的索引视图一样。

启用游标查询可以通过在查询的时候设置参数 scroll 的值为我们期望的游标查询的过期时间。游标查询的过期时间会在每次做查询的时候刷新，所以这个时间只需要足够处理当前批的结果就可以了，而不是处理查询结果的所有文档的所需时间。这个过期时间的参数很重要，因为保持这个游标查询窗口需要消耗资源，所以我们期望如果不再需要维护这种资源就该早点儿释放掉。设置这个超时能够让 Elasticsearch 在稍后空闲的时候自动释放这部分资源。

GET /old_index/_search?scroll=1m

{

    "query": { "match_all": {}},

    "sort" : ["_doc"],

    "size":  1000

}

scroll=1m：保持游标查询窗口一分钟。

返回结果示例：

{

    "_scroll_id": "cXVlcnlUaGVuRmV0Y2g7NTsxMDk5NDpkUmpiR2FjOFNhNnlCM1ZDMWpWYnRROzEwOTk1OmRSamJHYWM4U2E2eUIzVkMxalZidFE7MTA5OTM6ZFJqYkdhYzhTYTZ5QjNWQzFqVmJ0UTsxMTE5MDpBVUtwN2lxc1FLZV8yRGVjWlI2QUVBOzEwOTk2OmRSamJHYWM4U2E2eUIzVkMxalZidFE7MDs=",

    "took": 10,

    "timed_out": false,

    "_shards": {

        "total": 5,

        "successful": 5,

        "failed": 0

    },

    "hits": {

        "total": 2633253,

        "max_score": 1.0,

        "hits": [

            {

                "_index": "old_index",

                "_type": "old_index_type",

                "_id": "1",

                "_score": 1.0,

                "_source": {

                    ...

                }

            }

        ]

    }

}

这个查询的返回结果包括一个字段 _scroll_id，它是一个base64编码的长字符串。现在我们能传递字段 _scroll_id 到 _search/scroll 查询接口获取下一批结果：

GET /_search/scroll

{

    "scroll": "1m",

    "scroll_id" : "cXVlcnlUaGVuRmV0Y2g7NTsxMDk5NDpkUmpiR2FjOFNhNnlCM1ZDMWpWYnRROzEwOTk1OmRSamJHYWM4U2E2eUIzVkMxalZidFE7MTA5OTM6ZFJqYkdhYzhTYTZ5QjNWQzFqVmJ0UTsxMTE5MDpBVUtwN2lxc1FLZV8yRGVjWlI2QUVBOzEwOTk2OmRSamJHYWM4U2E2eUIzVkMxalZidFE7MDs="

}

注意：需要再次设置游标查询过期时间为一分钟。

这个游标查询返回下一批结果。

另外尽管我们指定字段 size 的值为1000，但是我们有可能取到超过这个值数量的文档。当查询的时候，字段 size 作用于单个分片，所以每个批次实际返回的文档数量最大为 size * number_of_primary_shards。

注意：游标查询每次返回一个新字段 _scroll_id。每次我们做下一次游标查询，我们必须把前一次查询返回的字段_scroll_id 传递进去。当没有更多的结果返回的时候，我们就处理完所有匹配的文档了。

整合

新增以下三个方法：

/**

 * 游标查询

 * @param params 查询入参

 * @param indexName 索引名称

 * @param type 索引类型

 * @param defaultSort 默认排序

 * @param keyMappings 字段映射

 * @param keyMappingsMap 索引对应字段映射

 * @param scrollTimeInMillis 游标开启的时间

 * @return Page

 */

protected Page<Map> commonStartScroll(Map<String, String> params, String indexName, String type, String defaultSort,

                                 Map<Key, FieldDefinition> keyMappings,

                                 Map<String, Map<Key, FieldDefinition>> keyMappingsMap, long scrollTimeInMillis) {

    SearchQuery searchQuery = buildSearchQuery(params, indexName, type, defaultSort, keyMappings, keyMappingsMap);

    return elasticsearchTemplate.startScroll(scrollTimeInMillis, searchQuery, Map.class);

}

/**

 * 游标查询

 * @param scrollId 游标ID

 * @param scrollTimeInMillis 游标开启的时间

 * @return Page

 */

protected Page<Map> commonContinueScroll(String scrollId, long scrollTimeInMillis) {

    return elasticsearchTemplate.continueScroll(scrollId, scrollTimeInMillis, Map.class);

}

/**

 * 根据游标ID清除游标（提早释放资源，降低ES的负担）

 * @param scrollId 游标ID

 */

protected void clearScroll(String scrollId) {

    elasticsearchTemplate.clearScroll(scrollId);

}

StoreSearchService中增加游标查询方法以及清除游标方法：

/**

 * 游标查询

 * @param params 查询条件

 * @return page

 */

public Page<Map> scroll(Map<String, String> params) {

    IndexConfig config = indexEntity.getConfigByDocCode(DOC_CODE);

    // 如果请求参数包含游标ID，则说明执行翻页操作，否则认为开启新的游标查询

    String scrollId = params.getOrDefault(SCROLL_ID, null);

    if (StringUtils.isNotBlank(scrollId)) {

        return commonContinueScroll(params.get(scrollId), config.getScrollTimeInMillis());

    }

    return commonStartScroll(params, config.getIndexName(), config.getType(), DEFAULT_SORT,

            keyMappings, keyMappingsMap, config.getScrollTimeInMillis());

}

public void clearScroll(String scrollId) {

    super.clearScroll(scrollId);

}

对外暴露接口：

@PostMapping("/scroll")

public ResponseResult scroll(@RequestBody Map<String, String> params) {

    return ResponseResult.success(storeSearchService.scroll(params));

}

@GetMapping("/scroll/clear/{scrollId}")

public ResponseResult clearScroll(@PathVariable String scrollId) {

    storeSearchService.clearScroll(scrollId);

    return ResponseResult.success(null);

}

游标查询分为开启和继续两个步骤，接口/scroll中根据_scrollId判断为开启游标查询还是继续游标查询。

若条件允许的话，尽量将游标查询及时关闭，以释放ES集群的资源，降低负担。

源码

Git项目地址：https://github.com/lifengdi/search

如果觉得有帮助的话，请帮忙点赞、点星小小的支持一下~

谢谢~~

原文链接：https://www.lifengdi.com/archives/article/2119

SpringBoot整合Elasticsearch游标查询（scroll）的更多相关文章

elasticsearch 布尔过滤器游标查询 Scroll
组合过滤器 | Elasticsearch: 权威指南 | Elastic https://www.elastic.co/guide/cn/elasticsearch/guide/current/co ...
SpringBoot整合ElasticSearch实现多版本的兼容
前言在上一篇学习SpringBoot中,整合了Mybatis.Druid和PageHelper并实现了多数据源的操作.本篇主要是介绍和使用目前最火的搜索引擎ElastiSearch,并和Spring ...
ElasticSearch(2)---SpringBoot整合ElasticSearch
SpringBoot整合ElasticSearch 一.基于spring-boot-starter-data-elasticsearch整合开发环境:springboot版本:2.0.1,elast ...
springboot整合elasticsearch入门例子
springboot整合elasticsearch入门例子 https://blog.csdn.net/tianyaleixiaowu/article/details/72833940 Elastic ...
SpringBoot整合Elasticsearch详细步骤以及代码示例（附源码）
准备工作环境准备 JAVA版本 java version "1.8.0_121" Java(TM) SE Runtime Environment (build 1.8.0_121 ...
Springboot整合Elasticsearch报错availableProcessors is already set to [4], rejecting [4]
Springboot整合Elasticsearch报错今天使用SpringBoot整合Elasticsearch时候,相关的配置完成后,启动项目就报错了. nested exception is j ...
😊SpringBoot 整合 Elasticsearch （超详细）.md
SpringBoot 整合 Elasticsearch (超详细) 注意: 1.环境搭建安装es Elasticsearch 6.4.3 下载链接为了方便,环境使用Windows 配置解压后配置 ...
Springboot整合elasticsearch以及接口开发
Springboot整合elasticsearch以及接口开发搭建elasticsearch集群搭建过程略(我这里用的是elasticsearch5.5.2版本) 写入测试数据新建索引book( ...
Springboot整合ElasticSearch进行简单的测试及用Kibana进行查看
一.前言搜索引擎还是在电商项目.百度.还有技术博客中广泛应用,使用最多的还是ElasticSearch,Solr在大数据量下检索性能不如ElasticSearch.今天和大家一起搭建一下,小编是看完 ...

随机推荐

Wampserver报错、橙色、mysql打不开
Wampserver下的几个常见的问题最近在弄Wampserver,发现有几个问题存留在这里,今天就来解决一下吧首先就是关于报错的这个一个问题: 第二就是关于一直不变绿的原因关于报错: 在我的电 ...
Apache Jmter 压力测试教程
1.官网下载安装包,地址:http://jmeter.apache.org/download_jmeter. 2.下载得到解压包,双击解压. 3.点击/bin目录下面的jmeter.bat 启动软件 ...
SpringCloud-config分布式配置
为什么要统一管理微服务配置? 随着微服务不断的增多,每个微服务都有自己对应的配置文件.在研发过程中有测试环境.UAT环境.生产环境,因此每个微服务又对应至少三个不同环境的配置文件.这么多的配置文件,如 ...
C# .Net 委托和事件的区别
在.net中,事件是一种特殊的委托,那他到底特殊在哪,换句话说,加上event关键字到底有什么用,我理解主要有两方面,下面用实例说明: 一 .事件只能在本类型内部“触发”,委托不管在本类型内部还是外部 ...
JVM垃圾回收器前瞻
垃圾回收器的新发展 GC仍然处于飞速发展之中,目前的默认选项G1 GC在不断的进行改进,很多我们原来认为的缺点,例如串行的Full GC.Card Table扫描的低效等,都已经被大幅改进,例如, ...
Vue入门到精通
Vue.js - Day1 课程介绍前5天: 都在学习Vue基本的语法和概念:打包工具 Webpack , Gulp 后5天: 以项目驱动教学: 什么是Vue.js Vue.js 是目前最火的一个前 ...
git线上操作
选择线上仓库 """ 1.注册码云账号并登录:https://gitee.com/ 2.创建仓库(课堂截图) 3.本地与服务器仓库建立连接 ""&qu ...
空间向量变换，以及OpenGL的glm库简单应用
测试项目请查看GitHub库 GLBIproject2/GLBIProject2_2
C#Messenger分析和使用方法
目录源码分析使用方法没有返回值没有传参的消息写法没有返回值有参数的消息写法有返回值的消息写法有参数有返回值的委托 C#Messenger是UntiyCommunity里的一个工具类,其效果 ...
基础篇：深入解析JAVA反射机制
目录反射的概念获取Class的三种方法 JAVA反射API 反射机制应用的场景反射和JDK动态代理欢迎指正文中错误关注公众号,一起交流参考文章反射的概念 java的放射机制:在程序运行时 ...

SpringBoot整合Elasticsearch游标查询（scroll）

游标查询（scroll）简介

整合

源码

SpringBoot整合Elasticsearch游标查询（scroll）的更多相关文章

随机推荐

热门专题