Java代码解决ElasticSearch的Result window is too large问题

调用ElasticSearch做分页查询时报错：

QueryPhaseExecutionException[Result window is too large, from + size must be less than or equal to: [10000] but was [666000]. See the scroll api for a more efficient way to request large data sets. This limit can be set by changing the [index.max_result_window] index level setting.]; }

提示用from+size方式有1万条数据查询的限制，需要更改index.max_result_window参数的值。

翻了下elasticsearch官网的文档：

index.max_result_window

The maximum value of from + size for searches to this index.Defaults to 10000. 
Search requests take heap memory and time proportional to from + size and this limits that memory. 
See Scroll or Search After for a more efficient alternative to raising this.

说是用传统方式（from + size）查询占用内存空间且比较消耗时间，所以做了限制。

问题是用scroll方式做后台分页根本行不通。

不说用scroll方式只能一页页的翻这种不人性化的操作。页码一多，scrollId也很难管理啊。

所以继续鼓捣传统方式的分页。

上网查了下设置max_result_window的方法，全都是用crul或者http方式改的。

后来无意间看到了一篇文档： https://blog.csdn.net/tzconn/article/details/83309516

结合之前逛elastic中文社区的时候知道这个参数是索引级别的。于是小试了一下，结果竟然可以了。

java代码如下：

public SearchResponse search(String logIndex, String logType, QueryBuilder query, 
                 List<AggregationBuilder> agg, int page, int size) {

        page = page > 0 ? page - 1 : page;

        TransportClient client = getClient();

        SearchRequestBuilder searchRequestBuilder = client.prepareSearch(logIndex.split(","))

                .setTypes(logType.split(","))

                .setSearchType(SearchType.DFS_QUERY_THEN_FETCH)

                .addSort("createTime", SortOrder.DESC);

        if (agg != null && !agg.isEmpty()) {

            for (int i = 0; i < agg.size(); i++) {

                searchRequestBuilder.addAggregation(agg.get(i));

            }

        }

        updateIndexs(client, logIndex, page, size);

        SearchResponse searchResponse = searchRequestBuilder

                .setQuery(query)

                .setFrom(page * size)

                .setSize(size)

                .get();

        return searchResponse;

    }

    //更新索引的max_result_window参数

    private boolean updateIndexs(TransportClient client, String indices, int from, int size) {

        int records = from * size + size;

        if (records <= 10000) return true;

        UpdateSettingsResponse indexResponse = client.admin().indices()

                .prepareUpdateSettings(indices)

                .setSettings(Settings.builder()

                        .put("index.max_result_window", records)

                        .build()

                ).get();

        return indexResponse.isAcknowledged();

    }

搞定。

当然这段代码不好的地方在于：

每次查询超过10000万条记录的时候，都会去更新一次index。

这对原本就偏慢的from+size查询来说，更是雪上加霜了。

Java代码解决ElasticSearch的Result window is too large问题的更多相关文章

elastic query match_all 数据目标超过10000条出错 Result window is too large
起因 elastic做文本索引,match_all目标索引超过10000条时,出错 { "error": { "root_cause": [ { "t ...
Result window is too large, from + size must be less than or equal to [10000]
使用sql插件执行如下语句的时候报错http://10.127.0.1:9200/_sql?sql=select * from test limit 1000000 错误信息:{"error ...
Result window is too large, from + size must be less than or equal to: [10000] but was [78440]. See the scroll api for a more efficient way to request large data sets
{"error":{"root_cause":[{"type":"query_phase_execution_exception& ...
用java代码解决10元喝多少瓶汽水的问题
问题:汽水2元一瓶,四个盖子换一瓶,两个空瓶一瓶,问10元可以喝几瓶?(不许借别人空瓶或瓶盖,但可以先喝汽水再付空酒瓶或瓶盖) 最近同事让笔者看了一道脑筋急转弯的数学题,当然不是很难,只要会加减法应该 ...
用java代码解决excel打开csv文件乱码问题
Java 读取csv文件后,再保存到磁盘上,然后直接用Excel打开,你会发现里面都是乱码. 贴上代码: public class Test { public static void main(S ...
Java代码操作Elasticsearch
创建maven项目,导入依赖 <dependency> <groupId>junit</groupId> <artifactId>junit</a ...
Elasticsearch 的分页报错 result window is too large
检查自己分页查询的代码 Pageable pageable = new PageRequest(0, 10000); searchQuery.setPageable(pageable); // 分页效 ...
【max_result_window大小】 Result window is too large的问题
方法一: 如果需要搜索分页,可以通过from size组合来进行.from表示从第几行开始,size表示查询多少条文档.from默认为0,size默认为10, 如果搜索size大于10000,需要设置 ...
解决 Elasticsearch 超过 10000 条无法查询的问题
解决 Elasticsearch 超过 10000 条无法查询的问题问题描述分页查询场景,当查询记录数超过 10000 条时,会报错. 使用 Kibana 的 Dev Tools 工具查询从第 ...

随机推荐

Python入门基础学习三
Python入门基础学习三数据类型 Python区分整型和浮点型依靠的是小数点,有小数点就是浮点型. e记法:e就是10的意思,是一种科学的计数法,15000=1.5e4 布尔类型是一种特殊的整形 ...
SQLSERVER带端口号的链接方式
SQLSERVER带端口号的链接方式 <add key="BBAcnn" value="server=IP,端口号\实例名;database=TESTDB;uid= ...
[Oracle]Oracle部分函数
1.nvl(a,b) 若a为null,则b 2.to_char(date,'YY-MM-DD') 按格式将date类型转为字符串 to_date('1999/1/1','YY-MM-DD') 将字符串 ...
C#读取MP3文件的专辑图片和ID3V2Tag信息(带代码)
第二次更新,后面的代码有问题,有些专辑图片读取不到.发现是PNG图片的问题.在读取的过程中调试发现,图片帧前10个字节包含了图片的格式,在有些歌曲写着JPEG的格式,数据却是PNG的.先说下思路. j ...
Linux程序设计：目录维护
一.相关系统调用 1.1 chmod 改变访问权限. #include <sys/stat.h> int chmod(const char *path, mode_t mode) 1.2 ...
java学习笔记—JDBC1（16）
1.数据持久化 l 持久化(persistence):把数据保存到可掉电式存储设备中以供之后使用,也称为“固化”.在大多数情况下,服务器或客户端应用中数据的持久化是通过关系型数据库来实现 l 存储 ...
webpack 踩的坑
我是看着这篇博客学习的 http://www.jianshu.com/p/42e11515c10f# 看到loaders的时候,按照博主写法去试结果报错....找了好久,上网查了好多也看错误信息了 ...
Elastic Search 5.x Nest Multiple Queries C#
I'm using C# with those nuget packeges; <package id="Elasticsearch.Net" version="5 ...
逻辑卷磁盘管理和dd命令
底层PV 中层VG 上层LV PE(phsical extent):在逻辑层次上,VG把PV分成固定大小的块,这些块就叫PE,默认为4M ,创建LV的过程就是分多少个PE的过程. 自动分区的过 ...
C++多线程编程二
1. 死锁与解锁: #include <iostream> #include <thread> #include <mutex> using namespace s ...

Java代码解决ElasticSearch的Result window is too large问题

Java代码解决ElasticSearch的Result window is too large问题的更多相关文章

随机推荐

热门专题