Java代码解决ElasticSearch的Result window is too large问题

调用ElasticSearch做分页查询时报错：

QueryPhaseExecutionException[Result window is too large, from + size must be less than or equal to: [10000] but was [666000]. See the scroll api for a more efficient way to request large data sets. This limit can be set by changing the [index.max_result_window] index level setting.]; }

提示用from+size方式有1万条数据查询的限制，需要更改index.max_result_window参数的值。

翻了下elasticsearch官网的文档：

index.max_result_window

The maximum value of from + size for searches to this index.Defaults to 10000. 
Search requests take heap memory and time proportional to from + size and this limits that memory. 
See Scroll or Search After for a more efficient alternative to raising this.

说是用传统方式（from + size）查询占用内存空间且比较消耗时间，所以做了限制。

问题是用scroll方式做后台分页根本行不通。

不说用scroll方式只能一页页的翻这种不人性化的操作。页码一多，scrollId也很难管理啊。

所以继续鼓捣传统方式的分页。

上网查了下设置max_result_window的方法，全都是用crul或者http方式改的。

后来无意间看到了一篇文档： https://blog.csdn.net/tzconn/article/details/83309516

结合之前逛elastic中文社区的时候知道这个参数是索引级别的。于是小试了一下，结果竟然可以了。

java代码如下：

public SearchResponse search(String logIndex, String logType, QueryBuilder query, 
                 List<AggregationBuilder> agg, int page, int size) {

        page = page > 0 ? page - 1 : page;

        TransportClient client = getClient();

        SearchRequestBuilder searchRequestBuilder = client.prepareSearch(logIndex.split(","))

                .setTypes(logType.split(","))

                .setSearchType(SearchType.DFS_QUERY_THEN_FETCH)

                .addSort("createTime", SortOrder.DESC);

        if (agg != null && !agg.isEmpty()) {

            for (int i = 0; i < agg.size(); i++) {

                searchRequestBuilder.addAggregation(agg.get(i));

            }

        }

        updateIndexs(client, logIndex, page, size);

        SearchResponse searchResponse = searchRequestBuilder

                .setQuery(query)

                .setFrom(page * size)

                .setSize(size)

                .get();

        return searchResponse;

    }

    //更新索引的max_result_window参数

    private boolean updateIndexs(TransportClient client, String indices, int from, int size) {

        int records = from * size + size;

        if (records <= 10000) return true;

        UpdateSettingsResponse indexResponse = client.admin().indices()

                .prepareUpdateSettings(indices)

                .setSettings(Settings.builder()

                        .put("index.max_result_window", records)

                        .build()

                ).get();

        return indexResponse.isAcknowledged();

    }

搞定。

当然这段代码不好的地方在于：

每次查询超过10000万条记录的时候，都会去更新一次index。

这对原本就偏慢的from+size查询来说，更是雪上加霜了。

Java代码解决ElasticSearch的Result window is too large问题的更多相关文章

elastic query match_all 数据目标超过10000条出错 Result window is too large
起因 elastic做文本索引,match_all目标索引超过10000条时,出错 { "error": { "root_cause": [ { "t ...
Result window is too large, from + size must be less than or equal to [10000]
使用sql插件执行如下语句的时候报错http://10.127.0.1:9200/_sql?sql=select * from test limit 1000000 错误信息:{"error ...
Result window is too large, from + size must be less than or equal to: [10000] but was [78440]. See the scroll api for a more efficient way to request large data sets
{"error":{"root_cause":[{"type":"query_phase_execution_exception& ...
用java代码解决10元喝多少瓶汽水的问题
问题:汽水2元一瓶,四个盖子换一瓶,两个空瓶一瓶,问10元可以喝几瓶?(不许借别人空瓶或瓶盖,但可以先喝汽水再付空酒瓶或瓶盖) 最近同事让笔者看了一道脑筋急转弯的数学题,当然不是很难,只要会加减法应该 ...
用java代码解决excel打开csv文件乱码问题
Java 读取csv文件后,再保存到磁盘上,然后直接用Excel打开,你会发现里面都是乱码. 贴上代码: public class Test { public static void main(S ...
Java代码操作Elasticsearch
创建maven项目,导入依赖 <dependency> <groupId>junit</groupId> <artifactId>junit</a ...
Elasticsearch 的分页报错 result window is too large
检查自己分页查询的代码 Pageable pageable = new PageRequest(0, 10000); searchQuery.setPageable(pageable); // 分页效 ...
【max_result_window大小】 Result window is too large的问题
方法一: 如果需要搜索分页,可以通过from size组合来进行.from表示从第几行开始,size表示查询多少条文档.from默认为0,size默认为10, 如果搜索size大于10000,需要设置 ...
解决 Elasticsearch 超过 10000 条无法查询的问题
解决 Elasticsearch 超过 10000 条无法查询的问题问题描述分页查询场景,当查询记录数超过 10000 条时,会报错. 使用 Kibana 的 Dev Tools 工具查询从第 ...

随机推荐

REQUEST的TRACE文件
--REQUEST的TRACE文件 SELECT 'Trace Name: ' || DEST.VALUE || '/' || LOWER (DBNM.VAL ...
CentOS6.4 X86_64 kvm+PXE备忘
Install 安装 1 2 3 4 5 # yum install qemu-kvm qemu-img # 使用kvm至少要安装的包,一个提供用户级别kvm模拟器,一个提供磁盘镜像的管理 # 安装虚 ...
php的循环与引用的一个坑
上代码 $arr = array( 'a'=> 'a11', 'b'=> 'b22', 'c'=> 'c33', ); foreach ($arr as $k=>&$v ...
webservice需要的包以及demo
包地址:http://pan.baidu.com/s/1qWyPgqo demo:http://pan.baidu.com/s/1dDvNJg9
CDH4.1.2 集群安装配置详细过程
http://wenku.baidu.com/link?url=Wu43MFbzKH8hu7AgGfajmOr0WpRMX_gJlMDUs6pSrBK2LOJWIMpfWZa7IW-BSPko1yGl ...
自己从0开始学习Unity的笔记 II （C#条件语句基础练习）
首先,自己用了下三目表达式,来做了一个闰年的判断,也就是能被400整除,或者是能够被4整除,但是不能被100整除的年份. int year; //输入的年 bool fourHunderd; //能被 ...
[C#学习笔记]Func委托与Action委托
学习一项新知识的时候,最好的方法就是去实践它. 前言 <CLR via C#>这本神书真的是太有意思了!好的我的前言就是这个. Fun 如果要用有输入参数,有返回值的委托,那么Func委托 ...
python--深浅拷贝 join() 列表和字典的删除 fromkeys建立字典
北京的冬天雾霾依旧很重,依稀记得人生初见雾霾时的样子,那时的回忆也是有些尴尬,不过雾霾也伴随了我的成长,成为了我肺泡中不可分割的一部分. 今天我想写的是拷贝的问题,不过在这之前我想先补充一点关于字符串 ...
Net Manager测试连接测试没有成功，用户权限问题，以管理员身份运行后测试成功
Net Manager测试连接测试没有成功,截图如下:
关于一些blog优化
有很多的好看的$java\ script$ 可以大大的增加$blog$的好看度. 这里,本宝宝就列举几个 upd:不定期更新 1.有木有觉得背景的小姐姐和雪花特效极其的配啊啊啊!!! 页面定制CSS插 ...

Java代码解决ElasticSearch的Result window is too large问题

Java代码解决ElasticSearch的Result window is too large问题的更多相关文章

随机推荐

热门专题