ES Search API
Search API
搜索请求
SearchRequest用于与搜索文档、聚合、suggestions相关的任何操作,还提供了在结果文档上请求高亮的方法。
在最基本的表单中,我们可以向请求添加查询:
SearchRequest searchRequest = new SearchRequest();
SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
searchSourceBuilder.query(QueryBuilders.matchAllQuery());
searchRequest.source(searchSourceBuilder);
- 创建
SeachRequest,没有参数,这将针对所有索引运行。 - 大多数搜索参数都添加到
SearchSourceBuilder中,它为搜索请求body中的所有内容提供了setter。 - 将
match_all查询添加到SearchSourceBuilder。 - 将
SearchSourceBuilder添加到SeachRequest。
可选参数
我们先来看一下SearchRequest的一些可选参数:
SearchRequest searchRequest = new SearchRequest("posts");
searchRequest.types("doc");
- 将请求限制为一个索引。
- 将请求限制为一个类型。
还有一些其他有趣的可选参数:
searchRequest.routing("routing");
- 设置路由参数。
searchRequest.indicesOptions(IndicesOptions.lenientExpandOpen());
- 设置
IndicesOptions控制如何解析不可用的索引以及如何扩展通配符表达式。
searchRequest.preference("_local");
- 使用首选项参数,例如执行搜索以优先选择本地碎片,默认是随机的跨碎片。
使用SearchSourceBuilder
控制搜索行为的大多数选项都可以在SearchSourceBuilder上设置,它包含或多或少与Rest API的搜索请求body中等效的选项。
以下是一些常见选项的几个示例:
SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
sourceBuilder.query(QueryBuilders.termQuery("user", "kimchy"));
sourceBuilder.from(0);
sourceBuilder.size(5);
sourceBuilder.timeout(new TimeValue(60, TimeUnit.SECONDS));
- 使用默认选项创建
SearchSourceBuilder。 - 设置查询,可以是任何类型的
QueryBuilder。 - 设置确定结果要从哪个索引开始搜索的
from选项,默认为0。 - 设置确定搜索命中返回的数的
size选项,默认为10。 - 设置一个可选的超时,控制允许搜索的时间。
在此之后,只需将SearchSourceBuilder添加到SearchRequest:
SearchRequest searchRequest = new SearchRequest();
searchRequest.indices("posts");
searchRequest.source(sourceBuilder);
构建查询
使用QueryBuilder对象创建搜索查询,QueryBuilder存在对于Elasticsearch的查询DSL支持的每种搜索查询类型。
可以使用其构造函数创建QueryBuilder:
MatchQueryBuilder matchQueryBuilder = new MatchQueryBuilder("user", "kimchy");
- 创建一个在字段“user”上匹配文本“kimchy”的全文匹配查询。
创建后,QueryBuilder对象提供了配置其创建的搜索查询选项的方法:
matchQueryBuilder.fuzziness(Fuzziness.AUTO);
matchQueryBuilder.prefixLength(3);
matchQueryBuilder.maxExpansions(10);
- 在匹配查询上启用模糊匹配。
- 在匹配查询上设置前缀长度选项。
- 设置最大扩展选项以控制查询的模糊过程。
也可以使用QueryBuilders实用程序类创建QueryBuilder对象,此类提供了可用于使用流畅的编程样式创建QueryBuilder对象的辅助方法:
QueryBuilder matchQueryBuilder = QueryBuilders.matchQuery("user", "kimchy")
.fuzziness(Fuzziness.AUTO)
.prefixLength(3)
.maxExpansions(10);
无论用于创建它的方法是什么,都必须将QueryBuilder对象添加到SearchSourceBuilder,如下所示:
searchSourceBuilder.query(matchQueryBuilder);
构建查询页面提供了所有可用的搜索查询的列表及其相应的QueryBuilder对象和QueryBuilders辅助方法。
指定排序
SearchSourceBuilder允许添加一个或多个SortBuilder实例,有四种特殊的实现(Field-,Score-,GeoDistance-和ScriptSortBuilder)。
sourceBuilder.sort(new ScoreSortBuilder().order(SortOrder.DESC));
sourceBuilder.sort(new FieldSortBuilder("_uid").order(SortOrder.ASC));
- 按
_score降序排序(默认值)。 - 也可以按
_id字段进行升序排序。
源过滤
默认情况下,搜索请求会返回文档_source的内容,但与Rest API中的内容一样,你可以覆盖此行为,例如,你可以完全关闭_source检索:
sourceBuilder.fetchSource(false);
该方法还接受一个或多个通配符模式的数组,以控制以更精细的方式包含或排除哪些字段:
String[] includeFields = new String[] {"title", "user", "innerObject.*"};
String[] excludeFields = new String[] {"_type"};
sourceBuilder.fetchSource(includeFields, excludeFields);
请求高亮
通过在SearchSourceBuilder上设置HighlightBuilder,可以实现高亮搜索结果,通过将一个或多个HighlightBuilder.Field实例添加到HighlightBuilder,可以为每个字段定义不同的高亮行为。
SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
HighlightBuilder highlightBuilder = new HighlightBuilder();
HighlightBuilder.Field highlightTitle =
new HighlightBuilder.Field("title");
highlightTitle.highlighterType("unified");
highlightBuilder.field(highlightTitle);
HighlightBuilder.Field highlightUser = new HighlightBuilder.Field("user");
highlightBuilder.field(highlightUser);
searchSourceBuilder.highlighter(highlightBuilder);
- 创建一个新的
HighlightBuilder。 - 为
title字段创建字段高光色。 - 设置字段高光色类型。
- 将字段高光色添加到高亮构建器。
Rest API文档中有许多选项需要详细说明,Rest API参数(例如pre_tags)通常由具有相似名称的setter更改而来(例如#preTags(String ...))。
稍后可以从SearchResponse中检索高亮的文本片段。
请求聚合
可以通过先创建适当的AggregationBuilder然后在SearchSourceBuilder上设置聚合来将聚合添加到搜索中,在以下示例中,我们在公司名称上创建terms聚合 ,使用子聚合在公司员工平均年龄上:
SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
TermsAggregationBuilder aggregation = AggregationBuilders.terms("by_company")
.field("company.keyword");
aggregation.subAggregation(AggregationBuilders.avg("average_age")
.field("age"));
searchSourceBuilder.aggregation(aggregation);
构建聚合页面提供了所有可用的聚合的列表及其对应的AggregationBuilder对象和AggregationBuilders辅助方法。
稍后我们将看到如何访问SearchResponse中的聚合。
请求Suggestion
要向搜索请求添加建议,请使用从SuggestBuilders工厂类中可轻松访问的SuggestionBuilder的实现之一,Suggestion构建器需要添加到顶级SuggestBuilder,它本身可以在SearchSourceBuilder上设置。
SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
SuggestionBuilder termSuggestionBuilder =
SuggestBuilders.termSuggestion("user").text("kmichy");
SuggestBuilder suggestBuilder = new SuggestBuilder();
suggestBuilder.addSuggestion("suggest_user", termSuggestionBuilder);
searchSourceBuilder.suggest(suggestBuilder);
- 为
user字段和文本kmichy创建一个新的TermSuggestionBuilder。 - 添加suggestion构建器并将其命名为
suggest_user。
我们稍后将看到如何从SearchResponse中检索suggestion。
分析查询和聚合
分析API可用于分析特定搜索请求的查询和聚合的执行情况,为了使用它,必须在SearchSourceBuilder上将profile标志设置为true:
SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
searchSourceBuilder.profile(true);
执行SearchRequest后,相应的SearchResponse将包含分析结果。
同步执行
以下列方式执行SearchRequest时,客户端在继续执行代码之前等待返回SearchResponse:
SearchResponse searchResponse = client.search(searchRequest, RequestOptions.DEFAULT);
异步执行
执行SearchRequest也可以以异步方式完成,以便客户端可以直接返回,用户需要通过将请求和监听器传递给异步搜索方法来指定响应或潜在的故障如何处理:
client.searchAsync(searchRequest, RequestOptions.DEFAULT, listener);
- 要执行的
SearchRequest和执行完成时要使用的ActionListener。
异步方法不会阻塞并且立即返回,完成后,如果执行成功完成则使用onResponse方法回调ActionListener,如果失败则使用onFailure方法。
SearchResponse的典型监听器如下所示:
ActionListener<SearchResponse> listener = new ActionListener<SearchResponse>() {
@Override
public void onResponse(SearchResponse searchResponse) {
}
@Override
public void onFailure(Exception e) {
}
};
onResponse:执行成功完成时调用。onFailure:在整个SearchRequest失败时调用。
SearchResponse
通过执行搜索返回的SearchResponse提供有关搜索执行本身以及对返回文档的访问的详细信息,首先,有关于请求执行本身的有用信息,例如HTTP状态码,执行时间或请求是提前终止还是超时:
RestStatus status = searchResponse.status();
TimeValue took = searchResponse.getTook();
Boolean terminatedEarly = searchResponse.isTerminatedEarly();
boolean timedOut = searchResponse.isTimedOut();
其次,响应还通过提供有关搜索影响的碎片总数以及成功与不成功碎片的统计信息的碎片级别执行的信息,可以通过在ShardSearchFailures上迭代数组来处理可能的失败,如下例所示:
int totalShards = searchResponse.getTotalShards();
int successfulShards = searchResponse.getSuccessfulShards();
int failedShards = searchResponse.getFailedShards();
for (ShardSearchFailure failure : searchResponse.getShardFailures()) {
// failures should be handled here
}
检索SearchHits
要访问返回的文档,我们需要先获取响应中包含的SearchHits:
SearchHits hits = searchResponse.getHits();
SearchHits提供有关所有匹配的全局信息,例如总命中数或最高分数:
long totalHits = hits.getTotalHits();
float maxScore = hits.getMaxScore();
嵌套在SearchHits中的是可以迭代的单个搜索结果:
SearchHit[] searchHits = hits.getHits();
for (SearchHit hit : searchHits) {
// do something with the SearchHit
}
SearchHit提供对每个搜索命中的索引、类型、docId和分数等基本信息的访问:
String index = hit.getIndex();
String type = hit.getType();
String id = hit.getId();
float score = hit.getScore();
此外,它还允许你以简单的JSON-String或键/值对映射的形式返回文档源,在此映射中,常规字段由字段名称键控并包含字段值,多值字段作为对象列表返回,嵌套对象作为另一个键/值映射返回,这些案例需要相应地进行投射:
String sourceAsString = hit.getSourceAsString();
Map<String, Object> sourceAsMap = hit.getSourceAsMap();
String documentTitle = (String) sourceAsMap.get("title");
List<Object> users = (List<Object>) sourceAsMap.get("user");
Map<String, Object> innerObject =
(Map<String, Object>) sourceAsMap.get("innerObject");
检索高亮
如果需要,可以从结果中的每个SearchHit检索高亮的文本片段,命中对象提供对HighlightField实例的字段名称映射的访问,每个实例包含一个或多个高亮的文本片段:
SearchHits hits = searchResponse.getHits();
for (SearchHit hit : hits.getHits()) {
Map<String, HighlightField> highlightFields = hit.getHighlightFields();
HighlightField highlight = highlightFields.get("title");
Text[] fragments = highlight.fragments();
String fragmentString = fragments[0].string();
}
- 获取
title字段的高亮。 - 获取包含高亮的字段内容的一个或多个片段。
检索聚合
可以从SearchResponse检索聚合,先获取聚合树的根,Aggregations对象,然后按名称获取聚合。
Aggregations aggregations = searchResponse.getAggregations();
Terms byCompanyAggregation = aggregations.get("by_company");
Bucket elasticBucket = byCompanyAggregation.getBucketByKey("Elastic");
Avg averageAge = elasticBucket.getAggregations().get("average_age");
double avg = averageAge.getValue();
- 获取
by_company的terms聚合。 - 获取使用
Elastic键入的桶。 - 从该桶中获取
average_age子聚合。
请注意,如果按名称访问聚合,则需要根据所请求的聚合类型指定聚合接口,否则将引发ClassCastException:
Range range = aggregations.get("by_company");
- 这将引发异常,因为“by_company”是一个
terms聚合,但我们尝试将其作为range聚合进行检索。
还可以将所有聚合作为由聚合名称键入的映射进行访问,在这种情况下,需要显式地进行到正确聚合接口的转换:
Map<String, Aggregation> aggregationMap = aggregations.getAsMap();
Terms companyAggregation = (Terms) aggregationMap.get("by_company");
还有一些getter将所有顶级聚合作为列表返回:
List<Aggregation> aggregationList = aggregations.asList();
最后但并非最不重要的是,你可以迭代所有聚合,然后例如决定如何根据类型进一步处理它们:
for (Aggregation agg : aggregations) {
String type = agg.getType();
if (type.equals(TermsAggregationBuilder.NAME)) {
Bucket elasticBucket = ((Terms) agg).getBucketByKey("Elastic");
long numberOfDocs = elasticBucket.getDocCount();
}
}
检索suggestions
要从SearchResponse获取suggestions,请使用Suggest对象作为入口点,然后检索嵌套的suggestion对象:
Suggest suggest = searchResponse.getSuggest();
TermSuggestion termSuggestion = suggest.getSuggestion("suggest_user");
for (TermSuggestion.Entry entry : termSuggestion.getEntries()) {
for (TermSuggestion.Entry.Option option : entry) {
String suggestText = option.getText().string();
}
}
- 使用
Suggest类访问suggestions。 - 可以通过名称检索suggestions,你需要将它们分配给正确类型的Suggestion类(此处为
TermSuggestion),否则抛出ClassCastException。 - 迭代suggestion条目。
- 在一个条目中迭代选项。
检索性能分析结果
使用getProfileResults()方法从SearchResponse检索分析结果,此方法返回包含SearchSquest执行中涉及的每个碎片的ProfileShardResult对象的Map,ProfileShardResult使用唯一标识分析结果对应的碎片的键存储在Map中。
下面是一个示例代码,显示如何迭代每个碎片的所有分析结果:
Map<String, ProfileShardResult> profilingResults =
searchResponse.getProfileResults();
for (Map.Entry<String, ProfileShardResult> profilingResult : profilingResults.entrySet()) {
String key = profilingResult.getKey();
ProfileShardResult profileShardResult = profilingResult.getValue();
}
- 从
SearchResponse中检索ProfileShardResult的Map。 - 如果键已知,则可以通过碎片的键检索分析结果,否则迭代所有分析结果可能更简单。
- 检索标识
ProfileShardResult属于哪个碎片的键。 - 检索给定碎片的
ProfileShardResult。
ProfileShardResult对象本身包含一个或多个查询分析结果,每个查询针对基础Lucene索引执行:
List<QueryProfileShardResult> queryProfileShardResults =
profileShardResult.getQueryProfileResults();
for (QueryProfileShardResult queryProfileResult : queryProfileShardResults) {
}
- 检索
QueryProfileShardResult的列表。 - 迭代每个
QueryProfileShardResult。
每个QueryProfileShardResult都提供对详细查询树执行的访问,作为ProfileResult对象列表返回:
for (ProfileResult profileResult : queryProfileResult.getQueryResults()) {
String queryName = profileResult.getQueryName();
long queryTimeInMillis = profileResult.getTime();
List<ProfileResult> profiledChildren = profileResult.getProfiledChildren();
}
- 迭代分析结果。
- 检索Lucene查询的名称。
- 检索执行Lucene查询所花费的时间。
- 检索子查询的分析结果(如果有)。
Rest API文档包含有关分析查询的更多信息以及查询分析信息的说明。
QueryProfileShardResult还可以访问Lucene收集器的分析信息:
CollectorResult collectorResult = queryProfileResult.getCollectorResult();
String collectorName = collectorResult.getName();
Long collectorTimeInMillis = collectorResult.getTime();
List<CollectorResult> profiledChildren = collectorResult.getProfiledChildren();
- 检索Lucene收集器的分析结果。
- 检索Lucene收集器的名称。
- 检索执行Lucene收集器所花费的时间。
- 检索子收集器的分析结果(如果有)。
Rest API文档包含有关Lucene收集器的分析信息的更多信息。
以与查询树执行非常类似的方式,QueryProfileShardResult对象提供对详细聚合树执行的访问:
AggregationProfileShardResult aggsProfileResults =
profileShardResult.getAggregationProfileResults();
for (ProfileResult profileResult : aggsProfileResults.getProfileResults()) {
String aggName = profileResult.getQueryName();
long aggTimeInMillis = profileResult.getTime();
List<ProfileResult> profiledChildren = profileResult.getProfiledChildren();
}
- 检索
AggregationProfileShardResult。 - 迭代聚合分析结果。
- 检索聚合的类型(对应于用于执行聚合的Java类)。
- 检索执行Lucene收集器所花费的时间。
- 检索子聚合的分析结果(如果有)。
Rest API文档包含有关分析聚合的更多信息。
ES Search API的更多相关文章
- Elasticsearch 6.x版本全文检索学习之Search API
Elasticsearch 6.x版本全文检索学习之Search API. 1).Search API,实现对es中存储的数据进行查询分析,endpoind为_search,如下所示. 方式一.GET ...
- Elasticsearch7.X 入门学习第三课笔记----search api学习(URI Search)
原文:Elasticsearch7.X 入门学习第三课笔记----search api学习(URI Search) 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出 ...
- Search API 官方文档 可以用了查看自己的app
Search API October 24, 2012 - HTTPS is now supported for Search and Lookup requests. Please update y ...
- ElasticSearch Search API 简介
REST request URI curl 'localhost:9200/bank/_search?q=*&pretty' 1. localhost:9200/bank/_search,以 ...
- Elasticsearch学习笔记(二)Search API 与 Query DSL
一. Search API eg: GET /mall/product/_search?q=name:productName&sort=price desc 特点:search的请求参数都是以 ...
- 通过Google Custom Search API 进行站内搜索
今天突然想把博客的搜索改为google的站内搜索,印象中google adsense中好像提高这个站内搜索的代码,但苦逼的是google adsense帐号一直审核不通过,所以只能通过google c ...
- 申请Bing Search API
地址:https://datamarket.azure.com/home 没有帐号先注册一个,然后登录. 1:在数据中订阅Bing Search API,如果找不到就使用这个地址: https://d ...
- Elasticsearch7.X 入门学习第四课笔记---- Search API之(Request Body Search 和DSL简介)
原文:Elasticsearch7.X 入门学习第四课笔记---- Search API之(Request Body Search 和DSL简介) 版权声明:本文为博主原创文章,遵循CC 4.0 BY ...
- Twitter search API
Twitter crawler 与sina 微博类似,使用twitter api之前,首先要有twitter的账号,在twitter developer中创建应用(https://apps.twitt ...
随机推荐
- 2019 ICPC徐州网络赛 E. XKC's basketball team(二分)
计蒜客题目链接:https://nanti.jisuanke.com/t/41387 题目大意:给定一组无序序列,从第一个数开始,求最远比这个数大m的数,与这个数之间相隔多少数字?如果没有输出-1,否 ...
- 搭建私人通讯录/日历同步服务_使用cardDAV/calDAV服务
搭建私人通讯录/日历同步服务_使用cardDAV/calDAV服务 转载注明来源: 本文链接 来自osnosn的博客,写于 2020-02-18. Radicale, Radicale (对cardd ...
- es7实现数学乘方
//math.pow简写方法 console.log(2 ** 6)
- 第二十篇 Linux条件测试语句相关知识点介绍
条件测试语句的格式如下: [ 条件表达式 ] # 条件表达式两侧各有一个空格 按测试对象不同,条件测试语句共分为4中类型: 文件测试语句 逻辑测试语句 整数值比较语句 字符串比较语句 ...
- Android学习10
SharedPreferences 今天练习了利用SharedPreferences保存登录用户名密码: layout布局: <?xml version="1.0" enco ...
- Docker - 周边 - Go Template
概述 docker inspect -f 引出 希望学会后, 可以处理这个命令 问题: 这是啥 疑问 最开始, 我以为是 jsonpath 后来看 命令行的解释, 说叫 go template 但是我 ...
- Jmeter 测试结果分析之聚合报告简介
聚合报告(aggregate report) 对于每个请求,它统计响应信息并提供请求数,平均值,最大,最小值,错误率,大约吞吐量(以请求数/秒为单位)和以kb/秒为单位的吞吐量. 吞吐量是以取样目标点 ...
- js和jsp中怎么去获取后台 model.addAttribute()存入的list<。。。>对象
java 后台List productionGroupList =getProductionGroupList(); model.addAttribute("productionGroupL ...
- P&R 3
Floorplan: 要做好floorplan需要掌握哪些知识跟技能? 通常,遇到floorplan问题,大致的debug步骤跟方法有哪些? 如何衡量floorplan的QA? Floorplan是后 ...
- 计算机二级-C语言-程序填空题-190107记录
//给定程序的功能是:调用fun函数建立班级通讯录.通讯中记录每位学生的编号,姓名和电话号码.班级的人数和学生的信息从键盘读入,每个人的信息作为一个数据块(代表要使用结构体)写到名为myfile5.d ...