ElasticSearch 实现分词全文检索 - 聚合查询 cardinality

数据准备

ElasticSearch 实现分词全文检索 - 测试数据准备

聚合查询

ES 的聚合查询和MySQL的聚合查询类型，ES的聚合查询相比MySQL要强大，提供的统计数据的方式多种多样

# ES聚合查询的 Restful 语法

POST /index/type/_search

{

   "aggs":{

       "名字(agg)":{

            "agg_type":{

               "属性":"值"

            }

       }

   }

}

去重计数查询 (Cardinality)

去重计数，即 Cardinality，第一步先将返回的文档中的一个指定的field进行去重，统计一共有多少条

#去重计数

POST /sms-logs-index/_search

{

  "aggs": {

    "agg": {

      "cardinality": {

        "field": "province"

      }

    }

  }

}

Java

@Test

void cardinalityQuery() throws Exception {

    String indexName = "sms-logs-index";

    RestHighLevelClient client = ESClient.getClient();

    //1. 创建SearchRequest对象

    SearchRequest request = new SearchRequest(indexName);

    //2. 指定查询条件

    SearchSourceBuilder builder = new SearchSourceBuilder();

    builder.aggregation(AggregationBuilders.cardinality("agg").field("province"));

    request.source(builder);

    //3. 执行查询

    SearchResponse resp = client.search(request, RequestOptions.DEFAULT);

    //4. 输出返回值

    Cardinality agg = resp.getAggregations().get("agg");

    long value = agg.getValue();

    System.out.println(value);

}

范围统计 (range)

统计一定范围内出现的文档个数，比如：针对某一个Field的值在 0_100,100200,200~300 之间文档出现的个数分别是多少

范围统计可以针对普通的数值，针对时间类型，针对IP类型，都可以做相应的统计。

range,data_range,ip_range

# 数值方式范围统计

POST /sms-logs-index/_search

{

  "aggs": {

    "agg": {

      "range": {

        "field": "fee",

        "ranges": [

          {

            "to": 20

          },

          {

            "from": 20, # from 有包含当前值的意思

            "to": 30

          },

          {

            "from": 30

          }

        ]

      }

    }

  }

}

# 数值方式范围统计

POST /sms-logs-index/_search

{

  "aggs": {

    "agg": {

      "date_range": {

        "field": "createDate",

        "format":"yyyy",

        "ranges": [

          {

            "to": 2023  # 2023以前的数据量

          },

          {

            "from": 2023 # 2023以后的数据量

          }

        ]

      }

    }

  }

}

# IP方式范围统计

POST /sms-logs-index/_search

{

  "aggs": {

    "agg": {

      "ip_range": {

        "field": "ipAddr",

        "ranges": [

          {

            "to": "172.16.0.4"

          },

          {

            "from": "172.16.0.4"

          }

        ]

      }

    }

  }

}

Java

@Test

void rangeQuery() throws Exception {

    String indexName = "sms-logs-index";

    RestHighLevelClient client = ESClient.getClient();

    //1. 创建SearchRequest对象

    SearchRequest request = new SearchRequest(indexName);

    //2. 指定查询条件

    SearchSourceBuilder builder = new SearchSourceBuilder();

    builder.aggregation(AggregationBuilders.range("agg").field("fee")

            .addUnboundedTo(20)

            .addRange(20, 30)

            .addUnboundedFrom(30));

    request.source(builder);

    //3. 执行查询

    SearchResponse resp = client.search(request, RequestOptions.DEFAULT);

    //4. 输出返回值

    org.elasticsearch.search.aggregations.bucket.range.Range agg = resp.getAggregations().get("agg");

    for (Range.Bucket bucket : agg.getBuckets()) {

        String key = bucket.getKeyAsString();

        Object from = bucket.getFrom();

        Object to = bucket.getTo();

        long docCount = bucket.getDocCount();

        System.out.println(String.format("Key:%s From: %s  to: %s DocCount: %s", key, from, to, docCount));

    }

}

统计聚合查询 (extended_stats)

他可以查询指定Field的最大值，最小值，平均值，平方和...

# 统计聚合查询

POST /sms-logs-index/_search

{

  "aggs": {

    "agg": {

      "extended_stats": {

        "field": "fee"

      }

    }

  }

}

返回值

"aggregations" : {

    "agg" : {

      "count" : 8,

      "min" : 17.0,

      "max" : 45.0,

      "avg" : 31.25,

      "sum" : 250.0,

      "sum_of_squares" : 8468.0,

      "variance" : 81.9375,

      "variance_population" : 81.9375,

      "variance_sampling" : 93.64285714285714,

      "std_deviation" : 9.051933495115836,

      "std_deviation_population" : 9.051933495115836,

      "std_deviation_sampling" : 9.676923950453322,

      "std_deviation_bounds" : {

        "upper" : 49.35386699023167,

        "lower" : 13.146133009768327,

        "upper_population" : 49.35386699023167,

        "lower_population" : 13.146133009768327,

        "upper_sampling" : 50.60384790090664,

        "lower_sampling" : 11.896152099093356

      }

    }

  }

Java

@Test

void extendedQuery() throws Exception {

    String indexName = "sms-logs-index";

    RestHighLevelClient client = ESClient.getClient();

    //1. 创建SearchRequest对象

    SearchRequest request = new SearchRequest(indexName);

    //2. 指定查询条件

    SearchSourceBuilder builder = new SearchSourceBuilder();

    builder.aggregation(AggregationBuilders.range("agg").field("fee"));

    request.source(builder);

    //3. 执行查询

    SearchResponse resp = client.search(request, RequestOptions.DEFAULT);

    //4. 输出返回值

    ExtendedStats agg = resp.getAggregations().get("agg");

    double max = agg.getMax();

    double min = agg.getMin();

    System.out.println(String.format("Max:%s Min: %s ", max, min));

}

官方文档：https://www.elastic.co/guide/cn/elasticsearch/reference/index.html

ElasticSearch 实现分词全文检索 - 聚合查询 cardinality的更多相关文章

Elasticsearch(8) --- 聚合查询(Metric聚合)
Elasticsearch(8) --- 聚合查询(Metric聚合) 在Mysql中,我们可以获取一组数据的最大值(Max).最小值(Min).同样我们能够对这组数据进行分组(Group).那么 ...
ElasticSearch的高级复杂查询：非聚合查询和聚合查询
一.非聚合复杂查询(这儿展示了非聚合复杂查询的常用流程) 查询条件QueryBuilder的构建方法 1.1 精确查询(必须完全匹配上,相当于SQL语句中的“=”) ① 单个匹配 termQuery ...
java整合Elasticsearch,实现crud以及高级查询的分页,范围,排序功能,泰文分词器的使用,分组,最大,最小,平均值,以及自动补全功能
//为index创建mapping,index相当于mysql的数据库,数据库里的表也要给各个字段创建类型,所以index也要给字段事先设置好类型: 使用postMan或者其他工具创建:(此处我使用p ...
ElasticSearch 6.2 Mapping参数说明及text类型字段聚合查询配置
背景: 由于本人使用的是6.0以上的版本es,在使用发现很多中文博客对于mapping参数的说明已过时.ES6.0以后有很多参数变化. 现我根据官网总结mapping最新的参数,希望能对大家有用处. ...
Spring Data Elasticsearch 聚合查询
如需要统计某件商品的数量,最高价格,最低价格等就用到了聚合查询,就像数据库中的group by 首先需要注入ElasticsearchTemplate @Autowired private Elast ...
Elasticsearch系列---聚合查询原理
概要本篇主要介绍聚合查询的内部原理,正排索引是如何建立的和优化的,fielddata的使用,最后简单介绍了聚合分析时如何选用深度优先和广度优先. 正排索引聚合查询的内部原理是什么,Elastich ...
Elasticsearch使用系列-基本查询和聚合查询+sql插件
Elasticsearch使用系列-ES简介和环境搭建 Elasticsearch使用系列-ES增删查改基本操作+ik分词 Elasticsearch使用系列-基本查询和聚合查询+sql插件 Elas ...
java使用elasticsearch分组进行聚合查询（group by）-项目中实际应用
java连接elasticsearch 进行聚合查询进行相应操作一:对单个字段进行分组求和 1.表结构图片: 根据任务id分组,分别统计出每个任务id下有多少个文字标题 .SQL:select id ...
Elasticsearch(9) --- 聚合查询(Bucket聚合)
Elasticsearch(9) --- 聚合查询(Bucket聚合) 上一篇讲了Elasticsearch聚合查询中的Metric聚合:Elasticsearch(8) --- 聚合查询(Metri ...
ElasticSearch实战系列五: ElasticSearch的聚合查询基础使用教程之度量(Metric)聚合
Title:ElasticSearch实战系列四: ElasticSearch的聚合查询基础使用教程之度量(Metric)聚合前言在上上一篇中介绍了ElasticSearch实战系列三: Elas ...

随机推荐

lua 添加的时候去重
result = {} ids = {1,9,6,7}affs = {3,2,4,5,6}count =0for s in *ids result[s]=sfor p, v in pairs resu ...
微信小程序——计算器
知识点: wxml: hover-class: 实现点击态效果 hover-class样式显示的原理是点击时把样式加到class的样式中,冲突时,谁在后面就显示谁! data-val: 用于传数据, ...
记录一个二级域名绑定动态ip的操作
家里的路由器,还有一台路由器需要登录,以前一直用f3322的动态域名绑定,感觉使用也还可以,但最近几个月,只要是f3322.com的二级域名全部被chrome标注为危险. 所以准备换一个免费的二级域名 ...
创建一个HashMap实例，该实例具有足够高的“初始容量”
创建一个HashMap实例,该实例具有足够高的"初始容量" /** * 创建一个{@link HashMap}实例,该实例具有足够高的"初始容量" * * @p ...
k8s集群部署kafka
一.部署步骤 1.部署NFS并挂载共享目录 2.部署zookeeper集群 3.部署kafka集群 4.测试kafka 二.部署NFS并挂载共享目录注:使用云产品的NAS存储可跳过此步骤 1.服务端 ...
Python+unittest+requests 接口自动化测试框架搭建完整的框架搭建过程实战
一.Python+unittest+requests+HTMLTestRunner 完整的接口自动化测试框架搭建_00--框架结构简解首先配置好开发环境,下载安装Python并下载安装pycharm ...
springMVC的定时器
大家好,本人从事软件行业已有8年,大部分时间从事软件开发编写工作.好了废话少说了哈哈哈,直接干货. 在Java开发过程中有很多业务需求里面需要我们实时处理一些动态的业务比如库存的数据动态更新,实时数据 ...
OSIDP-文件管理-12(end)
概述文件特性:可长期存储:可在进程间共享:有特定结构. 文件系统提供对文件操作的功能接口:创建.删除.打开.关闭.读和写. 域(field):基本数据单元,一个域包含一个值. 记录(record): ...
Flask-Migrate数据库模型映射
1.Flask-Migrate介绍 flask-migrate可以十分方便的进行数据库的迁移与映射,将我们修改过的ORM模型映射到数据库中.flask-migrate是基于Alembic进行的一个封装 ...
MAVEN实践经验
1安装与配置 jdk: 1.6或以上下载MAVEN3.x版本,解压后放在随便一目录,然后在系统环境变量配置MAVEN路径. 运行cmd-->输入 mvn -version 会出现maven版本 ...

ElasticSearch 实现分词全文检索 - 聚合查询 cardinality

目录

数据准备

聚合查询

去重计数查询 (Cardinality)

范围统计 (range)

统计聚合查询 (extended_stats)

ElasticSearch 实现分词全文检索 - 聚合查询 cardinality的更多相关文章

随机推荐

热门专题