java使用elasticsearch分组进行聚合查询（group by）-项目中实际应用

java连接elasticsearch 进行聚合查询进行相应操作

一：对单个字段进行分组求和

1、表结构图片：

根据任务id分组，分别统计出每个任务id下有多少个文字标题

1.SQL：select id, count(*) as sum from task group by taskid;

java ES连接工具类

public class ESClientConnectionUtil {

    public static TransportClient client=null;

    public final static String HOST = "192.168.200.211"; //服务器部署

    public final static Integer PORT = 9301; //端口

    public static TransportClient  getESClient(){

        System.setProperty("es.set.netty.runtime.available.processors", "false");

        if (client == null) {

            synchronized (ESClientConnectionUtil.class) {

                try {

                    //设置集群名称

                    Settings settings = Settings.builder().put("cluster.name", "es5").put("client.transport.sniff", true).build();

                    //创建client

                    client = new PreBuiltTransportClient(settings).addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName(HOST), PORT));

                } catch (Exception ex) {

                    ex.printStackTrace();

                    System.out.println(ex.getMessage());

                }

            }

        }

        return client;

    }

    public static TransportClient  getESClientConnection(){

        if (client == null) {

            System.setProperty("es.set.netty.runtime.available.processors", "false");

                try {

                    //设置集群名称

                    Settings settings = Settings.builder().put("cluster.name", "es5").put("client.transport.sniff", true).build();

                    //创建client

                    client = new PreBuiltTransportClient(settings).addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName(HOST), PORT));

                } catch (Exception ex) {

                    ex.printStackTrace();

                    System.out.println(ex.getMessage());

            }

        }

        return client;

    }

    //判断索引是否存在

    public static boolean judgeIndex(String index){

        client= getESClientConnection();

         IndicesAdminClient adminClient;

        //查询索引是否存在

        adminClient= client.admin().indices();

        IndicesExistsRequest request = new IndicesExistsRequest(index);

        IndicesExistsResponse responses = adminClient.exists(request).actionGet();

        if (responses.isExists()) {

            return true;

        }

        return false;

    }

}

java ES语句（根据单列进行分组求和）

//根据 任务id分组进行求和

  SearchRequestBuilder sbuilder = client.prepareSearch("hottopic").setTypes("hot");
//根据taskid进行分组统计，统计出的列别名叫sum

  TermsAggregationBuilder termsBuilder = AggregationBuilders.terms("sum").field("taskid");

 sbuilder.addAggregation(termsBuilder);

  SearchResponse responses= sbuilder.execute().actionGet();

//得到这个分组的数据集合

  Terms terms = responses.getAggregations().get("sum");

  List<BsKnowledgeInfoDTO> lists = new ArrayList<>();

for(int i=0;i<terms.getBuckets().size();i++){

    //statistics

    String id =terms.getBuckets().get(i).getKey().toString();//id

    Long sum =terms.getBuckets().get(i).getDocCount();//数量

System.out.println("=="+terms.getBuckets().get(i).getDocCount()+"------"+terms.getBuckets().get(i).getKey());

}
//分别打印出统计的数量和id值

根据多列进行分组求和

//根据 任务id分组进行求和

  SearchRequestBuilder sbuilder = client.prepareSearch("hottopic").setTypes("hot");

//根据taskid进行分组统计，统计出的列别名叫sum

  TermsAggregationBuilder termsBuilder = AggregationBuilders.terms("sum").field("taskid");

//根据第二个字段进行分组

 TermsAggregationBuilder aAggregationBuilder2 = AggregationBuilders.terms("region_count").field("birthplace");
//如果存在第三个，以此类推；

  sbuilder.addAggregation(termsBuilder.subAggregation(aAggregationBuilder2));

  SearchResponse responses= sbuilder.execute().actionGet();

//得到这个分组的数据集合

  Terms terms = responses.getAggregations().get("sum");

  List<BsKnowledgeInfoDTO> lists = new ArrayList<>();

for(int i=0;i<terms.getBuckets().size();i++){

    //statistics

    String id =terms.getBuckets().get(i).getKey().toString();//id

    Long sum =terms.getBuckets().get(i).getDocCount();//数量

System.out.println("=="+terms.getBuckets().get(i).getDocCount()+"------"+terms.getBuckets().get(i).getKey());

}

//分别打印出统计的数量和id值

对多个field求max/min/sum/avg

SearchRequestBuilder requestBuilder = client.prepareSearch("hottopic").setTypes("hot");

//根据taskid进行分组统计，统计别名为sum

        TermsAggregationBuilder aggregationBuilder1 = AggregationBuilders.terms("sum").field("taskid") 
//根据tasktatileid进行升序排列

                .order(Order.aggregation("tasktatileid", true));
// 求tasktitleid 进行求平均数 别名为avg_title

        AggregationBuilder aggregationBuilder2 = AggregationBuilders.avg("avg_title").field("tasktitleid");
//

        AggregationBuilder aggregationBuilder3 = AggregationBuilders.sum("sum_taskid").field("taskid");

        requestBuilder.addAggregation(aggregationBuilder1.subAggregation(aggregationBuilder2).subAggregation(aggregationBuilder3));

        SearchResponse response = requestBuilder.execute().actionGet();

        Terms aggregation = response.getAggregations().get("sum");

        Avg terms2 = null;

        Sum term3 = null;

        for (Terms.Bucket bucket : aggregation.getBuckets()) {

            terms2 = bucket.getAggregations().get("avg_title"); // org.elasticsearch.search.aggregations.metrics.avg.InternalAvg

            term3 = bucket.getAggregations().get("sum_taskid"); // org.elasticsearch.search.aggregations.metrics.sum.InternalSum

            System.out.println("编号=" + bucket.getKey() + ";平均=" + terms2.getValue() + ";总=" + term3.getValue());

        }

如上内容若有不恰当支持，请各位多多包涵并进行点评。技术在于沟通！

java使用elasticsearch分组进行聚合查询（group by）-项目中实际应用的更多相关文章

java使用elasticsearch进行模糊查询-已在项目中实际应用
java使用elasticsearch进行模糊查询使用环境上篇文章本人已书写过,需要maven坐标,ES连接工具类的请看上一篇文章,以下是内容是笔者在真实项目中运用总结而产生,并写的是主要方法和思路 ...
Mysql教程：（二）分组与函数查询group by
分组与函数查询温馨提示:分组之后查询其他函数结果是不正确的: 分组函数:group by 按班级分组,查询出每班数学最高分:select class,max(maths) from score gr ...
mqtt协议实现 java服务端推送功能（三）项目中给多个用户推送功能
接着上一篇说,上一篇的TOPIC是写死的,然而在实际项目中要给不同用户也就是不同的topic进行推送所以要写活 package com.fh.controller.information.push ...
java 项目中几种O实体类的概念
经常会接触到vo,do,dto的概念,本文从领域建模中的实体划分和项目中的实际应用情况两个角度,对这几个概念进行简析. 得出的主要结论是:在项目应用中,vo对应于页面上需要显示的数据(表单),do对应 ...
MongoDB分组查询，聚合查询，以及复杂查询
准备数据 from pymongo import MongoClient import datetime client=MongoClient('mongodb://localhost:27017') ...
Django-model聚合查询与分组查询
Django-model聚合查询与分组查询聚合函数包含:SUM AVG MIN MAX COUNT 聚合函数可以单独使用,不一定要和分组配合使用:不过聚合函数一般和group by 搭配使用 agg ...
使用Java操作Elasticsearch(Elasticsearch的java api使用)
1.Elasticsearch是基于Lucene开发的一个分布式全文检索框架,向Elasticsearch中存储和从Elasticsearch中查询,格式是json. 索引index,相当于数据库中的 ...
MongoDB聚合查询及Python连接MongoDB操作
今日内容概要聚合查询 Python操作MongoDB 第三方可视化视图工具今日内容详细聚合查询 Python操作MongoDB 数据准备 from pymongo import MongoCli ...
JAVA项目中的常用的异常处理情况总结
可能遇见的异常或错误: 检查性异常:最具代表的检查性异常是用户错误或问题引起的异常,这是程序员无法预见的.例如要打开一个不存在文件时,一个异常就发生了,这些异常在编译时不能被简单地忽略. 运行时异常: ...

随机推荐

ResNet 论文研读笔记
Deep Residual Learning for Image Recognition 原文链接摘要深度神经网络很难去训练,本文提出了一个残差学习框架来简化那些非常深的网络的训练,该框架使得层能 ...
阿里巴巴java手册示例
package com.led.daorumysql; /** * @Description:alibaba java development manual * @author 86157 * */ ...
C指针与内存
C指针与内存指针是C / C++ 中重要的构造类型,指针赋予了C / C++程序直接访问和修改内存的能力.C / C++的许多重要应用,如编译.OS.嵌入式开发都依赖于这种能力. 冯诺依曼体系的计算 ...
深入出不来nodejs源码-timer模块(JS篇)
鸽了好久,最近沉迷游戏,继续写点什么吧,也不知道有没有人看. 其实这个node的源码也不知道该怎么写了,很多模块涉及的东西比较深,JS和C++两头看,中间被工作耽搁回来就一脸懵逼了,所以还是挑一些简单 ...
maven根据不同的运行环境，打包不同的配置文件
使用maven管理项目中的依赖,非常的方便.同时利用maven内置的各种插件,在命令行模式下完成打包.部署等操作,可方便后期的持续集成使用. 但是每一个maven工程(比如web项目),开发人员在开发 ...
bootstrap-datepicker 开始时间-结束时间 thinkphp
<!DOCTYPE html> <head> <title>开始-结束时间测试</title> </head> <body> & ...
LDA算法学习（Matlab实现）
LDA算法对于两类问题的LDA(Matlab实现) function [ W] = FisherLDA(w1,w2) %W最大特征值对应的特征向量 %w1 第一类样本 %w2 第二类样本 %第一步: ...
Java多线程高级主题
任务定时调度通过Timer和TimerTask,我们可以实现定时启动某个线程. java.util.Timer:类似闹钟的功能,本身实现的就是一个线程 java.util.TimerTask:一个抽 ...
理解Java之IO流
流是一种抽象概念,它代表了数据的无结构化传递.用来进行输入输出操作的流就称为IO流. 一.IO流结构 1.流的分类方式按流向分: 从文件/网络/内存等(数据源)到程序是输入流:从程序到文件/网络/内 ...
volatile关键值
happens-before原则我们编写的程序都要经过优化后(编译器和处理器会对我们的程序进行优化以提高运行效率)才会被运行,优化分为很多种,其中有一种优化叫做重排序,重排序需要遵守happens- ...

java使用elasticsearch分组进行聚合查询（group by）-项目中实际应用

java使用elasticsearch分组进行聚合查询（group by）-项目中实际应用的更多相关文章

随机推荐

热门专题