SQL to Java code for Elasticsearch

Elasticsearch虽然定位为Search Engine，但是因其可以持久化数据，很多时候，我们把Elasticsearch当成Database用，但是Elasticsearch不支持SQL，就需要把SQL逻辑转换成代码实现对应的功能。

以下列举了一些常用的SQL转换成对应的Java代码。

1.按某个field group by查询count

SELECT

fieldA, COUNT(fieldA)

from table

WHERE fieldC = "hoge"

AND fieldD = "huga"

AND fieldB > 10

AND fieldB < 100

group by fieldA;

对应的java code:

SearchRequestBuilder searchReq = client.prepareSearch("sample_index");

searchReq.setTypes("sample_types");

TermsBuilder termsb = AggregationBuilders.terms("my_fieldA").field("fieldA").size(100);

BoolFilterBuilder bf = FilterBuilders.boolFilter();

TermFilterBuilder tf_fieldC = FilterBuilders.termFilter("fieldC","hoge");

TermFilterBuilder tf_fieldD = FilterBuilders.termFilter("fieldD","huga");

bf.must(tf_fieldC);

bf.must(tf_fieldD);

RangeFilterBuilder rangefieldBFilter = FilterBuilders.rangeFilter("fieldB")

                .gt(10)

                .lt(100);

searchReq.setQuery(QueryBuilders.filteredQuery(QueryBuilders.matchAllQuery(),

                    FilterBuilders.andFilter(bf, rangefieldBFilter))).addAggregation(

                    termsb);

SearchResponse searchRes = searchReq.execute().actionGet();

Terms fieldATerms = searchRes.getAggregations().get("my_fieldA");

for (Terms.Bucket filedABucket : fieldATerms.getBuckets()) {

    //fieldA

    String fieldAValue = filedABucket.getKey();

    //COUNT(fieldA)

    long fieldACount = filedABucket.getDocCount();

}

2. 按某个field 和 date group by 并查询另一个filed的sum，时间统计图，时间间隔是1天。

SELECT

DATE(create_at), fieldA, SUM(fieldB)

from table

group by DATE(create_at), fieldA;

对应的java code:

SearchRequestBuilder searchReq = client.prepareSearch("sample_index");

searchReq.setTypes("sample_types");

DateHistogramBuilder dhb = AggregationBuilders.dateHistogram("my_datehistogram").field("create_at").interval(DateHistogram.Interval.days(1));

TermsBuilder termsb_fa = AggregationBuilders.terms("my_fieldA").field("fieldA").size(100);

termsb_fa.subAggregation(AggregationBuilders.sum("my_sum_fieldB").field("fieldB"));

dhb.subAggregation(termsb_fa)

searchReq.setQuery(QueryBuilders.matchAllQuery()).addAggregation(dhb);

SearchResponse searchRes = searchReq.execute().actionGet();

DateHistogram dateHist = searchRes.getAggregations().get("my_datehistogram");

for (DateHistogram.Bucket dateBucket : dateHist.getBuckets()) {

    //DATE(create_at)

    String create_at = dateentry.getKey();

    Terms fieldATerms = dateBucket.getAggregations().get("my_fieldA");

    for (Terms.Bucket filedABucket : fieldATerms.getBuckets()) {

        //fieldA

        String fieldAValue = filedABucket.getKey();

        //SUM(fieldB)

        Sum sumagg = filedABucket.getAggregations().get("my_sum_fieldB");

        long sumFieldB = (long)sumagg.getValues();

    }

}

3. 按两个field group by并查询第三个filed的sum

SELECT

fieldA, fieldC, SUM(fieldB)

from table

group by fieldA, fieldC;

对应的java code:

SearchRequestBuilder searchReq = client.prepareSearch("sample_index");

searchReq.setTypes("sample_types");

TermsBuilder termsb_fa = AggregationBuilders.terms("my_fieldA").field("fieldA").size(100);

TermsBuilder termsb_fc = AggregationBuilders.terms("my_fieldC").field("fieldC").size(50);

termsb_fc.subAggregation(AggregationBuilders.sum("my_sum_fieldB").field("fieldB"));

termsb_fa.subAggregation(termsb_fc)

searchReq.setQuery(QueryBuilders.matchAllQuery()).addAggregation(termsb_fa);

SearchResponse searchRes = searchReq.execute().actionGet();

Terms fieldATerms = searchRes.getAggregations().get("my_fieldA");

for (Terms.Bucket filedABucket : fieldATerms.getBuckets()) {

    //fieldA

    String fieldAValue = filedABucket.getKey();

    Terms fieldCTerms = filedABucket.getAggregations().get("my_fieldC");

    for (Terms.Bucket filedCBucket : fieldCTerms.getBuckets()) {

        //fieldC

        String fieldCValue = filedCBucket.getKey();

        //SUM(fieldB)

        Sum sumagg = filedCBucket.getAggregations().get("my_sum_fieldB");

        long sumFieldB = (long)sumagg.getValues();

    }

}

4. 按某个filed group by 并查询count、sum 和 average

SELECT

fieldA, COUNT(fieldA), SUM(fieldB), AVG(fieldB)

from table

group by fieldA;

对应的java code:

SearchRequestBuilder searchReq = client.prepareSearch("sample_index");

searchReq.setTypes("sample_types");

TermsBuilder termsb = AggregationBuilders.terms("my_fieldA").field("fieldA").size(100);

termsb.subAggregation(AggregationBuilders.sum("my_sum_fieldB").field("fieldB"));

termsb.subAggregation(AggregationBuilders.avg("my_avg_fieldB").field("fieldB"));

searchReq.setQuery(QueryBuilders.matchAllQuery()).addAggregation(termsb);

SearchResponse searchRes = searchReq.execute().actionGet();

Terms fieldATerms = searchRes.getAggregations().get("my_fieldA");

for (Terms.Bucket filedABucket : fieldATerms.getBuckets()) {

    //fieldA

    String fieldAValue = filedABucket.getKey();

    //COUNT(fieldA)

    long fieldACount = filedABucket.getDocCount();

    //SUM(fieldB)

    Sum sumagg = filedABucket.getAggregations().get("my_sum_fieldB");

    long sumFieldB = (long)sumagg.getValues();

    //AVG(fieldB)

    Avg avgagg = filedABucket.getAggregations().get("my_avg_fieldB");

    double avgFieldB = avgagg.getValues();

}

5. 按某个field group by 并按另一个filed的Sum排序，获取前10

SELECT

fieldA, SUM(fieldB)

from table

WHERE fieldC = "hoge"

group by fieldA

order by SUM(fieldB) DESC

limit 10;

对应的java code:

QueryBuilder termsc = QueryBuilders.termQuery("fieldC","hoge");

QueryBuilder queryBuilder = QueryBuilders.boolQuery().must(termsc);

TermsAggregationBuilder aggregationBuilder = AggregationBuilders.terms("my_fieldA").field("fieldA").size(10);

aggregationBuilder.subAggregation(AggregationBuilders.sum("my_sum_fieldB").field("fieldB"));

aggregationBuilder.order(Order.aggregation("my_sum_fieldB", false));

SearchResponse searchResponse = client.prepareSearch("sample_index").setQuery(queryBuilder).addAggregation(aggregationBuilder).execute().actionGet();

Terms terms = searchResponse.getAggregations().get("my_fieldA");

for (Terms.Bucket entry : terms.getBuckets()) {

    String fieldAValue = entry.getKey().toString();

    Sum sumagg = entry.getAggregations().get("my_sum_fieldB");

    double fieldValue = sumagg.getValue();

}

代码在GitHub上：https://github.com/luxiaoxun/Code4Java

SQL to Java code for Elasticsearch的更多相关文章

Java中使用elasticsearch搜索引擎实现简单查询、修改等操作-已在项目中实际应用
以下的操作环境为:jdk:1.8:elasticsearch:5.2.0 maven架包下载坐标为: <dependency> <groupId>org.elasticsear ...
A java code
With the help of LiJun I got a piece of JAVA code. With this code, I can do below things like connec ...
Elasticsearch入门系列~通过Java一系列操作Elasticsearch
Elasticsearch索引的创建.数据的增删该查操作上一章节已经在Linux系统上安装Elasticsearch并且可以外网访问,这节主要通过Java代码操作Elasticsearch 1.创建 ...
Java语言编码规范(Java Code Conventions)
Java语言编码规范(Java Code Conventions) 名称 Java语言编码规范(Java Code Conventions) 译者晨光(Morning) 简介本文档讲述了Java语 ...
java code to byte code--partone--reference
Understanding how Java code is compiled into byte code and executed on a Java Virtual Machine (JVM) ...
[转]Java Code Examples for android.util.JsonReader
[转]Java Code Examples for android.util.JsonReader The following are top voted examples for showing h ...
JUnit单元测试教程（翻译自Java Code Geeks）
JUnit单元测试教程--终极指南 JUnit单元测试教程终极指南说明单元测试简介 1 什么是单元测试 2 测试覆盖 3 Java中的单元测试 JUnit简介 1 使用Eclipse实现简单JUn ...
Java Code Style
近期困惑于团队成员代码风格迥异,代码质量不可控,作为一名老司机,忧患于后期服务的可维护性,多次一对一的代码Review,耗时耗力不说,效果也不明显.痛定思痛,多次反思之后得出结论:无规矩不成方圆,可靠 ...
使用Java客户端操作elasticsearch（二）
承接上文,使用Java客户端操作elasticsearch,本文主要介绍常见的配置和Sniffer(集群探测) 的使用. 常见的配置前面已介绍过,RestClientBuilder支持同时提供一 ...

随机推荐

笔记：MyBatis XML配置-Settings 完整属性表
设置参数描述有效值默认值 cacheEnabled 该配置影响的所有映射器中配置的缓存的全局开关. true | false true lazyLoadingEnabled 延迟加载的全局开关. ...
ImageLoader 笔记
BitmapFactory 我们不能够通过构造函数创建Bitmap对象.如果需要将图片转成Bitmap对象加载到内存中,就需要使用BitmapFactory类.BitmapFactory跟据图片数据源 ...
python装饰器使用
看了不少python关于装饰器文章,觉得还挺实用,发贴来mark一下(以前做笔记总会长时间不看就忘记,放这里应该不会忘了吧 - -) 先来看一个简单的知识点: def a(): print(" ...
Vue项目环境搭建(node+webpack)
安装node.js 下载地址:https://nodejs.org/en/download/ node -v //查看node.js版本项目环境配置: 安装vue-cli:npm install - ...
java基础--封装
封装(面向对象特征之一):是指隐藏对象的属性和实现细节,仅对外提供公共访问方式. 好处:将变化隔离:便于使用:提高重用性:安全性. 封装原则:将不需要对外提供的内容都隐藏起来,把属性都隐藏,提供公共 ...
Linux下面如何用tcpdump抓包
很多时候我们的系统部署在Linux系统上面,在一些情况下定位问题就需要查看各个系统之间发送数据报文是否正常,下面我就简单讲解一下如何使用tcpdump抓包 tcpdump是Linux下面的一个开源的抓 ...
Suricata默认规则集相关
Suricata规则集 Suricata 基于规则检测和控制数据流量,所有规则的配置文件保存在rules目录内 .这些是已知和确认的活动僵尸网络和其C&C(command and contro ...
C语言字符数组作业
一.PTA实验作业题目1:7-1 字符串转换成十进制整数 1. 本题PTA提交列表 2. 设计思路 3.代码截图 4.本题调试过程碰到问题及PTA提交列表情况说明. 1.一开始我没想到怎么判断正负的 ...
UI事务重叠引发的crash
在ios开发的世界里,通过动画来切换界面使我们早就习以为常的事情,但动画将一个原本同步执行的事务,变成一个异步事务,并由此引发了一系列的陷阱. 最近对公司产品的crashlytics报告进行了一些分析 ...
Flask 页面缓存逻辑,jinja2 过滤器，测试器
回调接入点-页面缓存逻辑 from flask import Flask,request,render_template from werkzeug.contrib.cache import Simp ...

SQL to Java code for Elasticsearch

SQL to Java code for Elasticsearch的更多相关文章

随机推荐

热门专题