前言

在上一篇中介绍了ElasticSearch集群和kinaba的安装教程,本篇文章就来讲解下 ElasticSearch的DSL语句使用。

ElasticSearch DSL 介绍

Elasticsearch提供了基于JSON的完整查询DSL(特定于域的语言)来定义查询。将查询DSL视为查询的AST(抽象语法树),它由两种子句组成:

  • 叶子查询子句:

    叶查询子句中寻找一个特定的值在某一特定领域,如 match,term或 range查询。这些查询可以自己使用。
  • 复合查询子句

    复合查询子句包装其他叶查询或复合查询,并用于以逻辑方式组合多个查询(例如 bool或dis_max查询),或更改其行为(例如 constant_score查询)。

    查询子句的行为会有所不同,具体取决于它们是在 查询上下文中还是在过滤器上下文中使用。

我们在使用ElasticSearch的时候,避免不了使用DSL语句去查询,就像使用关系型数据库的时候要学会SQL语法一样。如果我们学习好了DSL语法的使用,那么在日后使用和使用Java Client调用时候也会变得非常简单。

ElasticSearch DSL 语句使用

这里我们先来介绍下DSL 语句简单的使用,从最常用的增删改查开始!

一、新增数据

ElasticSearch可以直接新增数据,只要你指定了index(索引库名称)和type(类型)即可。在新增的时候你可以自己指定主键ID,也可以不指定,由 ElasticSearch自身生成。

新增数据命令示例:

POST test1/_doc/1
{
"uid" : "1234",
"phone" : "12345678909",
"message" : "qq",
"msgcode" : "1",
"sendtime" : "2019-03-14 01:57:04"
}

kinaba示例图:



注: POST test1/_doc/1 这是指定主键ID为1,如果POST test1/_doc 的话,那么便是es自身生成ES语句。

这里我们还可以通过 GET test1/GET test1/_settingsGET test1/_mapping查看该index的状态,也就是 setting(设置选项) 和mapping(数据结构)。

二、创建索引库

在上述示例中,我们通过直接通过创建数据从而创建了索引库,但是没有创建索引库而通过ES自身生成的这种并不友好,因为它会使用默认的配置,字段结构都是text(text的数据会分词,在存储的时候也会额外的占用空间),分片和索引副本采用默认值,默认是5和1,ES的分片数在创建之后就不能修改,除非reindex(下面会讲到),所以这里我们还是指定数据模板进行创建。

这里先简单介绍一下ES的数据结构,以下的数据结构为ES的6.x版本。

  • 核心数据类型

    text 和 keyword

  • 数值数据类型

    long,integer,short,byte,double,float,half_float,scaled_float

  • 日期数据类型

    date

  • 布尔数据类型

    boolean

  • 二进制数据类型

    binary

  • 范围数据类型

    integer_range,float_range,long_range,double_range,date_range

  • 复杂数据类型编辑

  • 对象数据类型

    object 用于单个JSON对象

  • 嵌套数据类型

    nested 用于JSON对象数组

  • 地理数据类型编辑

  • 地理位置数据类型

    geo_point 纬度/经度积分

  • 地理形状数据类型

    geo_shape 用于多边形等复杂形状

  • 专业数据类型编辑

  • IP数据类型

    ip 用于IPv4和IPv6地址

  • 完成数据类型

    completion 提供自动完成建议

  • 令牌计数数据类型

    token_count 计算字符串中令牌的数量

    mapper-murmur3

    murmur3 在索引时计算值的哈希并将其存储在索引中

    mapper-annotated-text

    annotated-text 索引包含特殊标记的文本(通常用于标识命名实体)

  • 渗滤器类型

    接受来自query-dsl的查询

  • join 数据类型

    为同一索引内的文档定义父/子关系

  • 别名数据类型

    为现有字段定义别名。

  • 多字段编辑

    为不同的目的以不同的方式对同一字段建立索引通常很有用。例如,一个string字段可以映射为text用于全文搜索的字段,也可以映射为keyword用于排序或聚合的字段。或者,您可以使用standard分析仪, english分析仪和 french分析仪索引文本字段。

    这是多领域的目的。大多数数据类型通过fields参数支持多字段。

上面介绍的字段介绍虽然比较复杂,但是我们常用的几个类型也就是这几种 text、keyword、byte、short、integer、long、float、double、boolean、date,其中text和keyword都是string类型,选择区分很简单,需要进行分词用text,不需要并且进行排序或聚合的可以用keyword。

关于ES的数据结构就到这里了,我们来进行索引库的创建吧!

新增索引库的命令示例:

PUT test1
{
"settings" : {
"number_of_shards" : 10,
"number_of_replicas" : 1,
"refresh_interval" : "1s"
},
"mappings" : {
"_doc" : {
"properties" : {
"uid" : { "type" : "long" },
"phone" : { "type" : "long" },
"message" : { "type" : "keyword" },
"msgcode" : { "type" : "long" },
"sendtime" : {
"type" : "date",
"format" : "yyyy-MM-dd HH:mm:ss"
} }
}
}
}

示例图:





注:

  • number_of_shards: 是设置的分片数,设置之后无法更改!
  • refresh_interval: 是设置es缓存的刷新时间,如果写入较为频繁,但是查询对实时性要求不那么高的话,可以设置高一些来提升性能。可以更改
  • number_of_replicas : 是设置该索引库的副本数,建议设置为1以上。

其中这里还有几个重要参数也顺便说一下:

  • store: true/false 表示该字段是否存储,默认存储。
  • doc_values: true/false 表示该字段是否参与聚合和排序。
  • index: true/false 表示该字段是否建立索引,默认建立。

关于这几个字段的取值可以参考一下的示例图:

三、修改数据

其实ES的新增和修改可以看做是一样,存在则修改,不存在则新增,不过这里还是简单的介绍下吧。

修改数据的方式主要有两种,一种是通过主键ID进行修改,这种比较简单,就是和新增一样即可。

另一种则是通过条件进行修改,相当于SQL更新语句的 where条件。

根据主键修改的命令示例:

POST test1/_doc/1
{
"uid" : "1234",
"phone" : "12345678909",
"message" : "qq",
"msgcode" : "1",
"sendtime" : "2019-03-14 01:57:04"
}

根据条件修改的命令示例:

POST test1/_update_by_query
{
"query": {
"term": {
"phone": "12345678909"
}
} ,
"script": {
"source": "ctx._source['message'] = 'xuwujing'"
}
}

原有的数据:

修改后的数据:



注:这里的根据条件进行修改用到的脚本语言,ES除了使用DSl语句之后,使用一些官方定义的脚本语言和SQL语句也能进行操作,脚本语言和SQL语句的操作留到以后在来讲下。

四、删除数据、字段和索引库

ES根据主键删除数据的命令示例是DELETE 索引库/id,简单实用,但是一定要要加上ID,不然就是删除索引库了!

根据主键删除数据命令示例:

DELETE test1/1

根据条件删除数据的命令示例:

POST test/_delete_by_query
{
"query": {
"term": {
"phone": "12345678909"
}
}
}

当然ES还可以根据条件只删除某一个字段的数据,比如删除字段msgcode的数据。

删除字段数据的命令示例:

POST test/_doc/_update_by_query
{
"script":{
"lang":"painless",
"inline":"ctx._source.remove(\"msgcode\")"
}
}

示例图:

查询语句

查询所有

match_all可以查询集群所有索引库的信息,包括一些隐藏索性库的信息。

命令示例:

GET _search
{
"query": {
"match_all": {}
}
}

示例图:

查询索引库所有的数据,命令格式为GET 索引库名称/索引库类型/_search,也可以不需要索引库类型。

命令示例:

GET  test1/_doc/_search

如果根据ID查询某一条数据的话,也比较简单,只需要将上述的_search换成主键ID即可。

命令示例:

GET  test1/_doc/2

等值(term)查询

term主要用于精确匹配哪些值,比如数字,日期,布尔值或 not_analyzed 的字符串(未经分析的文本数据类型)

比如根据手机号进行查询。

命令示例:

GET  test1/_doc/_search
{
"query": {
"term": {
"phone": "12345678909"
}
}
}

当然,如果想在一个字段匹配多个值的话,可以使用terms,相当于SQL的in语法。

命令示例:

GET  test1/_doc/_search
{
"query": {
"terms": {
"uid": [
1234,
12345,
123456
]
}
}
}

示例图:



注:上述中是没有123456这条数据,这样只是为了做下简单的测试而已。

范围(range )查询

range可以理解为SQL中的><符号,其中gt是大于,lt是小于,gte是大于等于,lte是小于等于。

命令示例:

GET  test1/_doc/_search
{
"query": {
"range": {
"uid": {
"gt": 1234,
"lte": 12345
}
}
}
}

存在(exists)查询

exists可以理解为SQL中的exists函数,就是判断是否存在该字段。

这里我们新增一条没有msgcode的字段,然后用exists去查询。

POST test1/_doc/3
{
"uid" : "123456",
"phone" : "12345678909",
"message" : "qq",
"sendtime" : "2019-03-14 01:57:04"
}

存在查询命令示例:

GET  test1/_doc/_search
{
"query": {
"exists": {
"field":"msgcode"
}
}
}

示例图:



组合(bool)查询

bool 可以用来合并多个过滤条件查询结果的布尔逻辑,它包含这如下几个操作符:

  • must : 多个查询条件的完全匹配,相当于 and。
  • must_not ::多个查询条件的相反匹配,相当于 not。
  • should : 至少有一个查询条件匹配, 相当于 or。

查询的命令示例:

GET /test1/_search
{
"query": {
"bool": {
"must": {
"term": {
"phone": "12345678909"
}
},
"must_not": {
"term": {
"uid": 12345
}
},
"should": [
{
"term": {
"uid": 1234
}
},
{
"term": {
"uid": 123456
}
}
],
"adjust_pure_negative": true,
"boost": 1
}
}
}

示例图:

模糊(wildcard)查询

wildcard查询相当于SQL语句中的like语法,只不过它查询的数据需要加上*符号。

模糊查询命令示例:

GET /test1/_search
{
"query": {
"wildcard": {
"message":"*wu*"
}
}
}

正则(regexp)查询

regexp可以支持正则查询,比如查询短信内容中的验证码之类的。

下面的这个示例就是查询以xu开头,后面是0-9数字的内容的数据。

正则查询命令示例:

GET /test1/_search
{
"query": {
"regexp": {
"message":"xu[0-9]"
}
}
}

示例图:

查询语句的示例到这里就差不多就结束了,这里在推荐一下kinaba查询的几个小技巧,如图所示:

其它

参考:

https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html

ElasticSearch个人已经使用一年多了,在学习的过程中也积攒了一些相关资料其,只不过今年特别忙,没有太多时间将其整理成博客进行分享了。说来惭愧,今年写博客的数量有些少了,下半年自己从一个周更博主变成了月更博主了,不过后面若是时间充足的话也会多些一些的,再忙每个月至少也会写一篇 ヾ(◍°∇°◍)ノ゙

ElasticSearch实战系列:

ElasticSearch实战系列一: ElasticSearch集群+Kinaba安装教程

音乐推荐

原创不易,如果感觉不错,希望给个推荐!您的支持是我写作的最大动力!

版权声明:

作者:虚无境

博客园出处:http://www.cnblogs.com/xuwujing

CSDN出处:http://blog.csdn.net/qazwsxpcm    

个人博客出处:http://www.panchengming.com

ElasticSearch实战系列二: ElasticSearch的DSL语句使用教程---图文详解的更多相关文章

  1. ElasticSearch实战系列三: ElasticSearch的JAVA API使用教程

    前言 在上一篇中介绍了ElasticSearch实战系列二: ElasticSearch的DSL语句使用教程---图文详解,本篇文章就来讲解下 ElasticSearch 6.x官方Java API的 ...

  2. ElasticSearch实战系列四: ElasticSearch理论知识介绍

    前言 在前几篇关于ElasticSearch的文章中,简单的讲了下有关ElasticSearch的一些使用,这篇文章讲一下有关 ElasticSearch的一些理论知识以及自己的一些见解. 虽然本人是 ...

  3. ElasticSearch实战系列五: ElasticSearch的聚合查询基础使用教程之度量(Metric)聚合

    Title:ElasticSearch实战系列四: ElasticSearch的聚合查询基础使用教程之度量(Metric)聚合 前言 在上上一篇中介绍了ElasticSearch实战系列三: Elas ...

  4. ElasticSearch实战系列十: ElasticSearch冷热分离架构

    前言 本文主要介绍ElasticSearch冷热分离架构以及实现. 冷热分离架构介绍 冷热分离是目前ES非常火的一个架构,它充分的利用的集群机器的优劣来实现资源的调度分配.ES集群的索引写入及查询速度 ...

  5. ElasticSearch实战系列十一: ElasticSearch错误问题解决方案

    前言 本文主要介绍ElasticSearch在使用过程中出现的各种问题解决思路和办法. ElasticSearch环境安装问题 1,max virtual memory areas vm.max_ma ...

  6. TortoiseGit学习系列之TortoiseGit基本操作拉取项目(图文详解)

    前面博客 TortoiseGit学习系列之TortoiseGit基本操作克隆项目(图文详解) TortoiseGit学习系列之TortoiseGit基本操作修改提交项目(图文详解) TortoiseG ...

  7. Git学习系列之Git基本操作拉取项目(图文详解)

    前面博客 Git学习系列之Git基本操作推送项目(图文详解) 当然,如果多人协作,或者多个客户端进行修改,那么我们还要拉取(Pull ... )别人推送到在线仓库的内容下来. 大神们是不推荐使用 pu ...

  8. StreamSets学习系列之StreamSets的集群安装(图文详解)

    不多说,直接上干货! 若是集群安装 需要在对应节点执行相同的操作. 见 StreamSets学习系列之StreamSets支持多种安装方式[Core Tarball.Cloudera Parcel . ...

  9. StreamSets学习系列之StreamSets的Create New Pipeline(图文详解)

    不多说,直接上干货! 前期博客 StreamSets学习系列之StreamSets支持多种安装方式[Core Tarball.Cloudera Parcel .Full Tarball .Full R ...

随机推荐

  1. SpringMVC 原理 - 设计原理、启动过程、请求处理详细解读

    SpringMVC 原理 - 设计原理.启动过程.请求处理详细解读 目录 一. 设计原理 二. 启动过程 三. 请求处理 一. 设计原理 Servlet 规范 SpringMVC 是基于 Servle ...

  2. Spring Boot 统一异常这样处理和剖析,安否?

    话说异常 「欲渡黄河冰塞川,将登太行雪满天」,无论生活还是计算机世界难免发生异常,上一篇文章RESTful API 返回统一JSON数据格式 说明了统一返回的处理,这是请求一切正常的情形:这篇文章将说 ...

  3. DC6-靶机渗透

    靶场下载链接: Download: http://www.five86.com/downloads/DC-6.zip Download (Mirror): https://download.vulnh ...

  4. unity,C#,游戏面试笔试真题

    最开始的两家公司笔试面试题目 一家公司是学校聘请研究教育方面VR课件的公司,面试没几天,就收到了面试通过的消息,后面因为通过了另一家游戏公司而拒绝了. 另一家公司是一家游戏外企,在春熙路,当时笔试还可 ...

  5. JavaScript String 小球重力弹回

    JavaScript String 小球重力弹回 <!DOCTYPE html> <html lang="en"> <head> <met ...

  6. Netty源码分析 (三)----- 服务端启动源码分析

    本文接着前两篇文章来讲,主要讲服务端类剩下的部分,我们还是来先看看服务端的代码 /** * Created by chenhao on 2019/9/4. */ public final class ...

  7. P3317 [SDOI2014]重建 变元矩阵树定理 高斯消元

    传送门:https://www.luogu.org/problemnew/show/P3317 这道题的推导公式还是比较好理解的,但是由于这个矩阵是小数的,要注意高斯消元方法的使用: #include ...

  8. 牛客 136G-指纹锁 set容器重载

    136G-指纹锁 题意: 设计一个容器,支持插入x,若与容器中的值最小相差为k,则自动忽略.删除操作,把与x相差为k的值都从容器中删除.查询操作,问容器中有没有和x相差为k的数值. 思路: 一个stl ...

  9. PAT L3-017. 森森快递

    L3-017. 森森快递 时间限制 400 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者 俞勇(上海交通大学) 森森开了一家快递公司,叫森森快递.因为 ...

  10. js中的this介绍

    今天跟大家一起简单的来了解一下js中一个有趣的东西,this. 在js中我们用面向对象的思想去编写的时候,各个模块之间的变量就不那么容易获取的到了,当然也可以通过闭包的方式拿到其他函数的变量,如果说每 ...