es是一个近乎实时的搜索平台,这意味着从索引文档到文档可搜索,是有一点点延迟的(通常是一秒)。es集群是一个或多个节点的集合,它们共同保存数据,并提供跨所有节点的联合索引和搜索功能。集群名由cluster.name指定。每个节点名由node.name指定。

通过 get /_cat 可以找出很多实用的命令,使用这些命令时在最后加上?v可以展示数据的含义,如

get /_cat/indices?v 查看所有索引的分片数、副本数、文档数、索引大小

get /_cat/nodes?v 查看集群所有的节点,从返回的结果中可以找出哪一个节点是master

get /_cat/shards/{index}?v 查看某索引各分片文档数、分片大小、所在节点ip

等等,还有其他很多实用的命令,不再一个个列举,用的时候从里面找即可。

Search API

根据搜索参数放的位置不同,有两种搜索方式:一种是把参数放到request uri上,另一种是使用request body

其中第一种比较少用,本文仅提供一个例子,不做详细介绍

示例:

get /bank/_doc/_search?q=*&sort=age:asc,balance:asc&from=10&size=3

第二种方式比较常用,使用起来也比较简单,把搜索参数以json格式放到请求体中

get /bank/_doc/_search

{
    "query": {
        "match_all": {}
    },
    "sort": {
        "age": "asc",
        "balance": "desc"
    },
    "from": 10,
    "size": 3
}

from表示跳过几个文档,为0时表示一个都不跳过,从头开始取。

如果只想返回特定的字段,比如age、balance,则命令是

get /bank/_doc/_search
{
    "query": {
        "match_all": {}
    },
    "_source": ["balance", "age"]
}

如果想取balance=49355的文档,则要用match关键字替换match_all,命令是

get /bank/_doc/_search
{
    "query": {
        "match": {
            "balance": "49355"
       }
    }
}

取address包含"mill"单词的文档,命令是

get /bank/_doc/_search
{
    "query": {
        "match": {
            "address": "mill"
        }
    }
}

实际上,结果中不仅有address包含"mill"单词的文档,还有address包含“Mill”单词的文档。这是因为es在索引文档时会把所有字母都转为小写,在搜索时也会把搜索参数中的字母转为小写,这样,即使用mill或者MILL搜索,都会返回address包含"mill"、"MILL"等凡是这四个字母组成的单词的文档。

取address包含"mill"或"lane"的文档,命令是

get /bank/_doc/_search
{
    "query": {
        "match": {
            "address": "mill lane"
        }
    }
}

取address包含"mill lane"短语的文档,命令是:

get /bank/_doc/_search
{
    "query":{
        "match_phrase": {
            "address": "mill lane"
        }
    }
}

注意这里用了match_phrase替代之前的match,phrase的意思就是短语。

上面命令query下面一级直接是match_all、match或match_phrase,这仅适用于单条件搜索。想要多条件搜索的话,需要用bool query,表现形式是query下面一级是bool,bool下面一级是must数组或者should数组或者must_not数组,数组里面才是多个match或者match_phrse。其中must数组是既。。又。。的意思,should数组是或。。或。。的意思,must_not数组是既不。。又不。。的意思。没有shoud_not。

取address包含"mill"单词且age=28的文档,命令是

get /bank/_doc/_search
{
    "query": {
        "bool": {
            "must": [{
                "match": {
                    "address": "mill"
                }
            }, {
                "match": {
                    "age": 38
                }
            }]
        }
    }
}

取address包含"mill"单词或者age=28的文档,命令是

get /bank/_doc/_search
{
    "query": {
        "bool": {
            "should": [{
                "match": {
                    "address": "mill"
                }
            }, {
                "match": {
                    "age": "28"
                }
            }]
        }
    }
}

取address不包含"mill"单词且age!=28的文档,命令是

get /bank/_doc/_search
{
    "query": {
        "bool": {
            "must_not": [{
                "match": {
                    "address": "mill"
                }
            }, {
                "match": {
                    "age": 28
                }
            }]
        }
    }
}

也可以在bool中混合使用must数组、should数组、must_not数组。注意,should数组与must数组或是must_not数组一起使用的话,必须把should数组放在must数组中,即should数组是must数组的一个元素,且should数组用bool包裹。

取age=39,且firstname是Virginia或者lastname是Ayala的文档,命令是

get /bank/_doc/_search
{
    "query": {
        "bool": {
            "must": [{
                "match": {
                    "age": 39
                }
            }, {
                "bool": {
                    "should": [{
                        "match": {
                            "firstname": "Virginia"
                        }
                    }, {
                        "match": {
                            "lastname": "Ayala"
                        }
                    }]
                }
            }]
        }
    }
}

大于、小于的筛选搜索

bool query除了must、should、must_not外,还支持filter数组,相当于sql中的大于(等于)、小于(等于),用于数字或日期过滤。filter数组里面元素的key是range,值是个json对象,对象的key是筛选字段。

取state=MA且余额在(8000,10000)、年龄在[20,30]的文档,命令是

get /bank/_doc/_search
{
    "query": {
        "bool": {
            "must": [{
                "match": {
                    "state": "MA"
                }
            }],
            "filter": [{
                "range": {
                    "balance": {
                        "gt": 8000,
                        "lt": 10000
                    }
                }
            }, {
                "range": {
                    "age": {
                        "gte": 20,
                        "lte": 30
                    }
                }
            }]
        }
    }
}

聚合

根据state字段分组,并根据文档数量大小倒序取前10,命令是

get /bank/_search
{
    "size": 0,
    "aggs": {
        "group_by_state": {
            "terms": {
                "field": "state.keyword",
                "size": 3
            }
        }
    }
}

es第一篇:Getting Started的更多相关文章

  1. ElasticSearch入门 第一篇:Windows下安装ElasticSearch

    这是ElasticSearch 2.4 版本系列的第一篇: ElasticSearch入门 第一篇:Windows下安装ElasticSearch ElasticSearch入门 第二篇:集群配置 E ...

  2. 【LWJGL3】LWJGL3的内存分配设计,第一篇,栈上分配

    简介 LWJGL (Lightweight Java Game Library 3),是一个支持OpenGL,OpenAl,Opengl ES,Vulkan等的Java绑定库.<我的世界> ...

  3. linux-0.11分析:boot文件 bootsect.s 第一篇随笔

    boot文件 bootsect.s 第一篇随笔 参考 [github这个博主的][ https://github.com/sunym1993/flash-linux0.11-talk ] bootse ...

  4. 从0开始搭建SQL Server AlwaysOn 第一篇(配置域控)

    从0开始搭建SQL Server AlwaysOn 第一篇(配置域控) 第一篇http://www.cnblogs.com/lyhabc/p/4678330.html第二篇http://www.cnb ...

  5. Python爬虫小白入门(四)PhatomJS+Selenium第一篇

    一.前言 在上一篇博文中,我们的爬虫面临着一个问题,在爬取Unsplash网站的时候,由于网站是下拉刷新,并没有分页.所以不能够通过页码获取页面的url来分别发送网络请求.我也尝试了其他方式,比如下拉 ...

  6. Three.js 第一篇:绘制一个静态的3D球体

    第一篇就画一个球体吧 首先我们知道Three.js其实是一个3D的JS引擎,其中的强大之处就在于这个JS框架并不是依托于JQUERY来写的.那么,我们在写这一篇绘制3D球体的文章的时候,应该注意哪些地 ...

  7. 深入学习jQuery选择器系列第一篇——基础选择器和层级选择器

    × 目录 [1]id选择器 [2]元素选择器 [3]类选择器[4]通配选择器[5]群组选择器[6]后代选择器[7]兄弟选择器 前面的话 选择器是jQuery的根基,在jQuery中,对事件处理.遍历D ...

  8. 【第一篇】ASP.NET MVC快速入门之数据库操作(MVC5+EF6)

    目录 [第一篇]ASP.NET MVC快速入门之数据库操作(MVC5+EF6) [第二篇]ASP.NET MVC快速入门之数据注解(MVC5+EF6) [第三篇]ASP.NET MVC快速入门之安全策 ...

  9. Android基础学习第一篇—Project目录结构

    写在前面的话: 1. 最近在自学Android,也是边看书边写一些Demo,由于知识点越来越多,脑子越来越记不清楚,所以打算写成读书笔记,供以后查看,也算是把自己学到所理解的东西写出来,献丑,如有不对 ...

随机推荐

  1. lnmp一键安装包 配置多站点

    在/usr/local/nginx/conf/vhost下配置多站点的文件,一个站点对应一个文件,配置如下信息: vim ./vhost/test.conf server { listen ; ser ...

  2. 编写高质量代码改善C#程序的157个建议——建议75:警惕线程不会立即启动

    建议75:警惕线程不会立即启动 现代的大多数操作系统都不是一个实时的操作系统,Windows系统也是如此.所以,不能奢望我们的线程能够立即启动.Windows内部会实现特殊的算法以进行线程之间的调度, ...

  3. 解剖JavaScript中的null和undefined【转】

    在JavaScript开发中,被人问到:null与undefined到底有啥区别? 一时间不好回答,特别是undefined,因为这涉及到undefined的实现原理.于是,细想之后,写下本文,请各位 ...

  4. memcached整理の内存管理及删除机制

    内存的碎片化 如果用C语言直接malloc,free来向操作系统申请和释放内存时,在不断申请和释放的过程中,形成了一些很小的内存片段,无法再利用.这种空闲但无法利用内存的现象称为内存的碎片化. sla ...

  5. 浅谈HTTPS以及Fiddler抓取HTTPS协议(摘抄)

    一.浅谈HTTPS 我们都知道HTTP并非是安全传输,在HTTPS基础上使用SSL协议进行加密构成的HTTPS协议是相对安全的.目前越来越多的企业选择使用HTTPS协议与用户进行通信,如百度.谷歌等. ...

  6. win10登录不上sql2005

    因需求安装了一个SQL Server 2005. 登录的时候,用户Sa模式可以登录,Windows身份验证方式却无法登录. 经测试.解决方法如下: SQL Server Management Stud ...

  7. 网站页面多出&65279出现空白行的原因及解决方法

    模板文件生成html文件之后会在body开头处加入一个可见的控制符&#65279,导致页面头部会出现一个空白行.原因是页面的编码是UTF-8 + BOM. 这种编码方式一般会在windows操 ...

  8. Android-Activity-startActivityForResult

    之前 Android-Intent意图传递数据,的博客讲解了,一个Activity 跳转 到另外一个Activity 可以把数据带过去 Android还提供了一种方式,一个Activity 跳转 到另 ...

  9. CSS基础知识:常见选择器示例

    CSS(Cascading Style Sheet),中文译为层叠样式表,可以让设计者方便灵活地控制Web页面的外观表现.CSS是1996年由W3C审核通过并且推荐使用的.CSS的引入,就是为了使HT ...

  10. C# 二维码生成——QRCode

    C#二维码生成,这里使用开源的ThoughtWorks.QRCode.dll库. 步骤: 1.下载ThoughtWorks.QRCode.dll库文件,并引用到项目中. 2.创建QRCodeHandl ...