1 Query String Search(查询串检索)

这种方法通过HTTP请求的Query String携带查询参数, 因此得名.

适用于临时性的查询请求, 比如在终端检查基础信息:
# 检索name中包含Java的文档, 并按价格降序排序:

curl -XGET 'http://localhost:9301/book_shop/it_book/_search?q=name:Java&sort=price:desc'
生产环境中很少使用, 因为请求参数都封装到Query String中, 难以构建复杂的查询.

(1) 查询全部商品:

直接在浏览器的URL地址栏内输入搜索参数:

http://172.16.22.133:9301/book_shop/it_book/_search?q=name:Java

(2) 查询的结果:

{

    "took": 8,

    "timed_out": false,

    "_shards": {

        "total": 5,

        "successful": 5,

        "skipped": 0,

        "failed": 0

    },

    "hits": {

        "total": 3,

        "max_score": 1,

        "hits": [

            {

                "_index": "book_shop",

                "_type": "it_book",

                "_id": "2",

                "_score": 1,

                "_source": {

                    "name": "深入理解Java虚拟机：JVM高级特性与最佳实践",

                    "author": "周志明",

                    "category": "编程语言",

                    "desc": "Java图书领域公认的经典著作",

                    "price": 79,

                    "date": "2013-10-01",

                    "publisher": "机械工业出版社",

                    "tags": [

                        "Java",

                        "虚拟机",

                        "最佳实践"

                    ]

                }

            },

            // 省略另外两条记录

        ]

    }

}

(3) 查询结果中的各个参数的含义:

① took: 此次检索耗费的时间, 单位是毫秒;

② timed_out: 是否超出规定的检索时间, 这里没有设置, 后续会讲解此参数;

③ _shards: 被查询的index被分散成多个分片, 所以搜索请求会分发到所有的primary shard(或primary shard对应的某个replica shard)上, 这里显示各个分片是否查询成功的信息;

④ hits: 命中的文档情况, 有如下参数:

total: 符合条件的文档总数, 即hit(命中)数;

max_score: Lucene底层对检索到的文档的相关度的评分, 相关度越高, 说明越匹配, score的值也就越高.

hits: 命中的所有document的详细数据.

2 Query DSL(ES特定语法检索)

DSL: Domain Specified Language, 特定领域的语言, 一般需要Kibana等工具配合操作.

这种方式把查询参数构建成JSON格式的数据, 并封装到HTTP请求的Request Body(请求体)中, 可以构建各类复杂的查询语法, 功能要比Query String Search强大很多.

(1) 查询全部商品:

GET book_shop/it_book/_search

{

    "query": { "match_all": {} }

}

(2) 查询name中包含Java的商品, 并按price降序排序:

GET book_shop/it_book/_search

{

    "query": {

        "match": {

            "name": "Java"

        }

    },

    "sort": [

        { "price": "desc" }

    ]

}

(3) 分页查询商品 - 每页显示1条, 显示第3页:

GET book_shop/it_book/_search

{

    "query": { "match_all": {} },

    "from": 2,

    "size": 1

}

(4) 只查询商品的名称和价格:

GET book_shop/it_book/_search

{

    "query": {"match_all": {}},

    "_source": ["name", "price"]

}

—— 上述各类语法可以组合使用, 具体使用方法后续会陆续介绍.

3 Query Filter(过滤检索)

过滤查询, 比如: 查询name中包含Java, 且price不大于80元的商品:

GET book_shop/it_book/_search

{

    "query": {

        "bool": {

          	"must": {

                "match": {"name": "Java"}	// name中含有Java

            },

            "filter": {

                "range": {

                    "price": {"lte": 80.0}	// 价格不大于80.0

                }

            }

        }

    }

}

4 Full Text Search(全文检索)

(1) 查询描述信息desc中包含"Java图书"的文档, 只显示name和desc的值:

GET book_shop/it_book/_search

{

    "query": {

        "match": {"desc": "Java图书"}

    },

    "_source": ["name", "desc"]

}

(2) 查询结果中有2条数据符合要求:

{

  "took" : 2,

  "timed_out" : false,

  "_shards" : {

    "total" : 5,

    "successful" : 5,

    "skipped" : 0,

    "failed" : 0

  },

  "hits" : {

    "total" : 2,

    "max_score" : 0.8630463,

    "hits" : [

      {

        "_index" : "book_shop",

        "_type" : "it_book",

        "_id" : "2",

        "_score" : 0.8630463,

        "_source" : {

          "name" : "深入理解Java虚拟机：JVM高级特性与最佳实践",

          "desc" : "Java图书领域公认的经典著作"			// desc中有"Java"和"图书"

        }

      },

      {

        "_index" : "book_shop",

        "_type" : "it_book",

        "_id" : "1",

        "_score" : 0.2876821,

        "_source" : {

          "name" : "Java编程思想（第4版）",

          "desc" : "Java学习必读经典,殿堂级著作！"		// desc中有"Java"

        }

      }

    ]

  }

}

(3) 全文检索的过程 —— 对查询结果的说明:

Elasticsearch会对字段"desc"的内容进行分词, 并建立倒排索引.

也就是说, 这里会把 "Java图书" 分词为 "Java"、"图"、"书" 3个, 检索时将匹配desc中含有 "Java"、"图"、"书" 中任意一个分词的文档.

—— 对于中文分词, 可以通过IK分词器, 把"Java图书"分解为"Java"、"图书" 2个词, 参考博主的文章:ES XX - Elasticsearch中使用IK中文分词器.

5 Phrase Search(短语检索)

Full Text Search会对检索文本作分词处理, 然后从倒排索引中作匹配查询, 如果一个文档的对应field中存在任意一个分解后的词, 那么这个文档就算匹配检索条件.

Phrase Search不会对检索串进行分词处理, 只有一个文档的对应field中包含与检索文本完全一致的内容, 该文档才算匹配检索条件, 也才能作为结果返回 —— 可以理解为全文检索场景下的部分精确匹配.

(1) 精确查询desc中包含"Java图书"的文档:

GET book_shop/it_book/_search

{

    "query": {

        "match_phrase": {

            "desc": "Java图书"

        }

    },

    "_source": ["name", "desc"]

}

(2) 查询结果只有一条数据符合要求了:

{

  "took" : 2,

  "timed_out" : false,

  "_shards" : {

    "total" : 5,

    "successful" : 5,

    "skipped" : 0,

    "failed" : 0

  },

  "hits" : {

    "total" : 1,

    "max_score" : 0.8630463,

    "hits" : [

      {

        "_index" : "book_shop",

        "_type" : "it_book",

        "_id" : "2",

        "_score" : 0.8630463,

        "_source" : {

          "name" : "深入理解Java虚拟机：JVM高级特性与最佳实践",

          "desc" : "Java图书领域公认的经典著作"		// desc中精确含有"Java图书"

        }

      }

    ]

  }

}

6 Highlight Search(高亮检索)

(1) 分页查询desc中包含"Java图书"的文档, 页大小为1, 显示第1页, 并对搜索条件高亮处理:

GET book_shop/it_book/_search

{

    "query": {

        "match": {"desc": "Java图书"}

    },

    "from": 0,

    "size": 1,

    "highlight": {

        "fields": {"desc": {}}

    },

    "_source": ["name", "desc"]

}

(2) 查询结果:

{

  "took" : 6,

  "timed_out" : false,

  "_shards" : {

    "total" : 5,

    "successful" : 5,

    "skipped" : 0,

    "failed" : 0

  },

  "hits" : {

    "total" : 2,

    "max_score" : 0.8630463,

    "hits" : [

      {

        "_index" : "book_shop1",

        "_type" : "it_book",

        "_id" : "2",

        "_score" : 0.8630463,

        "_source" : {

          "name" : "深入理解Java虚拟机：JVM高级特性与最佳实践",

          "desc" : "Java图书领域公认的经典著作"

        },

        "highlight" : {		// 高亮显示, 默认添加<em>标签

          "desc" : [

            "<em>Java</em><em>图</em><em>书</em>领域公认的经典著作"

          ]

        }

      }

    ]

  }

}

从上述结果的"Java图书也可以看出, ES底层对desc字段的值"Java图书"进行了分词处理:

说明: 本文的六种查询方法, 只是一个简单的入门, 详细使用方法会在后续的学习中逐一演示.

版权声明

作者: 马瘦风(https://healchow.com)

出处: 博客园马瘦风的博客(https://www.cnblogs.com/shoufeng)

感谢阅读, 如果文章有帮助或启发到你, 点个[好文要顶

 ES 07 - Elasticsearch查询文档的六种方法的更多相关文章

ES（ElasticSearch）文档的表现形式以及增删改查
1. ES中的文档 ES是面向文档(document oriented)的,这意味着它可以存储整个对象或文档(document).然而它不仅仅是存储,还会索引(index)每个文档的内容使之可以被搜索 ...

Elasticsearch查询文档总数
前言在使用ES搜索的时候,或多或少都会面临查询数据总量的情况,下面介绍三种查询数据总量的方式. 其中,方案二解决了当结果数据总量超过1w时,由于ES默认设置(max_result_window:10 ...

MongoDB 教程（八）：查询文档、条件操作符
MongoDB 查询文档 MongoDB 查询文档使用 find() 方法. find() 方法以非结构化的方式来显示所有文档. MongoDB 查询数据的语法格式如下: db.collection. ...

ElasticSearch入门第五篇：使用C#查询文档
这是ElasticSearch 2.4 版本系列的第五篇: ElasticSearch入门第一篇:Windows下安装ElasticSearch ElasticSearch入门第二篇:集群配置 E ...

Elasticsearch 使用集群 - 创建和查询文档
章节 Elasticsearch 基本概念 Elasticsearch 安装 Elasticsearch 使用集群 Elasticsearch 健康检查 Elasticsearch 列出索引 Elas ...

elasticsearch——海量文档高性能索引系统
elasticsearch elasticsearch是一个高性能高扩展性的索引系统,底层基于apache lucene. 可结合kibana工具进行可视化. 概念: index 索引: 类似SQL中 ...

Elasticsearch 管理文档
ES支持近实时的索引.更新.查询.删除文档,近实时就意味着刚刚索引的数据需要1秒钟后才能搜索到,这也是与传统的SQL数据库不同的地方. 更多的ES文档资料参考:Elasticsearch官方文档翻译 ...

elasticsearch 路由文档到分片
路由文档到分片当你索引一个文档,它被存储在单独一个主分片上.Elasticsearch是如何知道文档属于哪个分片的呢?当你创建一个新文档,它是如何知道是应该存储在分片1还是分片2上的呢? 进程不能是 ...

elasticsearch父子文档处理(join)
elasticsearch父子文档处理 join 一.背景二.需求三.前置知识四.实现步骤 1.创建 mapping 2.添加父文档数据 3.添加子文档 4.查询文档 1.根据父文档id查询它下 ...

随机推荐

java.lang.IllegalArgumentException异常返回值类型的问题
java.lang.IllegalArgumentException: Cannot create TypedQuery for query with more than one return usi ...

bzoj [HNOI2008]Cards
群论第一题. 发现这题也是有颜色个数限制的,所以不能用$Polya$,只能用$Burnside$ $L={\frac{1}{|G|}}{\sum_{i=1}^{m}{D(a_{i})}}$ 先$dfs ...

约会倍增lca
题意:一棵树,给两个点,求树上有多少点到他俩距离相等倍增lca,分好多情况讨论.. #include<cstdio> #include<cstring> #include&l ...

从零开始学 Web 之 CSS（三）链接伪类、背景、行高、盒子模型、浮动
大家好,这里是「 Daotin的梦呓」从零开始学 Web 系列教程.此文首发于「 Daotin的梦呓」公众号,欢迎大家订阅关注.在这里我会从 Web 前端零基础开始,一步步学习 Web 相关的知识 ...

Spark学习之Spark调优与调试(一)
一.使用SparkConf配置Spark 对 Spark 进行性能调优,通常就是修改 Spark 应用的运行时配置选项.Spark 中最主要的配置机制是通过 SparkConf 类对 Spark 进行 ...

Vue之生命周期函数和钩子函数详解
在学习vue几天后,感觉现在还停留在初级阶段,虽然知道怎么和后端做数据交互,但是对对vue的生命周期不甚了解.只知道简单的使用,而不知道为什么,这对后面的踩坑是相当不利的.因为我们有时候会在几个钩子函 ...

微服务架构 - 离线部署k8s平台并部署测试实例
一般在公司部署或者真实环境部署k8s平台,很有可能是内网环境,也即意味着是无法连接互联网的环境,这时就需要离线部署k8s平台.在此整理离线部署k8s的步骤,分享给大家,有什么不足之处,欢迎指正. 1. ...

【Java】几道常见的秋招面试题
前言只有光头才能变强 Redis目前还在看,今天来分享一下我在秋招看过(遇到)的一些面试题(相对比较常见的) 0.final关键字简要说一下final关键字,final可以用来修饰什么? 这题我是 ...

包装类及 LeetCode 每日一题
1.包装类与创建对象 Java 为8大数据类型都提供了相应的包装类,并提供属性和方法,更方便的操作基本数据类型.包装类位于java.lang包中. 对于这几种类型的基本数据,都有相似的方法实现基本数据 ...

SharePoint布局页引用（实战）
分享人:广州华软极简一. 前言 SharePoint 布局页可使用在任何可引用页面布局的页面,学会在页面直接引用页面布局,可实现无代码形式修改页面.此文讲述2种常用使用页面布局方式.本文适用于初学 ...

ES 07 - Elasticsearch查询文档的六种方法

1 Query String Search(查询串检索)

2 Query DSL(ES特定语法检索)

3 Query Filter(过滤检索)

4 Full Text Search(全文检索)

5 Phrase Search(短语检索)

6 Highlight Search(高亮检索)

版权声明

ES 07 - Elasticsearch查询文档的六种方法的更多相关文章

随机推荐

热门专题