029 ElasticSearch----全文检索技术04---基础知识详解02-查询

1.查询

(1)基本查询

基本语法：

GET /索引库名/_search

{

    "query":{

        "查询类型":{

            "查询条件":"查询条件值"

        }

    }

}

这里的query代表一个查询对象，里面可以有不同的查询属性

查询类型：
- 例如：match_all， match，term ， range 等等
查询条件：查询条件会根据类型的不同，写法也有差异，后面详细讲解

<1>查询所有（match_all)

使用postman工具：

postman的响应栏中显示：

{

    "took": 7,

    "timed_out": false,

    "_shards": {

        "total": 1,

        "successful": 1,

        "skipped": 0,

        "failed": 0

    },

    "hits": {

        "total": 1,

        "max_score": 1.0,

        "hits": [

            {

                "_index": "heima",

                "_type": "goods",

                "_id": "iMWEbW0BGbukEcUFLzZ1",

                "_score": 1.0,

                "_source": {

                    "title": "小米手机",

                    "images": "http://image.leyou.com/12479122.jpg",

                    "price": 2699.00

                }

            }

        ]

    }

}

took：查询花费时间，单位是毫秒
time_out：是否超时
_shards：分片信息
hits：搜索结果总览对象
- total：搜索到的总条数
- max_score：所有结果中文档得分的最高分
- hits：搜索结果的文档对象数组，每个元素是一条搜索到的文档信息
  - _index：索引库
  - _type：文档类型
  - _id：文档id
  - _score：文档得分
  - _source：文档的源数据

<2>匹配查询

我们先加入一条数据，便于测试：

PUT /heima/goods/3

{

    "title":"小米电视4A",

    "images":"http://image.leyou.com/12479122.jpg",

    "price":3899.00

}

现在，索引库中有1部手机，1台电视：

or关系

　　match类型查询，会把查询条件进行分词，然后进行查询,多个词条之间是or的关系

语法：

GET /heima/_search

{

    "query":{

        "match":{

            "title":"小米电视"

        }

    }

}

结果：

在上面的案例中，不仅会查询到电视，而且与小米相关的都会查询到，多个词之间是or的关系。

and关系

某些情况下，我们需要更精确查找，我们希望这个关系变成and，可以这样做：

GET /heima/_search

{

    "query":{

        "match": {

          "title": {

            "query": "小米电视",

            "operator": "and"

          }

        }

    }

}

结果：

本例中，只有同时包含小米和电视的词条才会被搜索到。

or和and之间？

在 or 与 and 间二选一有点过于非黑即白。如果用户给定的条件分词后有 5 个查询词项，想查找只包含其中 4 个词的文档，该如何处理？将 operator 操作符参数设置成 and 只会将此文档排除。

有时候这正是我们期望的，但在全文搜索的大多数应用场景下，我们既想包含那些可能相关的文档，同时又排除那些不太相关的。换句话说，我们想要处于中间某种结果。

match 查询支持 minimum_should_match 最小匹配参数，这让我们可以指定必须匹配的词项数用来表示一个文档是否相关。我们可以将其设置为某个具体数字，更常用的做法是将其设置为一个百分数，因为我们无法控制用户搜索时输入的单词数量：

GET /heima/_search

{

    "query":{

        "match":{

            "title":{

                "query":"小米曲面电视",

                "minimum_should_match": "75%"

            }

        }

    }

}

<3>多字段查询（multi_match）

multi_match与match类似，不同的是它可以在多个字段中查询

GET /heima/_search

{

    "query":{

        "multi_match": {

            "query":    "小米",

            "fields":   [ "title", "subTitle" ]

        }

    }

}

本例中，我们会在title字段和subtitle字段中查询小米这个词

<4>词条匹配(term)

term 查询被用于精确值匹配，这些精确值可能是数字、时间、布尔或者那些未分词的字符串

GET /heima/_search

{

    "query":{

        "term":{

            "price":2699.00

        }

    }

}

<5>多词条精确匹配(terms)

terms 查询和 term 查询一样，但它允许你指定多值进行匹配。如果这个字段包含了指定值中的任何一个值，那么这个文档满足条件：

GET /heima/_search

{

    "query":{

        "terms":{

            "price":[2699.00,2899.00,3899.00]

        }

    }

}

(2)结果过滤

默认情况下，elasticsearch在搜索的结果中，会把文档中保存在_source的所有字段都返回。

如果我们只想获取其中的部分字段，我们可以添加_source的过滤

<1>直接指定字段

示例：

GET /heima/_search

{

  "_source": ["title","price"],

  "query": {

    "term": {

      "price": 2699

    }

  }

}

返回的结果：

<2>指定includes和excludes

我们也可以通过：

includes：来指定想要显示的字段
excludes：来指定不想要显示的字段

二者都是可选的。

实例：

GET /heima/_search

{

  "_source": {

    "includes":["title","price"]

  },

  "query": {

    "term": {

      "price": 2699

    }

  }

}

与下面的结果将是一样的：

GET /heima/_search

{

  "_source": {

     "excludes": ["images"]

  },

  "query": {

    "term": {

      "price": 2699

    }

  }

}

postman软件中测试：

结果：

(3)高级查询

<1>布尔组合(bool)

bool把各种其它查询通过must（与，即取交集）、must_not（非）、should（或，即取并集）的方式进行组合

案例：

通过查询所有，查看当前的所有信息。发现索引库中有两条信息。

添加如下的查询条件后

{

    "query":{

        "bool":{

            "must":     { "match": { "title": "小米" }},

            "must_not": { "match": { "title":  "电视" }},

            "should":   { "match": { "title": "手机" }}

        }

    }

}

结果：

结果分析：这个案例查询出了包含小米，手机等词且不包含电视这个词的数据信息。

<2>范围查询(range)

range 查询找出那些落在指定区间内的数字或者时间

案例：查询出价格在1000-2800区间里的商品数据。

GET /heima/_search

{

    "query":{

        "range": {

            "price": {

                "gte":  1000.0,

                "lt":   2800.00

            }

        }

    }

}

响应结果为：

<3>模糊查询(fuzzy)

我们先新增一个商品：

POST /heima/goods/4

{

    "title":"apple手机",

    "images":"http://image.leyou.com/12479122.jpg",

    "price":6899.00

}

通过postman提交数据：

响应结果：

fuzzy 查询是 term 查询(精确匹配)的模糊等价。它允许用户搜索词条与实际词条的拼写出现偏差，但是偏差的编辑距离不得超过2：

案例：

GET /heima/_search

{

  "query": {

    "fuzzy": {

      "title": "appla"

    }

  }

}

post输入请求条件：

响应结果为：

我们可以通过fuzziness来指定允许的编辑距离

GET /heima/_search

{

  "query": {

    "fuzzy": {

        "title": {

            "value":"appla",

            "fuzziness":1

        }

    }

  }

}

案例：

响应结果：

结果分析：查询条件是appmy,与apple有两个字符不同，超出了给定的1个字符。

(4)过滤(filter)

<1>条件查询中进行过滤

所有的查询都会影响到文档的评分及排名。如果我们需要在查询结果中进行过滤，并且不希望过滤条件影响评分，那么就不要把过滤条件作为查询条件来用。而是使用filter方式：

GET /heima/_search

{

    "query":{

        "bool":{

            "must":{ "match": { "title": "小米手机" }},

            "filter":{

                "range":{"price":{"gt":2000.00,"lt":3800.00}}

            }

        }

    }

}

<2>无查询条件，直接过滤

如果一次查询只有过滤，没有查询条件，不希望进行评分，我们可以使用constant_score取代只有 filter 语句的 bool 查询。在性能上是完全相同的，但对于提高查询简洁性和清晰度有很大帮助。

GET /heima/_search

{

    "query":{

        "constant_score":   {

            "filter": {

                 "range":{"price":{"gt":2000.00,"lt":3000.00}}

            }

        }

}

(5)排序

<1>单字段排序

sort 可以让我们按照不同的字段进行排序，并且通过order指定排序的方式

案例：按照价格进行排序

GET /heima/_search

{

  "query": {

    "match": {

      "title": "小米手机"

    }

  },

  "sort": [

    {

      "price": {

        "order": "desc"

      }

    }

  ]

}

postman工具中测试：

测试结果：

<2>多字段排序

假定我们想要结合使用 price和 _score（得分）进行查询，并且匹配的结果首先按照价格排序，然后按照相关性得分排序：

GET /goods/_search

{

    "query":{

        "bool":{

            "must":{ "match": { "title": "小米手机" }},

            "filter":{

                "range":{"price":{"gt":200000,"lt":300000}}

            }

        }

    },

    "sort": [

      { "price": { "order": "desc" }},

      { "_score": { "order": "desc" }}

    ]

}

029 ElasticSearch----全文检索技术04---基础知识详解02-查询的更多相关文章

Cisco路由技术基础知识详解
第一部分请写出568A的线序(接触网络第一天就应该会的,只要你掐过,想都能想出来) .网卡MAC地址长度是( )个二进制位(16进制与2进制的换算关系,只是换种方式问,不用你拿笔去算) A.12 ...
RabbitMQ,Apache的ActiveMQ,阿里RocketMQ,Kafka,ZeroMQ,MetaMQ,Redis也可实现消息队列，RabbitMQ的应用场景以及基本原理介绍，RabbitMQ基础知识详解，RabbitMQ布曙
消息队列及常见消息队列介绍 2017-10-10 09:35操作系统/客户端/人脸识别一.消息队列(MQ)概述消息队列(Message Queue),是分布式系统中重要的组件,其通用的使用场景可以 ...
RabbitMQ基础知识详解
什么是MQ? MQ全称为Message Queue, 消息队列(MQ)是一种应用程序对应用程序的通信方法.MQ是消费-生产者模型的一个典型的代表,一端往消息队列中不断写入消息,而另一端则可以读取队列中 ...
Python基础知识详解从入门到精通（七）类与对象
本篇主要是介绍python,内容可先看目录其他基础知识详解,欢迎查看本人的其他文章Python基础知识详解从入门到精通(一)介绍Python基础知识详解从入门到精通(二)基础Python基础知识详 ...
第157天：canvas基础知识详解
目录一.canvas简介 1.1 什么是canvas?(了解) 1.2 canvas主要应用的领域(了解) 二.canvas绘图基础 2.0 sublime配置canvas插件(推荐) 2.1 Ca ...
直播一：H.264编码基础知识详解
一.编码基础概念 1.为什么要进行视频编码? 视频是由一帧帧图像组成,就如常见的gif图片,如果打开一张gif图片,可以发现里面是由很多张图片组成.一般视频为了不让观众感觉到卡顿,一秒钟至少需要16帧 ...
redis基础知识详解
一.redis基础知识 1.Redis是什么Redis是一个开源的key-value存储系统. 和Memcached类似,它支持存储的value类型相对更多,包括string(字符串).list(链表 ...
【干货】用大白话聊聊JavaSE — ArrayList 深入剖析和Java基础知识详解（二）
在上一节中,我们简单阐述了Java的一些基础知识,比如多态,接口的实现等. 然后,演示了ArrayList的几个基本方法. ArrayList是一个集合框架,它的底层其实就是一个数组,这一点,官方文档 ...
Thrift入门初探(2)--thrift基础知识详解
昨天总结了thrift的安装和入门实例,Thrift入门初探--thrift安装及java入门实例,今天开始总结一下thrift的相关基础知识. Thrift使用一种中间语言IDL,来进行接口的定义, ...
Java网络编程一：基础知识详解
网络基础知识 1.OSI分层模型和TCP/IP分层模型的对应关系这里对于7层模型不展开来讲,只选择跟这次系列主题相关的知识点介绍. 2.七层模型与协议的对应关系网络层 ------------ ...

随机推荐

消息队列mq总结
一.消息队列概述消息队列中间件是分布式系统中重要的组件,主要解决应用解耦,异步消息,流量削锋等问题,实现高性能,高可用,可伸缩和最终一致性架构.目前使用较多的消息队列有ActiveMQ,RabbitM ...
SpringBoot 整合MyBatis 统一配置bean的别名
所谓别名, 就是在mappper.xml配置文件中像什么resultType="xxx" 不需要写全限定类名, 只需要写类名即可. 配置方式有两种: 1. 在 applicatio ...
SpringApplication到底run了什么（上）
在上篇文章:SpringBoot源码解析:创建SpringApplication对象实例中,我们详细描述了SpringApplication对象实例的创建过程,本篇文章继续看run方法的执行逻辑吧 p ...
laravel框架之即时更改
表单//@foreach($res as $k=>$v) <tr id="{{$v->id}}" > <td>{{$v->id}}< ...
web的应用模式
在开发web应用中,有两种模式: 1.前后端分离. 2.前后端不分离. 一.前后端不分离在前后端不分离的应用模式中,前端页面看到的效果是有后端控制的,由后端渲染页面或重定向,也就是后端需要控制前端的 ...
elementUI,设置日期，只能选择今天和今天以后的, :picker-options="pickerOptions"
1. html 加 :picker-options="pickerOptions" <el-date-picker v-model="shop.receive_ti ...
Hybris Storefront里产品图片显示不出来的分析方法
在Hybris Backoffice里新建一个product,维护了一些图片信息,然而在Storefront上进行搜索时,无论结果列表,还是产品明细页面里,都没有对应的图片可以显示. 我的排查方法是, ...
Excel 使用VBA或宏----简单笔记
一.一种纯粹的录制宏.(未使用此方法,如有兴趣可自学),就是Excel提供了“所见即所得”的方式生成宏.把自己想要的操作记录,录制成宏. 自学网等各种网站有教学视频或文章二.常用VBA语法及函数笔记 ...
Spark GraphX图计算核心源码分析【图构建器、顶点、边】
一.图构建器 GraphX提供了几种从RDD或磁盘上的顶点和边的集合构建图形的方法.默认情况下,没有图构建器会重新划分图的边:相反,边保留在默认分区中.Graph.groupEdges要求对图进行重新 ...
使用 Python 生成二维码
在“一带一路”国际合作高峰论坛举行期间, 20 国青年投票选出中国的“新四大发明”:高铁.扫码支付.共享单车和网购.其中扫码支付指手机通过扫描二维码跳转到支付页面,再进行付款.这种新的支付方式,造就二 ...

029 ElasticSearch----全文检索技术04---基础知识详解02-查询

029 ElasticSearch----全文检索技术04---基础知识详解02-查询的更多相关文章

随机推荐

热门专题