029 ElasticSearch----全文检索技术04---基础知识详解02-查询

1.查询

(1)基本查询

基本语法：

GET /索引库名/_search

{

    "query":{

        "查询类型":{

            "查询条件":"查询条件值"

        }

    }

}

这里的query代表一个查询对象，里面可以有不同的查询属性

查询类型：
- 例如：match_all， match，term ， range 等等
查询条件：查询条件会根据类型的不同，写法也有差异，后面详细讲解

<1>查询所有（match_all)

使用postman工具：

postman的响应栏中显示：

{

    "took": 7,

    "timed_out": false,

    "_shards": {

        "total": 1,

        "successful": 1,

        "skipped": 0,

        "failed": 0

    },

    "hits": {

        "total": 1,

        "max_score": 1.0,

        "hits": [

            {

                "_index": "heima",

                "_type": "goods",

                "_id": "iMWEbW0BGbukEcUFLzZ1",

                "_score": 1.0,

                "_source": {

                    "title": "小米手机",

                    "images": "http://image.leyou.com/12479122.jpg",

                    "price": 2699.00

                }

            }

        ]

    }

}

took：查询花费时间，单位是毫秒
time_out：是否超时
_shards：分片信息
hits：搜索结果总览对象
- total：搜索到的总条数
- max_score：所有结果中文档得分的最高分
- hits：搜索结果的文档对象数组，每个元素是一条搜索到的文档信息
  - _index：索引库
  - _type：文档类型
  - _id：文档id
  - _score：文档得分
  - _source：文档的源数据

<2>匹配查询

我们先加入一条数据，便于测试：

PUT /heima/goods/3

{

    "title":"小米电视4A",

    "images":"http://image.leyou.com/12479122.jpg",

    "price":3899.00

}

现在，索引库中有1部手机，1台电视：

or关系

　　match类型查询，会把查询条件进行分词，然后进行查询,多个词条之间是or的关系

语法：

GET /heima/_search

{

    "query":{

        "match":{

            "title":"小米电视"

        }

    }

}

结果：

在上面的案例中，不仅会查询到电视，而且与小米相关的都会查询到，多个词之间是or的关系。

and关系

某些情况下，我们需要更精确查找，我们希望这个关系变成and，可以这样做：

GET /heima/_search

{

    "query":{

        "match": {

          "title": {

            "query": "小米电视",

            "operator": "and"

          }

        }

    }

}

结果：

本例中，只有同时包含小米和电视的词条才会被搜索到。

or和and之间？

在 or 与 and 间二选一有点过于非黑即白。如果用户给定的条件分词后有 5 个查询词项，想查找只包含其中 4 个词的文档，该如何处理？将 operator 操作符参数设置成 and 只会将此文档排除。

有时候这正是我们期望的，但在全文搜索的大多数应用场景下，我们既想包含那些可能相关的文档，同时又排除那些不太相关的。换句话说，我们想要处于中间某种结果。

match 查询支持 minimum_should_match 最小匹配参数，这让我们可以指定必须匹配的词项数用来表示一个文档是否相关。我们可以将其设置为某个具体数字，更常用的做法是将其设置为一个百分数，因为我们无法控制用户搜索时输入的单词数量：

GET /heima/_search

{

    "query":{

        "match":{

            "title":{

                "query":"小米曲面电视",

                "minimum_should_match": "75%"

            }

        }

    }

}

<3>多字段查询（multi_match）

multi_match与match类似，不同的是它可以在多个字段中查询

GET /heima/_search

{

    "query":{

        "multi_match": {

            "query":    "小米",

            "fields":   [ "title", "subTitle" ]

        }

    }

}

本例中，我们会在title字段和subtitle字段中查询小米这个词

<4>词条匹配(term)

term 查询被用于精确值匹配，这些精确值可能是数字、时间、布尔或者那些未分词的字符串

GET /heima/_search

{

    "query":{

        "term":{

            "price":2699.00

        }

    }

}

<5>多词条精确匹配(terms)

terms 查询和 term 查询一样，但它允许你指定多值进行匹配。如果这个字段包含了指定值中的任何一个值，那么这个文档满足条件：

GET /heima/_search

{

    "query":{

        "terms":{

            "price":[2699.00,2899.00,3899.00]

        }

    }

}

(2)结果过滤

默认情况下，elasticsearch在搜索的结果中，会把文档中保存在_source的所有字段都返回。

如果我们只想获取其中的部分字段，我们可以添加_source的过滤

<1>直接指定字段

示例：

GET /heima/_search

{

  "_source": ["title","price"],

  "query": {

    "term": {

      "price": 2699

    }

  }

}

返回的结果：

<2>指定includes和excludes

我们也可以通过：

includes：来指定想要显示的字段
excludes：来指定不想要显示的字段

二者都是可选的。

实例：

GET /heima/_search

{

  "_source": {

    "includes":["title","price"]

  },

  "query": {

    "term": {

      "price": 2699

    }

  }

}

与下面的结果将是一样的：

GET /heima/_search

{

  "_source": {

     "excludes": ["images"]

  },

  "query": {

    "term": {

      "price": 2699

    }

  }

}

postman软件中测试：

结果：

(3)高级查询

<1>布尔组合(bool)

bool把各种其它查询通过must（与，即取交集）、must_not（非）、should（或，即取并集）的方式进行组合

案例：

通过查询所有，查看当前的所有信息。发现索引库中有两条信息。

添加如下的查询条件后

{

    "query":{

        "bool":{

            "must":     { "match": { "title": "小米" }},

            "must_not": { "match": { "title":  "电视" }},

            "should":   { "match": { "title": "手机" }}

        }

    }

}

结果：

结果分析：这个案例查询出了包含小米，手机等词且不包含电视这个词的数据信息。

<2>范围查询(range)

range 查询找出那些落在指定区间内的数字或者时间

案例：查询出价格在1000-2800区间里的商品数据。

GET /heima/_search

{

    "query":{

        "range": {

            "price": {

                "gte":  1000.0,

                "lt":   2800.00

            }

        }

    }

}

响应结果为：

<3>模糊查询(fuzzy)

我们先新增一个商品：

POST /heima/goods/4

{

    "title":"apple手机",

    "images":"http://image.leyou.com/12479122.jpg",

    "price":6899.00

}

通过postman提交数据：

响应结果：

fuzzy 查询是 term 查询(精确匹配)的模糊等价。它允许用户搜索词条与实际词条的拼写出现偏差，但是偏差的编辑距离不得超过2：

案例：

GET /heima/_search

{

  "query": {

    "fuzzy": {

      "title": "appla"

    }

  }

}

post输入请求条件：

响应结果为：

我们可以通过fuzziness来指定允许的编辑距离

GET /heima/_search

{

  "query": {

    "fuzzy": {

        "title": {

            "value":"appla",

            "fuzziness":1

        }

    }

  }

}

案例：

响应结果：

结果分析：查询条件是appmy,与apple有两个字符不同，超出了给定的1个字符。

(4)过滤(filter)

<1>条件查询中进行过滤

所有的查询都会影响到文档的评分及排名。如果我们需要在查询结果中进行过滤，并且不希望过滤条件影响评分，那么就不要把过滤条件作为查询条件来用。而是使用filter方式：

GET /heima/_search

{

    "query":{

        "bool":{

            "must":{ "match": { "title": "小米手机" }},

            "filter":{

                "range":{"price":{"gt":2000.00,"lt":3800.00}}

            }

        }

    }

}

<2>无查询条件，直接过滤

如果一次查询只有过滤，没有查询条件，不希望进行评分，我们可以使用constant_score取代只有 filter 语句的 bool 查询。在性能上是完全相同的，但对于提高查询简洁性和清晰度有很大帮助。

GET /heima/_search

{

    "query":{

        "constant_score":   {

            "filter": {

                 "range":{"price":{"gt":2000.00,"lt":3000.00}}

            }

        }

}

(5)排序

<1>单字段排序

sort 可以让我们按照不同的字段进行排序，并且通过order指定排序的方式

案例：按照价格进行排序

GET /heima/_search

{

  "query": {

    "match": {

      "title": "小米手机"

    }

  },

  "sort": [

    {

      "price": {

        "order": "desc"

      }

    }

  ]

}

postman工具中测试：

测试结果：

<2>多字段排序

假定我们想要结合使用 price和 _score（得分）进行查询，并且匹配的结果首先按照价格排序，然后按照相关性得分排序：

GET /goods/_search

{

    "query":{

        "bool":{

            "must":{ "match": { "title": "小米手机" }},

            "filter":{

                "range":{"price":{"gt":200000,"lt":300000}}

            }

        }

    },

    "sort": [

      { "price": { "order": "desc" }},

      { "_score": { "order": "desc" }}

    ]

}

029 ElasticSearch----全文检索技术04---基础知识详解02-查询的更多相关文章

Cisco路由技术基础知识详解
第一部分请写出568A的线序(接触网络第一天就应该会的,只要你掐过,想都能想出来) .网卡MAC地址长度是( )个二进制位(16进制与2进制的换算关系,只是换种方式问,不用你拿笔去算) A.12 ...
RabbitMQ,Apache的ActiveMQ,阿里RocketMQ,Kafka,ZeroMQ,MetaMQ,Redis也可实现消息队列，RabbitMQ的应用场景以及基本原理介绍，RabbitMQ基础知识详解，RabbitMQ布曙
消息队列及常见消息队列介绍 2017-10-10 09:35操作系统/客户端/人脸识别一.消息队列(MQ)概述消息队列(Message Queue),是分布式系统中重要的组件,其通用的使用场景可以 ...
RabbitMQ基础知识详解
什么是MQ? MQ全称为Message Queue, 消息队列(MQ)是一种应用程序对应用程序的通信方法.MQ是消费-生产者模型的一个典型的代表,一端往消息队列中不断写入消息,而另一端则可以读取队列中 ...
Python基础知识详解从入门到精通（七）类与对象
本篇主要是介绍python,内容可先看目录其他基础知识详解,欢迎查看本人的其他文章Python基础知识详解从入门到精通(一)介绍Python基础知识详解从入门到精通(二)基础Python基础知识详 ...
第157天：canvas基础知识详解
目录一.canvas简介 1.1 什么是canvas?(了解) 1.2 canvas主要应用的领域(了解) 二.canvas绘图基础 2.0 sublime配置canvas插件(推荐) 2.1 Ca ...
直播一：H.264编码基础知识详解
一.编码基础概念 1.为什么要进行视频编码? 视频是由一帧帧图像组成,就如常见的gif图片,如果打开一张gif图片,可以发现里面是由很多张图片组成.一般视频为了不让观众感觉到卡顿,一秒钟至少需要16帧 ...
redis基础知识详解
一.redis基础知识 1.Redis是什么Redis是一个开源的key-value存储系统. 和Memcached类似,它支持存储的value类型相对更多,包括string(字符串).list(链表 ...
【干货】用大白话聊聊JavaSE — ArrayList 深入剖析和Java基础知识详解（二）
在上一节中,我们简单阐述了Java的一些基础知识,比如多态,接口的实现等. 然后,演示了ArrayList的几个基本方法. ArrayList是一个集合框架,它的底层其实就是一个数组,这一点,官方文档 ...
Thrift入门初探(2)--thrift基础知识详解
昨天总结了thrift的安装和入门实例,Thrift入门初探--thrift安装及java入门实例,今天开始总结一下thrift的相关基础知识. Thrift使用一种中间语言IDL,来进行接口的定义, ...
Java网络编程一：基础知识详解
网络基础知识 1.OSI分层模型和TCP/IP分层模型的对应关系这里对于7层模型不展开来讲,只选择跟这次系列主题相关的知识点介绍. 2.七层模型与协议的对应关系网络层 ------------ ...

随机推荐

DP之背包
一.01背包: (以下均可用一维来写即只能选择一次的物品装在一定容积的背包中.f[i][j]表示前i件物品在容积为j时的最大价值. for(int i = 1; i <= n ; i++){ ...
Java初学者推荐学习书籍PDF免费下载
场景 Effective Java 中文版Java核心技术卷Ⅰ 基础知识(第8版)Java语言程序设计-进阶篇(原书第8版)疯狂Java讲义Java从入门到精通第三版Java编程思想第4版重构-改 ...
简洁的 systemd 操作指南Linux下Service文件服务说明(转)
1.服务权限systemd有系统和用户区分:系统(/user/lib/systemd/system/).用户(/etc/lib/systemd/user/). 一般系统管理员手工创建的单元文件建议存放 ...
javascript DOM中的节点层次和节点类型概述
针对JS高级程序设计这本书,主要是理解概念,大部分要点源自书内.写这个主要是当个笔记加总结存在的问题请大家多多指正! 因为DOM这方面的对象方法操作性都特别强,但是逻辑很简单,所以就没有涉及到实际的 ...
中文版Postman测试需要登陆才能访问的接口（基于Cookie）
ApiPost堪称增强版的中文postman,是一个支持团队协作,并可直接生成文档的API调试.管理工具.它支持模拟POST.GET.PUT等常见请求,是后台接口开发者或前端.接口测试人员不可多得的工 ...
Firefox火狐浏览器打开新标签页一直闪烁
问题:Firefox浏览器打开新标签页一直刷新,不能打开页面解决办法:在url栏输入about:support,打开配置文件夹,然后删除目录中包含storage所有文件,重启Firefox即可.
USB总线驱动程序
USB主机控制器:UHCI OHCI EHCI UHCI:intel 低速(1.5Mbps)(USB1.1)/全速(12Mbps)(USB2.0,USB2.0又分为全速和高速)OHCI:microso ...
Hbase优化：（待重点研究）
一.服务端调优 1.参数配置 1).hbase.regionserver.handler.count:该设置决定了处理RPC的线程数量,默认值是10,通常可以调大,比如:150,当请求内容很大(上MB ...
python语言(六)mock接口开发、发邮件、写日志、新Excel操作
一.urllib模块 urllib模块是一个标准模块,直接import urllib即可,在python3里面只有urllib模块,在python2里面有urllib模块和urllib2模块. url ...
ReplaceGoogleCDN 真的好使
在国内访问 stackoverflow快了很多. 谢谢开发者 https://github.com/justjavac/ReplaceGoogleCDN

029 ElasticSearch----全文检索技术04---基础知识详解02-查询

029 ElasticSearch----全文检索技术04---基础知识详解02-查询的更多相关文章

随机推荐

热门专题