Elasticsearch学习之深入搜索二 --- 搜索底层原理剖析

1. 普通match如何转换为term+should

{
　　"match": { "title": "java elasticsearch"}
}

使用诸如上面的match query进行多值搜索的时候，es会在底层自动将这个match query转换为bool的语法，bool should，指定多个搜索词，同时使用term query

{

  "bool": {

    "should": [

      { "term": { "title": "java" }},

      { "term": { "title": "elasticsearch"   }}

    ]

  }

}

2. and match如何转换为term+must

{

    "match": {

        "title": {

            "query":    "java elasticsearch",

            "operator": "and"

        }

    }

}

{

  "bool": {

    "must": [

      { "term": { "title": "java" }},

      { "term": { "title": "elasticsearch"   }}

    ]

  }

}

3. minimum_should_match如何转换

{

    "match": {

        "title": {

            "query":                "java elasticsearch hadoop spark",

            "minimum_should_match": "75%"

        }

    }

}

{

  "bool": {

    "should": [

      { "term": { "title": "java" }},

      { "term": { "title": "elasticsearch"   }},

      { "term": { "title": "hadoop" }},

      { "term": { "title": "spark" }}

    ],

    "minimum_should_match":

  }

}

match query --> bool + term

4. 权重控制

　　搜索标题中包含java的帖子，同时呢，如果标题中包含hadoop或elasticsearch就优先搜索出来，同时呢，如果一个帖子包含java hadoop，一个帖子包含java elasticsearch，包含hadoop的帖子要比elasticsearch优先搜索出来

　　搜索条件的权重，boost，可以将某个搜索条件的权重加大，此时当匹配这个搜索条件和匹配另一个搜索条件的document计算relevance score时，匹配权重更大的搜索条件的document，relevance score会更高，当然也就会优先被返回回来，默认情况下，搜索条件的权重都是一样的，都是1

GET /forum/article/_search

{

  "query": {

    "bool": {

      "must": [

        {

          "match": {

            "title": "blog"

          }

        }

      ],

      "should": [

        {

          "match": {

            "title": {

              "query": "java"

            }

          }

        },

        {

          "match": {

            "title": {

              "query": "hadoop"

            }

          }

        },

        {

          "match": {

            "title": {

              "query": "elasticsearch"

            }

          }

        },

        {

          "match": {

            "title": {

              "query": "spark",

              "boost":

            }

          }

        }

      ]

    }

  }

}

Elasticsearch学习之深入搜索二 --- 搜索底层原理剖析的更多相关文章

ElasticSearch 学习记录之ES高亮搜索
高亮搜索 ES 通过在查询的时候可以在查询之后的字段数据加上html 标签字段,使文档在在web 界面上显示的时候是由颜色或者字体格式的 GET /product/_search { "si ...
Kafka底层原理剖析（近万字建议收藏）
Kafka 简介 Apache Kafka 是一个分布式发布-订阅消息系统.是大数据领域消息队列中唯一的王者.最初由 linkedin 公司使用 scala 语言开发,在2010年贡献给了Apache ...
《java学习三》并发编程 -------线程池原理剖析
阻塞队列与非阻塞队阻塞队列与普通队列的区别在于,当队列是空的时,从队列中获取元素的操作将会被阻塞,或者当队列是满时,往队列里添加元素的操作会被阻塞.试图从空的阻塞队列中获取元素的线程将会被阻塞,直到 ...
Java程序员必会Synchronized底层原理剖析
synchronized作为Java程序员最常用同步工具,很多人却对它的用法和实现原理一知半解,以至于还有不少人认为synchronized是重量级锁,性能较差,尽量少用. 但不可否认的是synchr ...
Elasticsearch学习系列四（聚合搜索）
聚合分析聚合分析是数据库中重要的功能特性,完成对一个查询的集中数据的聚合计算.如:最大值.最小值.求和.平均值等等.对一个数据集求和,算最大最小值等等,在ES中称为指标聚合,而对数据做类似关系型数据 ...
Elasticsearch学习笔记（十二）filter与query
一.keyword 字段和keyword数据类型 1.测试准备数据 POST /forum/article/_bulk { "index": { "_id" ...
zigbee学习之路(十二):zigbee协议原理介绍
一.前言从今天开始,我们要正式开始进行zigbee相关的通信实验了,我所使用的协议栈是ZStack 是TI ZStack-CC2530-2.3.0-1.4.0版本,大家也可以从TI的官网上直接下载T ...
ElasticSearch 学习记录之集群分片内部原理
分片内部原理分片是如何工作的为什么ES搜索是近实时性的为什么CRUD 操作也是实时性 ES 是怎么保证更新被持久化时断电也不丢失数据为什么删除文档不会立即释放空间 refresh, flush ...
【算法学习】AVL平衡二叉搜索树原理及各项操作编程实现（C语言）
#include<stdio.h> #include "fatal.h" struct AvlNode; typedef struct AvlNode *Positio ...

随机推荐

Redis系列-php怎么通过redis扩展使用redis
From: http://blog.csdn.net/love__coder/article/details/8691679 通过前面几篇blog,我们应该对redis有个大致的认识,这里再讲解下,p ...
Nginx配置优化解读
全局配置 Nginx的配置文件是nginx的安装目录的conf/nginx .conf,nginx.conf配置文件中,几个全局高级配置在模块部分之上. user www www; worker_p ...
hive 配置元数据以mysql 存储
<?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="confi ...
asp.net gridview实现正在加载效果方案一AJAX(转)
前台代码: <%@ Page Language="C#" AutoEventWireup="true" CodeFile="Default.as ...
css实现图片横向排列滚动
.imageList{ overflow-x: auto; overflow-y: hidden; height:180px; white-space: nowrap; img{ width:auto ...
Two FIFOs of length 253 with 8-bits
FIFO 先入先出队列(First Input First Output,FIFO) 可以实现数据缓存. 一.FIFO的一些重要参数: 1.length:未知,待查 //补充:学长说:“FIFO一般只 ...
c++运算符重载---20
原创博文,转载请标明出处--周学伟 http://www.cnblogs.com/zxouxuewei/ c++的一大特性就是重载(overload),通过重载可以把功能相似的几个函数合为一个,使得程 ...
Java计算几何图形的面积
对于每个几何图形而言,都有一些共同的属性,如名字.面积等,而其计算面积的方法却各不相同.为了简化开发,请编写程序,定义一个超类来实现输入名字的方法,并使用抽象方法来计算面积. 思路分析: 所谓超类就是 ...
VMware Playerでの仮想マシン起動エラー
Windows Updateすると.翌日VMware Playerの仮想マシン起動時に「この仮想マシンを構成済み設定でパワーオンするのに十分な物理メモリがありません.」のエラーとなることが時々あり ...
web -- 前端访问后台跨区问题解决
package com.xindatai.ibs.web.filter; import java.io.IOException; import javax.servlet.Filter; import ...

Elasticsearch学习之深入搜索二 --- 搜索底层原理剖析

Elasticsearch学习之深入搜索二 --- 搜索底层原理剖析的更多相关文章

随机推荐

热门专题