ElasticSearch 实现分词全文检索

数据准备

ElasticSearch 实现分词全文检索 - 测试数据准备

bool查询

复合过滤器，将多个查询条件，以一定的逻辑组合在一起

must：所有的条件，用 must 组合在一起，标识 and 的意思
must_not：将 must_not 中的条件，全部都不能匹配，标识 not 的意思
should：所有的条件，用should组合在一起，表示 or 的意思

# 查询省份为江苏或上海

# operatorld 不是联通 !=2

# smsContent 中包括 开心 和 钞票

# bool 查询

POST /sms-logs-index/_search

{

  "query": {

    "bool": {

      "should": [

        {"term": {

          "province": {

            "value": "江苏"

          }

        }},

        {"term": {

          "province": {

            "value": "上海"

          }

        }}

      ],

      "must_not": [

        {

          "term": {

            "operatorld": {

              "value": "2"

            }

          }

        }

      ],

      "must": [

        {

          "match": {

            "smsContent": "开心"

          }

        },

        {

          "match": {

            "smsContent": "钞票"

          }

        }

      ]

    }

  }

}

JAVA

@Test

void boolQuery() throws Exception {

    String indexName = "sms-logs-index";

    RestHighLevelClient client = ESClient.getClient();

    //1. 创建SearchRequest对象

    SearchRequest request = new SearchRequest(indexName);

    //2. 指定查询条件

    SearchSourceBuilder builder = new SearchSourceBuilder();

    BoolQueryBuilder boolQuery = QueryBuilders.boolQuery();

    boolQuery.should(QueryBuilders.termQuery("province","江苏"));

    boolQuery.should(QueryBuilders.termQuery("province","上海"));

    boolQuery.mustNot(QueryBuilders.termQuery("operatorld","2"));

    boolQuery.must(QueryBuilders.matchQuery("smsContent","开心"));

    boolQuery.must(QueryBuilders.matchQuery("smsContent","钞票"));

    builder.query(boolQuery);

    request.source(builder);

    //3. 执行查询

    SearchResponse resp = client.search(request, RequestOptions.DEFAULT);

    //4. 输出返回值

    for (SearchHit hit : resp.getHits().getHits()) {

        System.out.println(hit.getSourceAsMap());

    }

}

boosting 查询

boosting 查询可以帮助我们去影响查询后的 score

positive：只有匹配上positive的查询的内容，才会被放到返回的结果中
negative：如果匹配上和positive并且也匹配上了negative，就可以降低这样的文档 score.
negative_boost：指定系数，必须小于 1.0

关于查询时，分数是如何计算的：
搜索的关键字在文档中出现的频次越高，分数就越高
指定的文档内容越短，分数就越高
我们在搜索时，指定的关键字也会被分词，这个被分词的内容，被分词库匹配的个数越多，分数越高

POST /sms-logs-index/_search

{

  "query": {

    "boosting": {

      "positive": {

        "match": {

          "smsContent": "人"

        }

      },

      "negative": {

        "match": {

          "smsContent": "网络"   # 如果查出来的包括 网络

        }

      },

      "negative_boost": 0.5  #将分数乘以系数 0.5 ，分数越高，排名越靠前

    }

  }

}

Java

@Test

void boostringQuery() throws Exception {

    String indexName = "sms-logs-index";

    RestHighLevelClient client = ESClient.getClient();

    //1. 创建SearchRequest对象

    SearchRequest request = new SearchRequest(indexName);

    //2. 指定查询条件

    SearchSourceBuilder builder = new SearchSourceBuilder();

    BoostingQueryBuilder boostingQuery = QueryBuilders.boostingQuery(

            QueryBuilders.matchQuery("smsContent", "人"),

            QueryBuilders.matchQuery("smsContent", "网络")

    ).negativeBoost(0.5f);

    builder.query(boostingQuery);

    request.source(builder);

    //3. 执行查询

    SearchResponse resp = client.search(request, RequestOptions.DEFAULT);

    //4. 输出返回值

    for (SearchHit hit : resp.getHits().getHits()) {

        System.out.println(hit.getSourceAsMap());

    }

}

ElasticSearch 实现分词全文检索 - 复合查询的更多相关文章

Elasticsearch(7) --- 复合查询
Elasticsearch(7) ---复合查询复合查询有:bool query(布尔查询).boosting query(提高查询).constant_score(固定分数查询).dis_max( ...
Elasticsearch实现复合查询,高亮结果等技巧
一.Es的配置实现es的全文检索功能的第一步,首先从与es进行连接开始,这里我使用的是es的5.x java api语法. public TransportClient esClient() thr ...
ElasticSearch学习问题记录——nested查询不到数据
通过代码创建了索引名称为demoindex,索引类型为school,以下是索引类型的数据映射结构: { "state": "open", "setti ...
第三百六十六节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的bool组合查询
第三百六十六节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的bool组合查询 bool查询说明 filter:[],字段的过滤,不参与打分must:[] ...
Elasticsearch结构化搜索与查询
Elasticsearch 的功能之一就是搜索,搜索主要分为两种类型,结构化搜索和全文搜索.结构化搜索是指有关查询那些具有内在结构数据的过程.比如日期.时间和数字都是结构化的:它们有精确的格式,我们可 ...
014-elasticsearch5.4.3【五】-搜索API【三】复合查询boolQuery、constantScoreQuery、disMaxQuery
一.概述复合查询包装其他复合或叶子查询,以组合其结果和分数,更改其行为,或从查询切换到筛选器上下文. 1.1.constantScoreQuery 包含另一个查询但在过滤器上下文中执行的查询.所有匹 ...
elasticsearch kibana + 分词器安装详细步骤
elasticsearch kibana + 分词器安装详细步骤一.准备环境系统:Centos7 JDK安装包:jdk-8u191-linux-x64.tar.gz ES安装包:elasticse ...
PHP+mysql数据库开发搜索功能：中英文分词+全文检索（MySQL全文检索+中文分词（SCWS））
PHP+mysql数据库开发类似百度的搜索功能:中英文分词+全文检索中文分词: a) robbe PHP中文分词扩展: http://www.boyunjian.com/v/softd/robb ...
ElasticSearch中文分词（IK）
ElasticSearch常用的很受欢迎的是IK,这里稍微介绍下安装过程及测试过程. 1.ElasticSearch官方分词自带的中文分词器很弱,可以体检下: [zsz@VS-zsz ~]$ c ...
Hibernate的几种查询方式-HQL,QBC,QBE,离线查询,复合查询,分页查询
HQL查询方式这一种我最常用,也是最喜欢用的,因为它写起来灵活直观,而且与所熟悉的SQL的语法差不太多.条件查询.分页查询.连接查询.嵌套查询,写起来与SQL语法基本一致,唯一不同的就是把表名换成了 ...

随机推荐

Mac下安装lightgbm-image not found
Error Message: : dlopen(/Users/{xxx}/anaconda3/lib/python3.6/site-packages/lightgbm/lib_lightgbm.so, ...
react native 上传图片（后面有空写一个，完整的案例）
图片上传的思路很正确 https://www.jianshu.com/p/c9f030fa6754 1. 获取图片路径利用react-native-image-crop-pick 从手机中获得图片的 ...
CCF 201803-4 棋局评估
一. 对抗搜索的适用范围在博弈论题目中,如果决策双方的获胜条件是截然相反的,即一方要求得分越高越好,另一方要求得分越低越好,这时我们就可以用上对抗搜索算法. 二.对抗搜索的主要思想对抗搜索的核心思 ...
解决通过Eclipse启动Tomcat-Run On Server出现The selection cannot be run on any server
有时候通过Eclipse启动Tomcat-Run On Server会出现The selection cannot be run on any server的情况如下图: 这是因为没有在eclipse ...
21 forms组件-参数initial&instance应用
简单来讲: 如果你想传入前端的页面中附带值,那么在实例化forms中: form = SecondModelForm(data=request.POST, instance=permission_ob ...
添加新模块 import
import getpass username = input("username") password = input("password") #passwo ...
通过Windows定时任务执行Python脚本给钉钉群发送消息
前提:已经存在有成功发送钉钉群机器人消息的python脚本,参考上一篇Python调用钉钉群机器人发送群消息 Windows定时任务设置 1.本机是Win7系统:控制面板->系统和安全-> ...
software Engineering homework 4
博客信息沈阳航空航天大学计算机学院2020软件工程作业作业要求 https://edu.cnblogs.com/campus/sau/Computer1701-1705/homework/1068 ...
The first blog
这是一只爱碎觉的汪的第一篇博客. 下面就来简单介绍一下自己吧,爱好广泛,尤其热爱钢琴和运动,喜欢每个按键在手指间跳动的感觉,喜欢一个个音符连起来奏响的一曲曲优美的音乐,也喜欢运动后大汗淋漓的畅快感.肯 ...
win10系统格式化后进行虚拟分区
1. 目的目前win10磁盘分区多数人采用两种方式: 1:只分一个C盘,文件在C盘以目录区分. 缺点:所有文件都在一起,区分查找比较麻烦. 2:物理分区,分多个盘,如C,D,E等等缺点:容量固定, ...

ElasticSearch 实现分词全文检索 - 复合查询

目录

数据准备

bool查询

boosting 查询

ElasticSearch 实现分词全文检索 - 复合查询的更多相关文章

随机推荐

热门专题