第三百六十六节，Python分布式爬虫打造搜索引擎Scrapy精讲

第三百六十六节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的bool组合查询

bool查询说明

filter:[],字段的过滤，不参与打分
must:[],如果有多个查询，都必须满足【并且】
should:[],如果有多个查询，满足一个或者多个都匹配【或者】
must_not:[],相反查询词一个都不满足的就匹配【取反，非】

# bool查询

# 老版本的filtered已经被bool替换

#用 bool 包括 must should must_not filter 来完成

#格式如下：

#bool:{

#     "filter":[],      字段的过滤，不参与打分

#     "must":[],        如果有多个查询，都必须满足【并且】

#     "should":[],      如果有多个查询，满足一个或者多个都匹配【或者】

#     "must_not":[],    相反查询词一个都不满足的就匹配【取反，非】

#}

建立测试数据

#建立测试数据

POST jobbole/job/_bulk

{"index":{"_id":1}}

{"salary":10,"title":"python"}

{"index":{"_id":2}}

{"salary":20,"title":"Scrapy"}

{"index":{"_id":3}}

{"salary":30,"title":"Django"}

{"index":{"_id":4}}

{"salary":40,"title":"Elasticsearch"}

bool组合查询——最简单的filter过滤查询之term查询，相当于等于

过滤查询到salary字段等于20的数据

可以看出执行两个两个步骤，先查到所有数据，然后在查到的所有数据过滤查询到salary字段等于20的数据

# bool查询

# 老版本的filtered已经被bool替换

#用 bool 包括 must should must_not filter 来完成

#格式如下：

#bool:{

#     "filter":[],      字段的过滤，不参与打分

#     "must":[],        如果有多个查询，都必须满足

#     "should":[],      如果有多个查询，满足一个或者多个都匹配

#     "must_not":[],    相反查询词一个都不满足的就匹配

#}

#简单过滤查询

#最简单的filter过滤查询

#如果我们要查salary字段等于20的数据

GET jobbole/job/_search

{

  "query": {

    "bool": {                   #bool组合查询

      "must":{                  #如果有多个查询词，都必须满足

        "match_all":{}          #查询所有字段

      },

      "filter": {               #filter过滤

        "term": {               #term查询，不会将我们的搜索词进行分词，将搜索词完全匹配的查询

          "salary": 20          #查询salary字段值为20

        }

      }

    }

  }

}

#简单过滤查询

#最简单的filter过滤查询

#如果我们要查salary字段等于20的数据

GET jobbole/job/_search

{

  "query": {

    "bool": {

      "must":{

        "match_all":{}

      },

      "filter": {

        "term": {

          "salary": 20

        }

      }

    }

  }

}

bool组合查询——最简单的filter过滤查询之terms查询，相当于或

过滤查询到salary字段等于10或20的数据

# bool查询

# 老版本的filtered已经被bool替换

#用 bool 包括 must should must_not filter 来完成

#格式如下：

#bool:{

#     "filter":[],      字段的过滤，不参与打分

#     "must":[],        如果有多个查询，都必须满足

#     "should":[],      如果有多个查询，满足一个或者多个都匹配

#     "must_not":[],    相反查询词一个都不满足的就匹配

#}

#简单过滤查询

#最简单的filter过滤查询

#如果我们要查salary字段等于20的数据

#过滤salary字段值为10或者20的数据

GET jobbole/job/_search

{

  "query": {

    "bool": {

      "must":{

        "match_all":{}

      },

      "filter": {

        "terms": {

          "salary":[10,20]

        }

      }

    }

  }

}

注意：filter过滤里也可以用其他基本查询的

_analyze测试查看分词器解析的结果
analyzer设置分词器类型ik_max_word精细化分词，ik_smart非精细化分词
text设置词

#_analyze测试查看分词器解析的结果

#analyzer设置分词器类型ik_max_word精细化分词，ik_smart非精细化分词

#text设置词

GET _analyze

{

  "analyzer": "ik_max_word",

  "text": "Python网络开发工程师"

}

GET _analyze

{

  "analyzer": "ik_smart",

  "text": "Python网络开发工程师"

}

bool组合查询——组合复杂查询1
查询salary字段等于20或者title字段等于python、salary字段不等于30、并且salary字段不等于10的数据

# bool查询

# 老版本的filtered已经被bool替换

#用 bool 包括 must should must_not filter 来完成

#格式如下：

#bool:{

#     "filter":[],      字段的过滤，不参与打分

#     "must":[],        如果有多个查询，都必须满足【并且】

#     "should":[],      如果有多个查询，满足一个或者多个都匹配【或者】

#     "must_not":[],    相反查询词一个都不满足的就匹配【取反，非】

#}

# 查询salary字段等于20或者title字段等于python、salary字段不等于30、并且salary字段不等于10的数据

GET jobbole/job/_search

{

  "query": {

    "bool": {

      "should": [

        {"term":{"salary":20}},

        {"term":{"title":"python"}}

      ],

      "must_not": [

        {"term": {"salary":30}},

        {"term": {"salary":10}}]

    }

  }

}

bool组合查询——组合复杂查询2
查询salary字段等于20或者title字段等于python、salary字段不等于30、并且salary字段不等于10的数据

# bool查询

# 老版本的filtered已经被bool替换

#用 bool 包括 must should must_not filter 来完成

#格式如下：

#bool:{

#     "filter":[],      字段的过滤，不参与打分

#     "must":[],        如果有多个查询，都必须满足【并且】

#     "should":[],      如果有多个查询，满足一个或者多个都匹配【或者】

#     "must_not":[],    相反查询词一个都不满足的就匹配【取反，非】

#}

# 查询title字段等于python、或者、(title字段等于elasticsearch并且salary等于30)的数据

GET jobbole/job/_search

{

  "query": {

    "bool": {

      "should":[

        {"term":{"title":"python"}},

        {"bool": {

          "must": [

            {"term": {"title":"elasticsearch"}},

            {"term":{"salary":30}}

          ]

        }}

      ]

    }

  }

}

bool组合查询——过滤空和非空

#建立数据

POST bbole/jo/_bulk

{"index":{"_id":""}}

{"tags":["search"]}

{"index":{"_id":""}}

{"tags":["search","python"]}

{"index":{"_id":""}}

{"other_field":["some data"]}

{"index":{"_id":""}}

{"tags":null}

{"index":{"_id":""}}

{"tags":["search",null]}

处理null空值的方法

获取tags字段，值不为空并且值不为null的数据

# bool查询

# 老版本的filtered已经被bool替换

#用 bool 包括 must should must_not filter 来完成

#格式如下：

#bool:{

#     "filter":[],      字段的过滤，不参与打分

#     "must":[],        如果有多个查询，都必须满足【并且】

#     "should":[],      如果有多个查询，满足一个或者多个都匹配【或者】

#     "must_not":[],    相反查询词一个都不满足的就匹配【取反，非】

#}

#处理null空值的方法

#获取tags字段，值不为空并且值不为null的数据

GET bbole/jo/_search

{

  "query": {

    "bool": {

      "filter": {

        "exists": {

          "field": "tags"

        }

      }

    }

  }

}

获取tags字段值为空或者为null的数据，如果数据没有tags字段也会获取

# bool查询

# 老版本的filtered已经被bool替换

#用 bool 包括 must should must_not filter 来完成

#格式如下：

#bool:{

#     "filter":[],      字段的过滤，不参与打分

#     "must":[],        如果有多个查询，都必须满足【并且】

#     "should":[],      如果有多个查询，满足一个或者多个都匹配【或者】

#     "must_not":[],    相反查询词一个都不满足的就匹配【取反，非】

#}

#获取tags字段值为空或者为null的数据，如果数据没有tags字段也会获取

GET bbole/jo/_search

{

  "query": {

    "bool": {

      "must_not": {

        "exists": {

          "field": "tags"

        }

      }

    }

  }

}

第三百六十六节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的bool组合查询的更多相关文章

第三百五十八节，Python分布式爬虫打造搜索引擎Scrapy精讲—将bloomfilter(布隆过滤器)集成到scrapy-redis中
第三百五十八节,Python分布式爬虫打造搜索引擎Scrapy精讲—将bloomfilter(布隆过滤器)集成到scrapy-redis中,判断URL是否重复布隆过滤器(Bloom Filter)详 ...
第三百五十三节，Python分布式爬虫打造搜索引擎Scrapy精讲—scrapy的暂停与重启
第三百五十三节,Python分布式爬虫打造搜索引擎Scrapy精讲—scrapy的暂停与重启 scrapy的每一个爬虫,暂停时可以记录暂停状态以及爬取了哪些url,重启时可以从暂停状态开始爬取过的UR ...
第三百六十九节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现搜索功能
第三百六十九节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现搜索功能 Django实现搜索功能 1.在Django配置搜索结果页的路由映 ...
第三百六十五节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的基本查询
第三百六十五节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的基本查询 1.elasticsearch(搜索引擎)的查询 elasticsearch是功能 ...
第三百六十四节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mapping映射管理
第三百六十四节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mapping映射管理 1.映射(mapping)介绍映射:创建索引的时候,可以预先定义字 ...
第三百六十节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的基本概念
第三百六十节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的基本概念 elasticsearch的基本概念 1.集群:一个或者多个节点组织在一起 2.节点 ...
第三百六十八节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现搜索的自动补全功能
第三百六十八节,Python分布式爬虫打造搜索引擎Scrapy精讲—用Django实现搜索的自动补全功能 elasticsearch(搜索引擎)提供了自动补全接口官方说明:https://www.e ...
第三百六十七节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)scrapy写入数据到elasticsearch中
第三百六十七节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)scrapy写入数据到elasticsearch中前面我们讲到的elasticsearch( ...
第三百六十三节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mget和bulk批量操作
第三百六十三节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mget和bulk批量操作注意:前面讲到的各种操作都是一次http请求操作一条数据,如果想 ...

随机推荐

angular中的jqLite所包含的jquery API
Angular本身包含了一个叫做jqLite的可兼容性库. 使用过的angular.element()方法就返回一个jqLite对象, jqLite是jQuery库的子集,它允许Angular以跨 ...
FFmpeg编译： undefined reference to 'av_frame_alloc()'
今天使用CMake编译FFmpeg的时候,死活编不过,提示什么“undefined reference to 'av_frame_alloc()” 后来仔细查找,发现是头文件包含错误. 错误的代码: ...
std::bind技术内幕
引子最近群里比较热闹,大家都在山寨c++11的std::bind,三位童孩分别实现了自己的bind,代码分别在这里: 木头云的实现 mr.li的实现 null的实现,null的另一个版本的实现这些 ...
vim学习笔记（10）：vim命令大全
进入vim的命令: vim filename :打开或新建文件,并将光标置于第一行首 vim +n filename :打开文件,并将光标置于第n行首 vim + filename :打开文件,并将光 ...
u3d中的向量 vector3 vector2
Vector3(x,y,z)x代表左右,y代表上下,z代表前后 Vector3.magnitude 长度计算两点之间的距离 .如果只给了一点的话.算出的长度其实就是和Vector3.zero点之间 ...
在Java中使用SQLite的教程（转）
简介:这是在Java中使用SQLite的教程的详细页面,介绍了和java,有关的知识.技巧.经验,和一些java源码等. 简单的在Java中使用SQLite的教程使用SQLiteJDBC封装 www ...
【嵌入式】S3C2410平台移植linux 2.6.14内核
小续第一次接触内核的东西,有点小激动啊激动归激动,这实验还是要继续做下去,书上三两句话就带过去的,剩下的就留给我们了,着实考验动手能力啊当编译过内核之后,发现这个过程也不复杂嘛(复杂的是内核的配 ...
node的http请求
//node的http服务 'use strict' var http = require('http') var server = http.createServer(function (reque ...
Mac上把python源文件编译成so文件
把python源文件编译成so文件前言实际上属于一种代码混淆/加密的技术,大家知道python的源文件放在那里,大家是都可以看的,不像C语言编译出来可以拿编译后的东西去运行,所以就出现了这种需求. ...
django模型创建
定义模型模型,属性,表,字段之间的关系一个模型类在数据库中对应一张表,在模型类中定义的属性,对应该模型对照表中的一个字段定义属性:见下文创建模型类元选项在模型类中定义Meta类,用于设置元 ...

第三百六十六节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的bool组合查询

第三百六十六节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的bool组合查询的更多相关文章

随机推荐

热门专题