Elasticsearch：理解 mapping 中的 null

转载自：https://elasticstack.blog.csdn.net/article/details/114266732

null 不能被索引或搜索。 当字段设置为 null（或空数组或 所有值为 null 值的数组）时，将其视为该字段没有值。使用 null_value 参数可以用指定的值替换显式的空值，以便可以对其进行索引和搜索。 

例子一

    PUT my-index-000001

    {

      "mappings": {

        "properties": {

          "status_code": {

            "type":       "keyword",

            "null_value": "NULL"

          }

        }

      }

    }

在上面，我们针对 status_code 字段定义其 null_value，也就是说当我们导入一个文档，当它的 status_code 指定为 null 时，那么在导入时，实际上它是被认为是 status_code 当做 "NULL" 被导入并进行分析。我们以下面的两个文档来进行说明：

    PUT my-index-000001/_doc/1

    {

      "status_code": null

    }

    PUT my-index-000001/_doc/2

    {

      "status_code": []

    }

使用上面的两个命令写入两个文档到索引 my-index-000001 中。我们执行如下的搜索：

GET my-index-000001/_search

我们可以搜索到两个文档：

    {

      "took" : 1,

      "timed_out" : false,

      "_shards" : {

        "total" : 1,

        "successful" : 1,

        "skipped" : 0,

        "failed" : 0

      },

      "hits" : {

        "total" : {

          "value" : 2,

          "relation" : "eq"

        },

        "max_score" : 1.0,

        "hits" : [

          {

            "_index" : "my-index-000001",

            "_type" : "_doc",

            "_id" : "1",

            "_score" : 1.0,

            "_source" : {

              "status_code" : null

            }

          },

          {

            "_index" : "my-index-000001",

            "_type" : "_doc",

            "_id" : "2",

            "_score" : 1.0,

            "_source" : {

              "status_code" : [ ]

            }

          }

        ]

      }

    }

这显然是正确的，因为我们导入了两个文档。我们接着进行如下的搜索：

    GET my-index-000001/_search

    {

      "query": {

        "term": {

          "status_code": "NULL"

        }

      }

    }

上面的命令显示的结果为：

    {

      "took" : 1,

      "timed_out" : false,

      "_shards" : {

        "total" : 1,

        "successful" : 1,

        "skipped" : 0,

        "failed" : 0

      },

      "hits" : {

        "total" : {

          "value" : 1,

          "relation" : "eq"

        },

        "max_score" : 0.2876821,

        "hits" : [

          {

            "_index" : "my-index-000001",

            "_type" : "_doc",

            "_id" : "1",

            "_score" : 0.2876821,

            "_source" : {

              "status_code" : null

            }

          }

        ]

      }

    }

显然，第一个文档被搜索到，而第二个文档没有被搜索到。这是因为在第一个文档中，它清楚地指出 "status_code": null，所以在导入文档时，null_value 被认为是 status_code 而被导入并进行分析。第二个文档没有指定它是 null，所以没有被搜索出来。

例子二

假如我们有一下两个文档：

    PUT twitter/_doc/1

    {

      "age": null

    }

    PUT twitter/_doc/2

    {

      "age": 20

    }

在上面，我们有两个文档。第一个文档的 age 值为 null，也就是说它不能被搜索到。假如我们做如下的聚合：

    GET twitter/_search

    {

      "size": 0,

      "aggs": {

        "avg_age": {

          "avg": {

            "field": "age"

          }

        }

      }

    }

那么上面的聚合返回：

    {

      "took" : 2,

      "timed_out" : false,

      "_shards" : {

        "total" : 1,

        "successful" : 1,

        "skipped" : 0,

        "failed" : 0

      },

      "hits" : {

        "total" : {

          "value" : 2,

          "relation" : "eq"

        },

        "max_score" : null,

        "hits" : [ ]

      },

      "aggregations" : {

        "avg_age" : {

          "value" : 20.0

        }

      }

    }

也就是说平均年龄是 20 岁，这是因为第一个文档被视为不见。我们怎么才能让第一个文档也参入聚合呢？我们可以使用 null_value 来为 null 值的字段设置一个值。我们修改 mapping 为：

    DELETE  twitter

    PUT twitter

    {

      "mappings": {

        "properties": {

          "age": {

            "type": "float",

            "null_value": 0

          }

        }

      }

    }

我们再重新导入之前的两个文档：

    PUT twitter/_doc/1

    {

      "age": null

    }

    PUT twitter/_doc/2

    {

      "age": 20

    }

由于我们已经定义当 age 为 null 时，null_value 将会起作用，它的值将为 0，那么这个文档将为可见。执行如下的聚合：

    GET twitter/_search

    {

      "size": 0,

      "aggs": {

        "avg_age": {

          "avg": {

            "field": "age"

          }

        }

      }

    }

上面的结果为：

    {

      "took" : 703,

      "timed_out" : false,

      "_shards" : {

        "total" : 1,

        "successful" : 1,

        "skipped" : 0,

        "failed" : 0

      },

      "hits" : {

        "total" : {

          "value" : 2,

          "relation" : "eq"

        },

        "max_score" : null,

        "hits" : [ ]

      },

      "aggregations" : {

        "avg_age" : {

          "value" : 10.0

        }

      }

    }

现在的平均值变为 10 了，也就是 （20 + 0)/2 = 10。

这里必须注意的是，我们必须显示地指定 age 为 null，否则 null_vale 将不会起任何的作用。比如：

    DELETE twitter

    PUT twitter

    {

      "mappings": {

        "properties": {

          "age": {

            "type": "float",

            "null_value": 0

          }

        }

      }

    }

    PUT twitter/_doc/1

    {

      "content": "This is cool"

    }

    PUT twitter/_doc/2

    {

      "age": 20,

      "content": "This is cool too!"

    }

在上面，第一个文档里没有定义 age，那么 null_value 将不会起作用。如果我们做如下的聚合：

    GET twitter/_search

    {

      "size": 0,

      "aggs": {

        "avg_age": {

          "avg": {

            "field": "age"

          }

        }

      }

    }

其显示结果为：

    {

      "took" : 1,

      "timed_out" : false,

      "_shards" : {

        "total" : 1,

        "successful" : 1,

        "skipped" : 0,

        "failed" : 0

      },

      "hits" : {

        "total" : {

          "value" : 2,

          "relation" : "eq"

        },

        "max_score" : null,

        "hits" : [ ]

      },

      "aggregations" : {

        "avg_age" : {

          "value" : 20.0

        }

      }

    }

也就是说第一个文档没有被搜索到。

Elasticsearch：理解 mapping 中的 null_value的更多相关文章

Elasticsearch 理解mapping中的store属性
默认情况下,对字段值进行索引以使其可搜索,但不存储它们 (store). 这意味着可以查询该字段,但是无法检索原始字段值.在这里我们必须理解的一点是: 如果一个字段的mapping中含有store属性 ...
ElasticSearch(5)-Mapping
一.Mapping概述映射为了能够把日期字段处理成日期,把数字字段处理成数字,把字符串字段处理成全文本(Full-text)或精确的字符串值,Elasticsearch需要知道每个字段里面都包含了 ...
elasticsearch 之mapping
搭好elk 后,有时候会发现kibana 统计数据时,数据类型不对,这个时候就和elasticsearch的mapping有关,虽然我们可以用logstash修改传入es里的数据类型,比如 float ...
elasticsearch的mapping映射
Mapping简述 Elasticsearch是一个schema-less的系统,但并不代表no shema,而是会尽量根据JSON源数据的基础类型猜测你想要的字段类型映射.Elasticsearch ...
通过Java的Domain类构建ElasticSearch的mapping
通过给定一个Java的class类自行创建ElasticSearch的mapping Order的domain类 public class Order { public String system_i ...
ELK学习总结（4-1）elasticsearch更改mapping(不停服务重建索引)
elasticsearch更改mapping(不停服务重建索引)原文 http://donlianli.iteye.com/blog/1924721Elasticsearch的mapping一旦创建, ...
elasticsearch更改mapping(不停服务重建索引)
转载地址:http://donlianli.iteye.com/blog/1924721?utm_source=tuicool&utm_medium=referral Elasticsearc ...
[转]深刻理解Python中的元类(metaclass)以及元类实现单例模式
使用元类深刻理解Python中的元类(metaclass)以及元类实现单例模式在看一些框架源代码的过程中碰到很多元类的实例,看起来很吃力很晦涩:在看python cookbook中关于元类创建单例 ...
elasticsearch更改mapping，不停服务重建索引（转）
原文:http://donlianli.iteye.com/blog/1924721?utm_source=tuicool&utm_medium=referral Elasticsearch的 ...

随机推荐

JavaWEB04-Maven&Mybatis
今日内容 `Maven` Maven `Maven`概念&简介 Maven `Maven`安装配置 Maven `Maven`基本使用 Idea集成 `Idea`集成`Maven` Maven ...
docker安装confluence
目录一.docker安装二.破解三.配置mysql数据库四.域名配置五.参考一.docker安装 1.安装镜像 docker pull atlassian/confluence-serve ...
03 uniapp自定义导航栏的开发
在我眼里自定义导航分2类: 原生基础上 || 非原生基础上总结:项目当中能原生就原生,提高性能区别 uni-app 自带原生导航栏,在pages.json里配置. 原生导航的体验更好,渲染新页面时 ...
常用的函数式接口_Predicate接口_默认方法and和Predicate接口练习_集合接口筛选
默认方法:and 既然是条件判断,就会存在与.或.非三种常见的逻辑关系.其中将两个Preadicate条件使用"与"逻辑连接起来实现"并且"的效果时,可以使用d ...
零基础学Java（12）静态字段与静态方法
静态字段与静态方法之前我们都定义的main方法都被标记了static修饰符,那到底是什么意思?下面我们来看看静态字段如果将一个字段定义为static,每个类只有一个这样的字段.而对于非静 ...
Javaweb03-servlet&filter
1.什么是servlet 第一个servlet应用程序,实现servlet接口定义:凡是实现了servlet api接口(或者继承servlet api接口的实现类)的类就是servlet应用程序: ...
you need to load the kernel first
背景:在用第三方软件备份win10系统时,提示you need to load the kernel first 1.进BIOS把硬盘AHCI 模式调整成 SATA. 2.检查硬盘数据线是否插紧.主板 ...
Aoac唤醒的软件方案
Aoac唤醒这篇文章包含了Win10下的Aoac唤醒和Win11下的Aoac唤醒的不同地方,在结尾处: 从Win10时代开始,通过软件来唤醒机器是一个很常见的事情了,但是很少有文档去将如何通过AOA ...
【小白必看】Redis手把手教你从零开始下载到安装，再到配置允许图形化工具远程连接（一）
一.Redis安装本文暂时仅介绍Windows环境下Redis的安装. 由于Windows环境下没有.exe安装文件,这里我们使用"曲线救国"的.msi安装包帮助我们一站式解决安 ...
【NOI P模拟赛】校门外歪脖树上的鸽子（树链剖分）
题面 2 ≤ n ≤ 2 × 1 0 5 , 1 ≤ m ≤ 2 × 1 0 5 , 1 ≤ l ≤ r ≤ n , 1 ≤ d ≤ 1 0 8 2 ≤ n ≤ 2 × 10^5,1 ≤ m ≤ 2 ...

Elasticsearch：理解 mapping 中的 null_value

Elasticsearch：理解 mapping 中的 null_value的更多相关文章

随机推荐

热门专题