elasticsearch 5.x 系列之三 mapping 映射的时候的各个字段的设置

首先看来创建一个mapping 来show show：

curl -XPUT "master:9200/zebra_info?pretty" -H 'Content-Type: application/json' -d'

{

    "settings": {

        "number_of_shards":5,

        "number_of_replicas":1

    },

    "mappings": {

         "zebra_info": {

              "properties": {

                    "name" : {"type": "text", "analyzer": "ik_max_word", "search_analyzer": "ik_max_word", "fielddata": true, "fields": {"raw": {"type":"keyword"}}},

                    "firstly_classification": {"type": "keyword"},

                    "secondary_classification": {"type": "keyword"},

                    "type_name": {"type": "text", "analyzer": "ik_max_word", "search_analyzer": "ik_max_word", "fielddata": true,"fields": {"raw": {"type":"keyword"}}},

                    "province": {"type": "keyword"},

                    "city": {"type": "keyword"},

                    "citycode": {"type": "keyword"},

                    "district": {"type": "keyword"},

                    "adcode": {"type": "keyword"},

                    "township": {"type": "text"},

                    "business_circle": {"type": "text", "analyzer": "ik_max_word", "search_analyzer": "ik_max_word", "fielddata": true,"fields": {"raw": {"type":"keyword"}}},

                    "formatted_address": {"type": "text"},

                    "location": {"type": "geo_point"},

                    "extensions": {

                      "type": "nested",

                      "properties": {

                        "avg_price": {"type": "double"},

                        "shops": {"type":"integer"},

                        "good_comments": {"type":"byte"},

                        "lvl": {"type":"byte"},

                        "other_type": {"type": "text", "analyzer": "ik_max_word", "search_analyzer": "ik_max_word", "fielddata": true,  "fields": {"raw": {"type":"keyword"}}},

                        "numbers": {"type": "integer"}

                       }

                   }

             }

        }

    }

}

'

二、show 看过了，来看一下elasticsearch 支持的数据类型。



1，text:

当一个字段是要被全文搜索的，比如Email内容、产品描述，应该使用text类型。设置text类型以后，字段内容会被分析，在生成倒排索引以前，字符串会被分析器分成一个一个词项。text类型的字段不用于排序，很少用于聚合（termsAggregation除外）。

如果要聚合，请设置成keyword 参照上面的索引，设置一个fielddata。 聚合或者排序的时候用name.raw  进行排序。

"name" : {"type": "text", "analyzer": "ik_max_word", "search_analyzer": "ik_max_word", "fielddata": true, "fields": {"raw": {"type":"keyword"}}}

2，keyword：

keyword类型适用于索引结构化的字段，比如email地址、主机名、状态码和标签。如果字段需要进行过滤(比如查找已发布博客中status属性为published的文章)、排序、聚合。keyword类型的字段只能通过精确值搜索到。

3，数据类型 范围

long	        -2^63至2^63-1

integer	        -2^31至2^31-1

short	        -32,768至32768

byte	        -128至127

double	        64位双精度IEEE 754浮点类型

float	        32位单精度IEEE 754浮点类型

half_float	16位半精度IEEE 754浮点类型

scaled_float	缩放类型的的浮点数（比如价格只需要精确到分，price为57.34的字段缩放因子为100，存起来就是5734）相当于可以定义精确度

用法如下：

PUT my_index

{

  "mappings": {

    "my_type": {

      "properties": {

        "number_of_bytes": {

          "type": "integer"

        },

        "time_in_seconds": {

          "type": "float"

        },

        "price": {

          "type": "scaled_float",

          "scaling_factor": 100

        }

      }

    }

  }

}

4,object 类型 或者说是嵌套类型。定义参见文章标题给出的索引

PUT my_index/my_type/1

{

  "region": "US",

  "manager": {

    "age":     30,

    "name": {

      "first": "John",

      "last":  "Smith"

    }

  }

}

5， 日期类型

支持的格式如下：

日期格式的字符串：e.g. “2015-01-01” or “2015/01/01 12:10:30”.

long类型的毫秒数( milliseconds-since-the-epoch)

integer的秒数(seconds-since-the-epoch)

举栗子如下：

PUT my_index/my_type/1

{ "date": "2015-01-01" }

PUT my_index/my_type/2

{ "date": "2015-01-01T12:10:30Z" }

PUT my_index/my_type/3

{ "date": 1420070400001 }

6，Array类型

ELasticsearch没有专用的数组类型，默认情况下任何字段都可以包含一个或者多个值，但是一个数组中的值要是同一种类型。例如：

字符数组: [ “one”, “two” ]

整型数组：[1,3]

嵌套数组：[1,[2,3]],等价于[1,2,3]

对象数组：[ { “name”: “Mary”, “age”: 12 }, { “name”: “John”, “age”: 10 }]

注意事项：

动态添加数据时，数组的第一个值的类型决定整个数组的类型

混合数组类型是不支持的，比如：[1,”abc”]

数组可以包含null值，空数组[ ]会被当做missing field对待。

7，geo 类型，可以是点，线，或者面（区域）

地理位置信息类型用于存储地理位置信息的经纬度。

8，其他不常用的类型。

range 类型

integer_range	-2^31至2^31-1

float_range	32-bit IEEE 754

long_range	-2^63至2^63-1

double_range	64-bit IEEE 754

date_range	64位整数，毫秒计时

ip 类型，binary 类型，token_count 类型， nested类型类型（特殊的object 类型）

elasticsearch 5.x 系列之三 mapping 映射的时候的各个字段的设置的更多相关文章

Elasticsearch学习系列之mapping映射
什么是映射为了能够把日期字段处理成日期,把数字字段处理成数字,把字符串字段处理成全文本(Full-text)或精确(Exact-value)的字符串值,Elasticsearch需要知道每个字段里面 ...
剖析Elasticsearch集群系列之三：近实时搜索、深层分页问题和搜索相关性权衡之道
转载:http://www.infoq.com/cn/articles/anatomy-of-an-elasticsearch-cluster-part03 近实时搜索虽然Elasticsearch ...
spice在桌面虚拟化中的应用系列之三(USB映射实现,SSL加密,密码认证,多客户端支持)
本系列其它文章 spice在桌面虚拟化中的应用系列之一(spice简介,性能优化等) spice在桌面虚拟化中的应用系列之二(Linux平台spice客户端的编译安装,支持USB映射) 1.spice ...
elasticsearch的mapping映射
Mapping简述 Elasticsearch是一个schema-less的系统,但并不代表no shema,而是会尽量根据JSON源数据的基础类型猜测你想要的字段类型映射.Elasticsearch ...
elasticsearch中的mapping映射配置与查询典型案例
elasticsearch中的mapping映射配置与查询典型案例 elasticsearch中的mapping映射配置示例比如要搭建个中文新闻信息的搜索引擎,新闻有"标题".&q ...
第三百六十四节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mapping映射管理
第三百六十四节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mapping映射管理 1.映射(mapping)介绍映射:创建索引的时候,可以预先定义字 ...
elasticsearch 5.6.4自动创建索引与mapping映射关系 +Java语言
由于业务上的需求 ,最近在研究elasticsearch的相关知识 ,在网上查略了大部分资料 ,基本上对elasticsearch的数据增删改都没有太大问题 ,这里就不做总结了 .但是,在网上始终没 ...
Elasticsearch(八)【NEST高级客户端--Mapping映射】
要使用NEST与Elasticsearch进行交互,我们需要能够将我们的解决方案中的POCO类型映射到存储在Elasticsearch中的反向索引中的JSON文档和字段.本节介绍NEST中可用的所有不 ...
四十三 Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mapping映射管理
1.映射(mapping)介绍映射:创建索引的时候,可以预先定义字段的类型以及相关属性elasticsearch会根据json源数据的基础类型猜测你想要的字段映射,将输入的数据转换成可搜索的索引项, ...

随机推荐

关于httpclient的终结
End of life 关于Commons HttpClient项目现在已经结束,不再开发.它已经被HttpClient和HttpCore模块中的ApacheHttpComponents项目所取代,新 ...
UIRecorder安装与使用
继vue单元测试,将进行vue的e2e测试学习. 学习点: 安装uirecorder 用工具(UI Recorder)录制测试脚本测试脚本的回放本文意在安装UI Recorder,并且利用该工具进 ...
docker-day1-安装和基本使用
Docker 1.什么是docker Docker 是一个开源项目,可以实现轻量级的操作系统虚拟化解决方案. Docker 的基础是 Linux 容器(LXC)等技术.在 LXC 的基础上 Docke ...
深入浅出C/C++中的正则表达式库
写在前面: 本文是面向有正则表达式基础的读者朋友的,如果你还不知道正则表达式是什么,请先到这里学习一下 :http://en.wikipedia.org/wiki/Regular_expressio ...
IOS UIDevice距离传感器（打开关闭）
● 什么是传感器 ● 传感器是一种感应\检测装置, 目前已经广泛应用于智能手机上 ● iPhone5中内置的传感器有 ● 运动传感器\加速度传感器\加速计(Motion/Acceleromet ...
(转)Wireshark基本介绍和学习TCP三次握手
原地址https://www.cnblogs.com/TankXiao/archive/2012/10/10/2711777.html#filter 阅读目录 wireshark介绍 wireshar ...
POJ-3579 Median---二分第k大（二分套二分）
题目链接: https://cn.vjudge.net/problem/POJ-3579 题目大意: 求的是一列数所有相互之间差值的序列的最中间的值是多少. 解题思路: 可以用二分套二分的方法求解第m ...
【[SCOI2007]蜥蜴】
拆点把每个点拆成入口和出口两个点以下几种连边方式就行了对于有蜥蜴的点,$S$向入口连1的边对于能出去的点,出口向汇点连容量为$inf$的边每个点的入口和出口连容量为高度的边之后能相 ...
POJ 2155 Matrix【二维树状数组+YY（区间计数）】
题目链接:http://poj.org/problem?id=2155 Matrix Time Limit: 3000MS Memory Limit: 65536K Total Submissio ...
将 form 参数转换为 json 绑定 datagrid 上
$.fn.serializeJson=function(){ var serializeObj={}; var array=this.serializeArray(); var str=this.se ...

elasticsearch 5.x 系列之三 mapping 映射的时候的各个字段的设置

首先看来创建一个mapping 来show show：

二、show 看过了，来看一下elasticsearch 支持的数据类型。

elasticsearch 5.x 系列之三 mapping 映射的时候的各个字段的设置的更多相关文章

随机推荐

热门专题