ES-使用映射来定义各种文档

每篇文档属于一种类型,而每种类型属于一个索引。从数据的逻辑划分来看,可以认为索引是数据库,而类型是数据库中的表。
类型包含了映射中每个字段的定义。映射包括了该类型的文档中可能出现的所有字段,并告诉ES如何索引一篇文档的多个字段。

类型只提供逻辑上的分离:
在ES中,不同类型的文档没有物理上的分离。在同一个ES索引中的所有文档,无论何种类型,都是存储在属于相同分片的同一组文件中。一份分片就是一个Lucene的索引,类型的名称是Lucene索引中一个字段。所有映射的所有字段都是Lucene索引中的字段。
类型的概念是针对ES的一层抽象,但不属于Lucene。可以轻松地在同一个索引中拥有不同类型的文档。ES负责分离这些文档,在某个类型中搜索时,ES会过滤出属于哪个类型的文档。
当多个类型中出现同样的字段名称时,两个同名的字段应该有同样的设置。否则,ES将很难分辨查询时指的是两个字段中的哪一个。两个字段都是属于同一个Lucene索引。

group(分组)和event(活动)存储在不同的类型中。ES允许在一个类型、多个类型中搜索。

1. 检索和定义映射

1.1获取目前的映射

为了查看某个字段类型当前的映射,向该类型URL的_mapping接口发送一个HTTP GET请求

FengZhendeMacBook-Pro:bin FengZhen$ curl 'localhost:9200/music/singer/_mapping?pretty'
{
"music" : {
"mappings" : {
"singer" : {
"properties" : {
"level" : {
"type" : "string"
},
"name" : {
"type" : "string"
}
}
}
}
}
}

新建一个专辑类型album,并索引一篇新文档

FengZhendeMacBook-Pro:bin FengZhen$ curl -XPUT 'localhost:9200/music/album/1' -d '{
> "name":"八度空间",
> "date":"2003-10-25T19:00"
> }'

获取当前类型映射

FengZhendeMacBook-Pro:bin FengZhen$ curl 'localhost:9200/music/album/_mapping?pretty'
{
"music" : {
"mappings" : {
"album" : {
"properties" : {
"date" : {
"type" : "date",
"format" : "strict_date_optional_time||epoch_millis"
},
"name" : {
"type" : "string"
}
}
}
}
}
}

可看到date字段自动识别为日期类型

1.2定义新的映射

在索引music的album类型中,新增一个字段映射singer,类型为string

FengZhendeMacBook-Pro:bin FengZhen$ CURL -XPUT 'localhost:9200/music/_mapping/album' -d '{
> "album":{
> "properties":{
> "singer":{
> "type":"string"
> }
> }
> }
> }'

查看album的映射

FengZhendeMacBook-Pro:bin FengZhen$ curl 'localhost:9200/music/album/_mapping?pretty'
{
"music" : {
"mappings" : {
"album" : {
"properties" : {
"date" : {
"type" : "date",
"format" : "strict_date_optional_time||epoch_millis"
},
"name" : {
"type" : "string"
},
"singer" : {
"type" : "string"
}
}
}
}
}
}

2.扩展现有的映射

如果在现有的基础上再设置一个映射,ES会将两者合并。如上述映射,包含两个来自初始映射的字段,外加定义的一个新字段。随着新字段的加入,初始的映射被扩展了,在任何时候都可以进行这样的操作,ES将次称为现有映射和先前提供的映射的合并。
但是,并非所有的合并都是奏效的,例如:无法改变现有字段的数据类型,而且通常无法改变一个字段被索引的方式。
试图改变singer类型为long,操作会失败并抛出异常

FengZhendeMacBook-Pro:bin FengZhen$ CURL -XPUT 'localhost:9200/music/_mapping/album?pretty' -d '{
> "album":{
> "properties":{
> "singer":{
> "type":"long"
> }
> }
> }
> }' {
"error" : {
"root_cause" : [ {
"type" : "illegal_argument_exception",
"reason" : "mapper [singer] of different type, current_type [string], merged_type [long]"
} ],
"type" : "illegal_argument_exception",
"reason" : "mapper [singer] of different type, current_type [string], merged_type [long]"
},
"status" :
}

避免这个错误唯一的方法是重新索引album里的所有数据,步骤如下
(1) 将album类型里的所有数据删除。
(2) 设置新的映射
(3) 再次索引所有的数据

Elasticsearch-使用映射来定义各种文档的更多相关文章

  1. Elasticsearch配置详解、文档元数据

    目录 返回目录:http://www.cnblogs.com/hanyinglong/p/5464604.html 1.Elasticsearch配置文件详解 a. 在上面博客中,我们已经安装并且成功 ...

  2. ElasticSearch 学习记录之 分布式文档存储往ES中存数据和取数据的原理

    分布式文档存储 ES分布式特性 屏蔽了分布式系统的复杂性 集群内的原理 垂直扩容和水平扩容 真正的扩容能力是来自于水平扩容–为集群添加更多的节点,并且将负载压力和稳定性分散到这些节点中 ES集群特点 ...

  3. ElasticSearch权威指南学习(文档)

    什么是文档 在Elasticsearch中,文档(document)这个术语有着特殊含义.它特指最顶层结构或者根对象(root object)序列化成的JSON数据(以唯一ID标识并存储于Elasti ...

  4. ES入门三部曲:索引操作,映射操作,文档操作

    ES入门三部曲:索引操作,映射操作,文档操作 一.索引操作 1.创建索引库 #语法 PUT /索引名称 { "settings": { "属性名": " ...

  5. ElasticSearch查询 第二篇:文档更新

    <ElasticSearch查询>目录导航: ElasticSearch查询 第一篇:搜索API ElasticSearch查询 第二篇:文档更新 ElasticSearch查询 第三篇: ...

  6. ElasticSearch(二):文档的基本CRUD与批量操作

    ElasticSearch(二):文档的基本CRUD与批量操作 学习课程链接<Elasticsearch核心技术与实战> Create 文档 支持自动生成文档_id和指定文档_id两种方式 ...

  7. Es图形化软件使用之ElasticSearch-head、Kibana,Elasticsearch之-倒排索引操作、映射管理、文档增删改查

    今日内容概要 ElasticSearch之-ElasticSearch-head ElasticSearch之-安装Kibana Elasticsearch之-倒排索引 Elasticsearch之- ...

  8. ElasticSearch 5学习(8)——分布式文档存储(wait_for_active_shards新参数分析)

    学完ES分布式集群的工作原理以及一些基本的将数据放入索引然后检索它们的所有方法,我们可以继续学习在分布式系统中,每个分片的文档是被如何索引和查询的. 路由 首先,我们需要明白,文档和分片之间是如何匹配 ...

  9. Elasticsearch简介、倒排索引、文档基本操作、分词器

    lucene.Solr.Elasticsearch 1.倒排序索引 2.Lucene是类库 3.solr基于lucene 4.ES基于lucene 一.Elasticsearch 核心术语 特点: 1 ...

随机推荐

  1. python selenium 笔记

    1.安装环境  下载python 3.6.4 第一页把最下面的环境变量勾上.第二页把 all user  勾上  直接安装到下一步 安装完成之后 cmd直接输入python  可以看到版本 2.安装  ...

  2. @ApiParam和@RequestHeader接收参数的区别

    一.代码 @ApiOperation(value = "查询学生信息") @GetMapping(value = "/select/student") @Api ...

  3. Release和Debug的区别

    Debug与Release版本的区别 Debug 和 Release 并没有本质的区别,他们只是VC预定义提供的两组编译选项的集合,编译器只是按照预定的选项行动.如果我们愿意,我们完全可以把Debug ...

  4. 如何将 GitHub 中的项目导入到 stackblitz.com 中

    如何将一个 GitHub 中的项目导入到 stackblitz.com 中,然后开始编辑和编译呢? 例如,我们有一个项目在 GitHub 中的地址为:https://github.com/cwiki- ...

  5. HNOI2010 平面图判定(planar)

    题目链接:戳我 我怎么知道平面图有这个性质?? 对于一个平面图,它的边数不超过点数的\(3n-6\) 所以可以直接把边数多的特判掉,剩下的图中边数和点数就是一个数量级的了. 因为这个图存在欧拉回路,所 ...

  6. (Java多线程系列五)守护线程

    守护线程 什么是守护线程 Java中有两种线程,一种是用户线程,一种是守护线程. 当进程不存在或主线程停止,守护线程也会自动停止. class DaemonThread extends Thread ...

  7. XSS中的同源和跨域的问题

    学习自https://www.cnblogs.com/-qing-/p/10966047.html 也谈谈同源策略和跨域问题 1 同源策略 所谓同源策略,指的是浏览器对不同源的脚本或者文本的访问方式进 ...

  8. (转)php中字符过滤

    有时候为了安全起见,我们需要对用户输入的字符串进行转义       文章中有不正确的或者说辞不清的地方,麻烦大家指出了--- 与PHP字符串转义相关的配置和函数如下: 1.magic_quotes_r ...

  9. lyf基础作业

    include <stdio.h> include <stdlib.h> int main (void) { FILE * fp; int a[10]; int max=0; ...

  10. Golang协程实现流量统计系统(1)

    # 学习内容: # 学习目标: 学习Golang的基础开发 常用的Golang编程技艺 精巧省力的Go Lib 协程的真实应用实践 与其他语言对比着学 协程并发模型的深度应用 Growth hacki ...