ES的索引、type、document、filer、mapping、id

一、ES的存储结构

1、索引

es 中存储数据的基本单位，比如说你现在要在 es 中存储一些订单数据，你就应该在 es 中创建一个索引 order_idx，所有的订单数据就都写到这个索引里面去。看了一些文章有的说索引可以理解为关系型数据库中的数据库，有的说相当于数据库中的表。我的理解是它相对于关系型数据库更为灵活，因为在7.0之后的版本，type被废除，它直接可以自定义，感觉就就是直接添加到属性中，而不是原来的在索引之后添加type，所以在添加数据时就可以更加灵活，所以我认为一个索引可以理解为一个数据库。

2、type

7.0之前的写法：

PUT twitter

{

  "mappings": {

    "user": {

      "properties": {

        "name": { "type": "text" },

        "user_name": { "type": "keyword" },

        "email": { "type": "keyword" }

      }

    },

    "tweet": {

      "properties": {

        "content": { "type": "text" },

        "user_name": { "type": "keyword" },

        "tweeted_at": { "type": "date" }

      }

    }

  }

}

PUT twitter/user/kimchy

{

  "name": "Shay Banon",

  "user_name": "kimchy",

  "email": "shay@kimchy.com"

}

PUT twitter/tweet/1

{

  "user_name": "kimchy",

  "tweeted_at": "2017-10-24T09:00:00Z",

  "content": "Types are going away"

}

GET twitter/tweet/_search

{

  "query": {

    "match": {

      "user_name": "kimchy"

    }

  }

}

在程序中可以很清楚的看到构架，tweet和user都是type，可以理解为索引的下个级别，可以理解为一张表，put 索引/type/id 添加一条数据（document），数据中的字段就是filed。

7.0之后：

PUT twitter

{

  "mappings": {

    "_doc": {

      "properties": {

        "type": { "type": "keyword" }, (1)

        "name": { "type": "text" },

        "user_name": { "type": "keyword" },

        "email": { "type": "keyword" },

        "content": { "type": "text" },

        "tweeted_at": { "type": "date" }

      }

    }

  }

}

PUT twitter/_doc/user-kimchy

{

  "type": "user", (1)

  "name": "Shay Banon",

  "user_name": "kimchy",

  "email": "shay@kimchy.com"

}

PUT twitter/_doc/tweet-1

{

  "type": "tweet", (1)

  "user_name": "kimchy",

  "tweeted_at": "2017-10-24T09:00:00Z",

  "content": "Types are going away"

}

GET twitter/_search

{

  "query": {

    "bool": {

      "must": {

        "match": {

          "user_name": "kimchy"

        }

      },

      "filter": {

        "match": {

          "type": "tweet" (1)

        }

      }

    }

  }

}

从官方解释中能够看出，之前type没有了，取而代之的是_doc，我是这么理解的，之前可以建立很多type，相当于可以减很多表，数据可以添加。现在只有一张_doc表格，表格多了type属性，可以添加type属性的内容加以区分。

图片理解：

3、document

相当于一条数据。

4、filed

相当于一条数据中的一个字段的内容。

5、mapping

Mapping 来定义每个字段的类型。比如诗题、作者、朝代都是 Keyword 类型，诗内容是 Text 类型，而字数是 Integer 类型，最后就是把数据组织成 Json 格式存放进去了。keyword和text都是字符成类型，它们有什么区别呢？

这涉及到分词的问题，Keyword 类型是不会分词的，直接根据字符串内容建立反向索引，Text 类型在存入 Elasticsearch 的时候，会先分词，然后根据分词后的内容建立反向索引。

6、id

再添加数据时需要添加id。

　　a、可以自己添加id

　　b、不添加，系统会自动配置id

二、为什么要取消type呢？

最初，我们讨论了索引“类似于数据库”和type“相当于表”。严格来说，这是一个错误的类比，导致了错误的假设。在SQL数据库中，表是相互独立的。

一个表中的列与另一个表中具有相同名称的列没有关系。这与映射类型中的字段不同。在Elasticsearch索引中，不同映射类型中具有相同名称的字段在内部由相同的Lucene字段支持。换句话说，使用上面的示例，user类型中的user_name字段存储在与tweet类型中的user_name字段完全相同的字段中，而且两个user_name字段在这两种类型中必须具有相同的映射(定义)。例如，当您想要删除一个类型中的日期字段和同一个索引中的另一个类型中的布尔字段时，这可能会导致失败。

最重要的是，存储在同一索引中具有很少或没有共同字段的不同实体会导致数据稀疏，并影响Lucene有效压缩文档的能力。

ES的索引、type、document、filer、mapping、id的更多相关文章

Es创建索引、设置和修改Mapping
Http接口操作示例如下: 1.创建索引: 2.删除索引: 3.创建mapping: 4.查看mapping:
ES 11 - 配置Elasticsearch的映射 (mapping)
目录 1 映射的相关概念 1.1 什么是映射 1.2 映射的组成 1.3 元字段 1.4 字段的类型 2 如何配置mapping 2.1 创建mapping 2.2 更新mapping 2.3 查看m ...
es第二篇：Document APIs
文档CRUD API分为单文档API和多文档API.这些API的索引名参数既可以是一个真正的索引的名称,也可以是某个索引的别名alias. 单文档API有:Index API.Get API.Dele ...
es创建索引的格式，并初始化数据
es创建索引的格式,并初始化数据学习了:https://www.imooc.com/video/15759 1, 创建格式 POST 127.0.0.1:9200/book/novel/_mappi ...
63.es中的type数据类型
主要知识点理解es中的type数据类型一.type的理解 type是一个index中用来区分类似的数据的,但是可能有不同的fields,而且有不同的属性来控制索引建立.分词器.field的 ...
为何在查询中索引未被使用 (Doc ID 1549181.1)
To Bottom * 为何在查询中索引未被使用 (Doc ID 1549181.1) To Bottom 文档内容用途排错步骤高速检查表上是否存在索引? 索引是否应该 ...
ES 服务器索引、类型仓库基类 BaseESStorage
/******************************************************* * * 作者:朱皖苏 * 创建日期:20180508 * 说明:此文件只包含一个类,具 ...
all index range ref eq_ref const system 索引type说明
背景知识在使用sql的过程中经常需要建立索引,而每种索引是怎么处罚的又是怎么起到作用的,首先必须知道索引和索引的类型. 索引类型type 我们可以清楚的看到type那一栏有index ALL eq_ ...
ES正在弱化type这个概念
百度Elasticsearch-产品描述-介绍-百度云 https://cloud.baidu.com/doc/BES/System.html#.E5.9F.BA.E6.9C.AC.E6.A6.82. ...

随机推荐

java @Value注解和 @Data注解
@Value注解 service层代码 @Service public class HelloServiceImpl implements HelloService { @Autowired priv ...
C++入门经典-例3.4-根据成绩划分等级
1:代码如下: // 3.4.cpp : 定义控制台应用程序的入口点. // #include "stdafx.h" #include <iostream> using ...
linux如何查看所有的用户和组信息(转载)
[步骤一]cat /etc/passwdcat /etc/passwd查看所有的用户信息,详情如下图 [步骤二]cat /etc/passwd|grep 用户名 cat /etc/passwd|gre ...
使用stringstream代替sprintf和sscanf
C++里面的字符串格式话之前一直是用的sprintf和sscanf 比较麻烦的是要申请一个字符数组然后在调用用stringstream就比较完美 int main(int narg,char** ...
leetcode-easy-trees-108. Convert Sorted Array to Binary Search Tree
mycode 81.75 # Definition for a binary tree node. # class TreeNode(object): # def __init__(self, x) ...
leetcode-easy-string- 8 String to Integer (atoi)
mycode 98.26% 易错点: while循环式,and判断的地方先判断下标会不会超出范围 class Solution(object): def myAtoi(self, str): &qu ...
Appium测试框架
介绍读作['æpɪəm],是selenium的扩展,同样基于WebDriver协议,详见:http://appium.io/. 关于WebDriver终端操作,详见:https://www.w3.o ...
4. 获取当前的文件夹的路径，以及当前文件名的路径 os.path.realpath
使用os.path.realpath(__file__) 获得当前的文件夹的路径名, 使用os.path.split 进行路径切割 import os src, _= os.path.split(os ...
Ajax中Put和Delete请求传递参数无效的解决方法（Restful风格）
本文装载自:http://blog.csdn.net/u012737182/article/details/52831008 感谢原文作者分享开发环境:Tomcat9.0 在使用Ajax实现R ...
CentOS7环境下yum方式安装MySQL5.7
这篇博文主要是从网上摘抄的,做个记录,以后如果有同样的需求,可以直接翻自己的记录.感谢两位大神: https://www.cnblogs.com/luohanguo/p/9045391.html ht ...

ES的索引、type、document、filer、mapping、id

ES的索引、type、document、filer、mapping、id的更多相关文章

随机推荐

热门专题