[ES]elasticsearch章4　ES的META们

在介绍Meta更新流程前，我们先介绍一下ES中Meta的组成、存储方式和恢复方式。

1. Meta：ClusterState、MetaData、IndexMetaData

Meta是用来描述数据的数据。在ES中，Index的mapping结构、配置、持久化状态等就属于meta数据，集群的一些配置信息也属于meta。这类meta数据非常重要，假如记录某个index的meta数据丢失了，那么集群就认为这个index不再存在了。ES中的meta数据只能由master进行更新，master相当于是集群的大脑。

ClusterState

集群中的每个节点都会在内存中维护一个当前的ClusterState，表示当前集群的各种状态。ClusterState中包含一个MetaData的结构，MetaData中存储的内容更符合meta的特征，而且需要持久化的信息都在MetaData中，此外的一些变量可以认为是一些临时状态，是集群运行中动态构建出来的。

ClusterState内容包括：

    long version: 当前版本号，每次更新加1

    String stateUUID：该state对应的唯一id

    RoutingTable routingTable：所有index的路由表

    DiscoveryNodes nodes：当前集群节点

    MetaData metaData：集群的meta数据

    ClusterBlocks blocks：用于屏蔽某些操作

    ImmutableOpenMap<String, Custom> customs: 自定义配置

    ClusterName clusterName：集群名

MetaData

上面提到，MetaData更符合meta的特征，而且需要持久化，那么我们看下这个MetaData中主要包含哪些东西：

MetaData中需要持久化的包括：

    String clusterUUID：集群的唯一id。

    long version：当前版本号，每次更新加1

    Settings persistentSettings：持久化的集群设置

    ImmutableOpenMap<String, IndexMetaData> indices: 所有Index的Meta

    ImmutableOpenMap<String, IndexTemplateMetaData> templates：所有模版的Meta

    ImmutableOpenMap<String, Custom> customs: 自定义配置

我们看到，MetaData主要是集群的一些配置，集群所有Index的Meta，所有Template的Meta。下面我们再分析一下IndexMetaData，后面还会讲到，虽然IndexMetaData也是MetaData的一部分，但是存储上却是分开存储的。

IndexMetaData

IndexMetaData指具体某个Index的Meta，比如这个Index的shard数，replica数，mappings等。

IndexMetaData中需要持久化的包括：

    long version：当前版本号，每次更新加1。

    int routingNumShards: 用于routing的shard数, 只能是该Index的numberOfShards的倍数，用于split。

    State state: Index的状态, 是个enum，值是OPEN或CLOSE。

    Settings settings：numbersOfShards，numbersOfRepilicas等配置。

    ImmutableOpenMap<String, MappingMetaData> mappings：Index的mapping

    ImmutableOpenMap<String, Custom> customs：自定义配置。

    ImmutableOpenMap<String, AliasMetaData> aliases： 别名

    long[] primaryTerms：primaryTerm在每次Shard切换Primary时加1，用于保序。

    ImmutableOpenIntMap<Set<String>> inSyncAllocationIds：处于InSync状态的AllocationId，用于保证数据一致性，下一篇文章会介绍。

2. Meta的存储

首先，在启动ES的一个节点时，会配置一个data目录，例如下面这个目录。该节点只有一个单shard的Index。

$tree

.

`-- nodes

    `-- 0

        |-- _state

        |   |-- global-1.st

        |   `-- node-0.st

        |-- indices

        |   `-- 2Scrm6nuQOOxUN2ewtrNJw

        |       |-- 0

        |       |   |-- _state

        |       |   |   `-- state-0.st

        |       |   |-- index

        |       |   |   |-- segments_1

        |       |   |   `-- write.lock

        |       |   `-- translog

        |       |       |-- translog-1.tlog

        |       |       `-- translog.ckp

        |       `-- _state

        |           `-- state-2.st

        `-- node.lock

我们看到，ES进程会把Meta和Data都写入这个目录中，其中目录名为_state的代表该目录存储的是meta文件，根据文件层级的不同，共有3种meta的存储：

nodes/0/_state/:

这层目录在节点级别，该目录下的global-1.st文件存储的是上文介绍的MetaData中除去IndexMetaData的部分，即一些集群级别的配置和templates。node-0.st中存储的是NodeId。

nodes/0/indices/2Scrm6nuQOOxUN2ewtrNJw/_state/:

这层目录在index级别，2Scrm6nuQOOxUN2ewtrNJw是IndexId，该目录下的state-2.st文件存储的是上文介绍的IndexMetaData。

nodes/0/indices/2Scrm6nuQOOxUN2ewtrNJw/0/_state/:

这层目录在shard级别，该目录下的state-0.st存储的是ShardStateMetaData，包含是否是primary和allocationId等信息。ShardStateMetaData是在IndexShard模块中管理，与其他Meta关联不大，本文不做过多介绍。

可以看到，集群相关的MetaData和Index的MetaData是在不同的目录中存储的。另外，集群相关的Meta会在所有的MasterNode和DataNode上存储，而Index的Meta会在所有的MasterNode和存储了该Index数据的DataNode上存储。

这里有个问题是，MetaData是由Master管理的，为什么DataNode上也要保存MetaData呢？主要原因是考虑到数据的安全性，很多用户没有考虑Master节点的高可用和数据高可靠，在部署ES集群时只配置了一个MasterNode，如果这个节点不可用，就会出现Meta丢失，后果非常严重。

3. Meta的恢复

假设ES集群重启了，那么所有进程都没有了之前的Meta信息，需要有一个角色来恢复Meta，这个角色就是Master。所以ES集群需要先进行Master选举，选出Master后，才会进行故障恢复。

当Master选举出来后，Master进程还会等待一些条件，比如集群当前的节点数大于某个数目等，这是避免有些DataNode还没有连上来，造成不必要的数据恢复等。

当Master进程决定进行恢复Meta时，它会向集群中的MasterNode和DataNode请求其机器上的MetaData。对于集群的Meta，选择其中version最大的版本。对于每个Index的Meta，也选择其中最大的版本。然后将集群的Meta和每个Index的Meta再组合起来，构成当前的最新Meta。