数据分布

1、MySQL Cluster自动分区数据表(也可能使用用户自定义分区),将数据分布到分区中;

2、一个数据表被划分到多个Data Node分区中,数据在分区中被”striped”;

3、主键的 hashing 决定哪个分区拥有数据(自动分布);

4、对主键的一部分进行hashing也是可能的(适合sharding和数据局部性);

分区和数据分布

1、如果有两个数据节点(DATA NODE 1和DATA NODE 2),每个数据表都被分到两个分区中。

2、subid是主键,对主键subid进行的hashing决定分区。当然对主键的一分部分(part of PK)进行hashing也是可能的。

  • -奇数主键(绿色部分)
  • -偶数主键(红色部分)

副本(Replicas)

1、为了提供冗余和快速故障转移,分区之间是同步复制的;

2、最常用的是用两个副本(两份数据):

  • - 使用1个,2个,3个,4个副本也都是可能的
  • - NoOfReplicas=2

3、分区间的同步复制是从主分区(PRIMARY)到辅助分区(SECONDARY)

  • - 当有一个变更(下图实体圆心表示变更)发生在P0的时候,它将同步复制到S0
  • - 这个变更在事务commit的时候被持久化
  • - P0或S0将被更新,或什么都不做

数据分布 – 磁盘日志记录(disk logging)

1、数据在commit之后会在主内存中(main memory)

(1).但是改变(changes)是REDO日志记录的(REDO LOGGED),而REDO日志是每N毫秒(推荐1000ms)刷新到磁盘

由TimeBetweenGlobalCheckpoints参数控制
  类似innodb-flush-log-at-trx_commit=2

(2).数据同时被checkpoint到磁盘

2、磁盘日志记录使得恢复一个完全失败的cluster成为可能

节点组(Node groups)

1、共享同样数据的节点属于同一个节点组

2、一个节点组包含节点数等于副本数。(下图使用NoOfReplicas=2)

3、两个副本-四个数据节点

(1).四个数据节点-四个分区-两个副本

(2).四个节点和两个副本–>两个节点组

- 节点组数目 = 总节点数 / 副本数

4、三个副本-三个数据节点

(1).三个数据节点-三个分区

- 更多的副本,“写”更慢

(2).三个节点和三个副本–>一个节点组(这种方式不常用)

- 两个副本是惯例

5、副本使用建议

(1).推荐使用两个副本- 性能和可用性是最好的折衷

(2).三个或四个副本写比较慢,使用这种方式部署相对更少

(3).“写”成本

- 1个副本(没冗余): cost X

- 2个副本: cost 2X

- 三个副本: cost 3X

验证数据分布

用法:

ndb_desc -c connect_string tbl_name -d db_name [-p]

mysql> select * from ndbtest.tbl;
+---+
| a |
+---+
| 3 |
| 6 |
| 5 |
| 1 |
| 2 |
| 4 |
+---+
6 rows in set (0.01 sec) mysql>

参考:

http://www.zrwm.com/?p=3210

MySQL Cluster 数据分布(分区、分组)的更多相关文章

  1. MySQL Cluster配置概述

    一.     MySQL Cluster概述 MySQL Cluster 是一种技术,该技术允许在无共享的系统中部署“内存中”数据库的 Cluster .通过无共享体系结构,系统能够使用廉价的硬件,而 ...

  2. MySQL的表分区详解

    这篇文章主要介绍了MySQL的表分区,例如什么是表分区.为什么要对表进行分区.表分区的4种类型详解等,需要的朋友可以参考下 一.什么是表分区通俗地讲表分区是将一大表,根据条件分割成若干个小表.mysq ...

  3. MySQL的表分区(转载)

    MySQL的表分区(转载) 一.什么是表分区 通俗地讲表分区是将一大表,根据条件分割成若干个小表.mysql5.1开始支持数据表分区了. 如:某用户表的记录超过了600万条,那么就可以根据入库日期将表 ...

  4. mysql数据库表分区详解(数量过大的数据库表通过分区提高查询速度)

    这篇文章主要介绍了MySQL的表分区,例如什么是表分区.为什么要对表进行分区.表分区的4种类型详解等,需要的朋友可以参考下 一.什么是表分区通俗地讲表分区是将一大表,根据条件分割成若干个小表.mysq ...

  5. mysql中的分区

    第18章:分区 目录 18.1. MySQL中的分区概述 18.2. 分区类型 18.2.1. RANGE分区 18.2.2. LIST分区 18.2.3. HASH分区 18.2.4. KEY分区 ...

  6. MySQL Cluster 与 MongoDB 复制群集分片设计及原理

    分布式数据库计算涉及到分布式事务.数据分布.数据收敛计算等等要求 分布式数据库能实现高安全.高性能.高可用等特征,当然也带来了高成本(固定成本及运营成本),我们通过MongoDB及MySQL Clus ...

  7. mysql集群 MySQL Cluster

    <?php /* 郑重说明2015年6月11日16:28:14,目前为止MySQL Cluster 社区版不支持INNODB,商业版支持,但是授权价格20W左右,so看此文档之前,考虑下钱 My ...

  8. [置顶] MySQL Cluster初步学习资料整理--安装部署新特性性能测试等

    1.1 mysql-cluster简介 简单的说,MySQLCluster实际上是在无共享存储设备的情况下实现的一种完全分布式数据库系统,其主要通过NDBCluster(简称NDB)存储引擎来实现. ...

  9. MySQL Cluster

    MySQL Cluster MySQL集群一个非共享(shared nothing).分布式.分区系统,使用同步复制机制提供高可用和高性能. MySQL集群使用的是NDB引擎.NDB存储引擎会在节点间 ...

随机推荐

  1. NYOJ 451

    光棍节的快乐 描述 光棍们,今天是光棍节.聪明的NS想到了一个活动来丰富这个光棍节. 规则如下: 每个光棍在一个纸条上写一个自己心仪女生的名字,然后把这些纸条装进一个盒子里,这些光 棍依次抽取一张纸条 ...

  2. Spring---BeanFactory

    Spring---BeanFactory   BeanFactroy是一个Spring容器,用于创建,配置,管理bean,bean之间的依赖关系也有BeanFactory负责维护: BeanFacto ...

  3. 关于SSH的一些tricks

    改善SSH登录速度 登录慢的原因有很多, 慢的症状也很多, 有些是出login慢, 有些是出password慢, 有些是输入完password后进提示符慢, 根据 http://superuser.c ...

  4. SQL Server2008从入门到全面精通 SQL数据库视频教程

    第1章 SQL Server 2008入门知识:1.SQL SERVER 2008简介2.数据库概念3.关系数据库4.范式5.E-R模型6.SQL Server 2008体系结构7.安装IIS服务8. ...

  5. 如何使iframe透明

    <html> <head> <meta http-equiv="Content-Type" content="text/html; char ...

  6. Exception Handling引入MVP

    异常处理(Exception Handling)是所有系统的最基本的基础操作之一,其它的比如日志(Logging).审核(Auditing).缓存(Caching).事务处理(Transaction) ...

  7. CRC32算法

    unsigned ] = { 0x00000000, 0x77073096, 0xEE0E612C, 0x990951BA, 0x076DC419, 0x706AF48F, 0xE963A535, 0 ...

  8. SOA总结(图片打开略慢请知晓)

  9. Dirac Delta Function

    也称为Degenerate pdf, 退化概率密度函数. 未经考证的解释是: 当正态分布的\(\sigma \to 0\)时, 正态分布就退化为这个分布了. 定义 \[ \delta(x) = \be ...

  10. 关于GeoWebCache的部署说明

    最近因为工作需要学习了GeoWebCache,有了一些实战经验跟大家分享一下. 废话不多说,直接上问题! 1.切片的缓存问题 当地图服务(这里默认指WMS)的数据更新时,GeoWebCache的切片如 ...