组建MySQL集群的几种方案

组建MySQL集群的几种方案
LVS+Keepalived+MySQL（有脑裂问题？但似乎很多人推荐这个）
DRBD+Heartbeat+MySQL（有一台机器空余？Heartbeat切换时间较长？有脑裂问题？）
MySQL Proxy（不够成熟与稳定？使用了Lua？是不是用了他做分表则可以不用更改客户端逻辑？）
MySQL Cluster （社区版不支持INNODB引擎？商用案例不足？）
MySQL + MHA （如果配上异步复制，似乎是不错的选择，又和问题？）
MySQL + MMM （似乎反映有很多问题，未实践过，谁能给个说法）

回答：

不管哪种方案都是有其场景限制或说规模限制，以及优缺点的。

1. 首先反对大家做读写分离，关于这方面的原因解释太多次数（增加技术复杂度、可能导致读到落后的数据等），只说一点：99.8%的业务场景没有必要做读写分离，只要做好数据库设计优化和配置合适正确的主机即可。

2.Keepalived+MySQL --确实有脑裂的问题，还无法做到准确判断mysqld是否HANG的情况；

3.DRBD+Heartbeat+MySQL --同样有脑裂的问题，还无法做到准确判断mysqld是否HANG的情况，且DRDB是不需要的，增加反而会出问题；

3.MySQL Proxy -- 不错的项目，可惜官方半途夭折了，不建议用，无法高可用，是一个写分离；

4.MySQL Cluster -- 社区版本不支持NDB是错误的言论，商用案例确实不多，主要是跟其业务场景要求有关系、这几年发展有点乱不过现在已经上正规了、对网络要求高；

5.MySQL + MHA -- 可以解决脑裂的问题，需要的IP多，小集群是可以的，但是管理大的就麻烦，其次MySQL + MMM 的话且坑很多，有MHA就没必要采用MMM

建议：
1.若是双主复制的模式，不用做数据拆分，那么就可以选择MHA或 Keepalive 或 heartbeat
2.若是双主复制，还做了数据的拆分，则可以考虑采用Cobar；
3.若是双主复制+Slave，还做了数据的拆分，需要读写分类，可以考虑Amoeba；

上述所有的内容都要依据公司内部的业务场景、数据量、访问量、并发量、高可用的要求、DBA人群的数量等综合权衡，若是需要可以联系我：jinguanding#http://hotpu.cn

有很多架构师,还是比较推崇使用基于DRBD架构的.　

如果是基于复制的 shared-nothing 架构，不做读写分离，多节点同时写入，必定会冲突啊！

是不是笔误呢？题主问题是MySQL Cluster 社区版本不支持InnoDB引擎，不是NDB，NDB引擎当然会支持了。

题主对mysq的高可用及集群方式了解比较充分。应该说按照实际商用的场景来设计数据库集群架构，这样才是合理的。如果你追求完美的高可用，避免任何的单点故障，可以在主从、主主同步的基础上配合keepalived或是heartbeat，这两者做故障切换都很好用。高性能上，与其指望一套数据库后端服务搞定所有业务，不如考虑不同业务的在不同服务器资源上的sharding，但其管理复杂度必定会增加，看你怎么权衡管理性和性能方面。关于可扩展性，mysql代理（如阿里的amoeba）+mysql一主多从可以考虑。总之没有最好的方案，只有最合适的！

作者：jhh
链接：https://www.zhihu.com/question/21307639/answer/123316479
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

先介绍几种方案

主从复制，包括一拖一的主从和一拖多的主从

高可用性：比较高

高可扩展性：无

高一致性：比较高

延迟性：比较小

并发性：无

事务性：无

吞吐率：比较高

数据丢失：不丢失

可切换：可以切换

环形复制,包括两个节点和多个节点形成的环形

高可用性：比较高

高可扩展性：无

高一致性：比较高

延迟性：比较小

并发性：无

事务性：无

吞吐率：比较高

数据丢失：不丢失

可切换：可以切换

2PC：

高可用性：很高

高可扩展性：可扩展，不能大规模扩展，也无需大规模扩展

高一致性：比较高

延迟性：比较大

并发性：比较小

事务性：有

吞吐率：比较小

数据丢失：不丢失

可切换：无关

Paxos：元数据的高可用，并发度不高

高可用性：很高

高可扩展性：无关可扩展，不能大规模扩展，也无需大规模扩展

高一致性：很高

延迟性：比较大

并发性：比较小

事务性：有

吞吐率：比较小

数据丢失：不丢失

可切换：无关

以上纯属个人理解，如有异议，也是没问题的；

另外按照master是否服务具体业务来分分布式可以分为两类：

master管理系统，并且所有请求通过master，很明显master存在性能瓶颈
master管理系统，实际请求不通过master，请求分散均匀了

肯定选方案2

基于这些方案的特点，如何设计一个牛逼滴分布式系统？

这里的牛逼包括

可大规模扩展：要求像hadoop那样，至少几百条台没问题
高可用：master需要高可用，节点也需要高可用，也就是说任何一个组件的一个实例或者部分实例挂了，都不会影响整个系统
高并发：普通机器单节点至少要支持几千的并发度吧，如果扩展解决了，整个系统的并发其实也扩展的
数据一致性:分布式系统，一致性可难了，尽量保证吧，比如主从同步实现一致，或者使用两阶段2pc同时写多个节点，或者使用像paxos一致性协议算法实现哈
事务性：分布式系统，绝对的事务很难吧，哎，我们就用2pc，3pc吧，尽量保证哈
自动切换：首先你得想自动切换的条件如何呢？比如主从同步，主挂了，我可以自动切换到从，可是如果从数据和主不同步，但是业务要求很高，不允许这种情况出现，那也只好停服维护啦。

好了你可以开始喷了，怎么可能。

paxos一致性协议，可用性很高，一致性很高，事务性很不错，那么涉及到各种服务都可以用他，非常好。

master和metadata元数据采用paxos一致性协议，所有节点也采用paxos一致性协议，客户端保持这些信息。架构如下所示，master, metadata, node 都实现了paxos协议，也即通过paxos接口访问

&lt;img src="https://pic3.zhimg.com/50/v2-a937e63906ed893b25f1f8bc8ac3350a_hd.png" data-rawwidth="897" data-rawheight="488" class="origin_image zh-lightbox-thumb" width="897" data-original="https://pic3.zhimg.com/v2-a937e63906ed893b25f1f8bc8ac3350a_r.png"&gt;

分布式数据库就是一个例子，貌似目前流行的数据库都还没有支持paxos协议的，有谁可以开发下。节点采用paxos的话，有个问题没想清楚，paxos如何sql结合使用？另外节点的性能会受一点影响。降低一点要求吧，节点采用主主复制，或者环形复制吧。master检查节点存活，并且做切换，通知客户端。

架构如下所示，master, metadata,实现了paxos协议，也即通过paxos接口访问;node的各个节点是复制关系，服务节点挂掉的时候，需要master检测，并且做切换处理。

如果是分布式系统，比如文件系统，或者自己开发的系统，那节点可以考虑用paxos协议哦。每个节点采用3个实例，或者你有资源，采用5个实例。

分布式数据库的sql实现

也是一个难点，即一个复杂的sql，如何实现？

•使用分库分表的思想实现数据存储

•使用mapred的思想实现sql计算

•将输入sql经过词法，语法，语义分析，集合表结构信息和数据分布信息，生成包含多个阶段(简称stage)的执行计划，这些阶段具有一定的依赖关系，形成多输入单输出的任务树；

•每个阶段包括两种sql，称为mapsql和redsql，另外每个阶段包括三个操作，map，数据洗牌和red；map和red分别执行mapsql和redsql；

子句的处理逻辑和处理顺序
：

1.union：分解每个子句，单独解析，形成平行关系

2.from：选择表，可以是选择多张表，也可是join的情况

3.join：from中如果包含join，就要考虑join的各种问题

4.where：单表，多表，join之后的where过滤条件

5.group：分组

6.select：选择的列

7.distinct：去掉重复的行

8.having：聚合之后的过滤

9.order：将结果排序

10.limit
offset：获取最终结果的某些记录

11.子查询：遇到子查询独立解析，跟上层建立依赖关系

连接，包括内连接，左连接，右连接，半连接，外连接

以如下sql为例：

某一注册时间范围内的用户的所有登录信息

select
t1.u_id,t1.u_name,t2.login_product

from tab_user_info t1 join
tab_login_info t2

on (t1.u_id=t2.u_id and
t1.u_reg_dt>=? and t1.u_reg_dt<=?)

生成的执行计划为：

由于是join，所有的表都要进行查询操作，并且为每张表打上自己的标签，具体实施的时候可以加个表名字字段，在所有存储节点上执行

select u_id,u_name from tab_user_info t where
u_reg_dt>=? and t1.u_reg_dt<=?

select u_id, login_product from tab_login_info t

执行完成之后，这种情况下由于需要按照u_id进行数据洗牌，考虑到u_id的唯一值比较多，所以各个存储节点上需要按照u_id进行划分，

例如有N个计算节点，那么按照（最大u_id-最小u_id）/N平均划分，将不同存储节点上的同一范围的u_id，划分到同一个计算节点上

然后在计算节点上执行如下操作

select
t1.u_id,t1.u_name,t2.login_product

from tab_user_info t1 join
tab_login_info t2

on (t1.u_id=t2.u_id)

关于分布式sql如何实现的问题，有很多未尽事宜。有兴趣的可以相互讨论。欢迎切磋

几点补充：

1.对于需要严格保证强一致的场合来说，至少在 MySQL 5.7 之前，DRBD 还是有意义的。5.7 据说能实现真同步复制，若真能实现，就不再需要 DRBD 了。

2.网络分区时的脑裂问题必须避免，应使用基于多数派的选举算法来推选 Master。方案很多，比如用 ZooKeeper、etcd、Consul 等进行服务选举，推选出 Master。

3.MHA 没深入了解过，但印象里其 Master（Arbiter）节点貌似有单点问题？没记错的话此节点用于完成 MySQL 的主节点选举工作，它自己不 HA 还是有隐患。

MySQL大型分布式集群1、主要解决针对大型网站架构中持久化部分中，大量数据存储以及高并发访问所带来是数据读写问题。分布式是将一个业务拆分为多个子业务，部署在不同的服务器上。集群是同一个业务，部署在多个服务器上。

2、着重对数据切分做了细致丰富的讲解，从数据切分的原理出发，一步一步深入理解数据的切分，通过深入理解各种切分策略来设计和优化我们的系统。这部分中我们还用到了数据库中间件和客户端组件来进行数据的切分，让广大网友能够对数据的切分从理论到实战都会有一个质的飞跃。

没有人提到Atlas
Atlas是由 Qihoo 360, Web平台部基础架构团队开发维护的一个基于MySQL协议的数据中间层项目。它是在mysql-proxy 0.8.2版本的基础上，对其进行了优化，增加了一些新的功能特性。360内部使用Atlas运行的mysql业务，每天承载的读写请求数达几十亿条。

组建MySQL集群的几种方案的更多相关文章

MySQL集群的几种方案
组建MySQL集群的几种方案LVS+Keepalived+MySQL(有脑裂问题?但似乎很多人推荐这个)DRBD+Heartbeat+MySQL(有一台机器空余?Heartbeat切换时间较长?有脑裂 ...
京东分布式MySQL集群方案介绍
背景数据库作为一个非常基础的系统,任何一家互联网公司都会使用,数据库产品也很多,有Oracle.SQL Server .MySQL.PostgeSQL.MariaDB等,像SQLServer/Ora ...
分布式MySQL集群方案的探索与思考
转载:http://www.infoq.com/cn/articles/exploration-of-distributed-mysql-cluster-scheme?utm_campaign=rig ...
MySQL集群的可行方案
如果单MySQL的优化始终还是顶不住压力时,这个时候我们就必须考虑MySQL的高可用架构(很多同学也爱说成是MySQL集群)了,目前可行的方案有: 一.MySQL Cluster优势:可用性非常高,性 ...
Galera Cluster——一种新型的高一致性MySQL集群架构
原文链接:https://www.sohu.com/a/147032902_505779,最近被分配定位mysql的问题,学习下. 1. 何谓Galera Cluster 何谓Galera Clust ...
MySQL集群之五大常见的MySQL高可用方案（转）
1. 概述我们在考虑MySQL数据库的高可用的架构时,主要要考虑如下几方面: 如果数据库发生了宕机或者意外中断等故障,能尽快恢复数据库的可用性,尽可能的减少停机时间,保证业务不会因为数据库的故障而中 ...
如何使用Heartbeat，组建一个高可用性的mysql集群
转了好多次帖子,其实就是为了使用heartbeat来搭建mysql集群,网上很多都是用make来生成RPM来安装,我也找了很多资料,mysql 自带的cluster用户不满意,只能再次vmware虚拟 ...
生产环境MySQL数据库集群MHA上线实施方案
生产环境MySQL数据库集群MHA上线实施方案一．不停库操作 1.在所有节点安装MHAnode所需的perl模块(需要有安装epel源) yum install perl-DBD-MySQL -y ...
MySQL集群方案收集
MySQL集群是一个需要时间才能磨得出的话题,不可能一下子就全部能掌握.由于整个方案结合LVS+Keepalived这种,更加的复杂. 下面是一些主流方案的收集: MySQL双主 + Keepaliv ...

随机推荐

执行 bower -v 时出现内部错误
安装nodejs ,我的位置是D:\node.js_install.全局模块安装默认放在C:\Users\Administrator\AppData\Roaming\npm\node_modules里 ...
四种pop模式介绍
四种pop模式介绍 URL:http://www.hishop.com.cn/ecschool/jd/show_21195.html URL:https://zhidao.baidu.com/ques ...
jsp自定义标签处理转义字符
sun公司提供的jstl虽然比较强大,但是开发中很难满足我们所有的需求,并且开发也禁止在jsp中写很多java代码,因此很多场景需要自己定义标签进行项目开发 sun提供的标签库引用方式:<%@t ...
winCE 获取路径信息
最近在做一个SAP的winCE扫描枪项目,采用C#开发,不过在获取路径是采用了常用的System.IO.Directory.GetCurrentDirectory, 并不能使用:查询后了解到winCE ...
HDU-4081.Qinshihuang'sNationalRoadSystem(次小生成树变种)
Qin Shi Huang's National Road System Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/3 ...
干货！小白入门Python数据科学全教程
前言本文讲解了从零开始学习Python数据科学的全过程,涵盖各种工具和方法你将会学习到如何使用python做基本的数据分析你还可以了解机器学习算法的原理和使用说明先说一段题外话.我是一名数据 ...
django 开发中数据库做过什么优化??
1.设计表时,尽量少使用外键,因为外键约束会影响插入和删除性能: 2.使用缓存,减少对数据库的访问: 3.在 orm 框架下设置表时,能用 varchar 确定字段长度时,就别用 text: 4.可以 ...
Dubbo一文入门
一.简介系统的架构,已从最早的单体式架构(一个war包完事)逐渐发展到目前的微服务式架构.微服务,将一个大型的复杂的应用系统,拆分成若干独立的松耦合的小的服务工程,每个服务工程可独立部署,每个服务只 ...
NGUI的HUD Text的扩展插件学习--(UIFollowTarget)的使用
一,我们先导入NGUI_HUD_Text_v1.11包,导入包后会在项目生成一个这样的文件夹二,我们添加一个cube,给cube添加一个空的游戏对象二,我们使添加一个label,然后给label添 ...
初入vue.js（1）
本文章属于个人在学习vue的随笔,留作与大家分享,技术交流之用,如果有错误,请大家多多指正.谢谢首先说一下vue的使用方式: vue的使用方式一共有两种,第一种是直接在官网上下载vue.js的文件, ...

组建MySQL集群的几种方案

组建MySQL集群的几种方案的更多相关文章

随机推荐

热门专题