列式数据库~clickhouse 副本集架构的搭建
clickhouse 搭建副本集
一 原理:
1 依赖ZK,ZK的基础上,ZK存储数据库元数据
2 使用复制表引擎创建复制表,包括ZK路径和副本名,相同ZK路径的表可以相互复制
3 复制表本身拥有数据校验功能,保证数据一致,推荐复制的最佳方案
4 复制最大的速度基本等于机器网卡的最大上限
5 一般创建表的副本名基本都是本机的域名或者IP,这样便于观察和记录
二 注意点:
1 不会同步DDL操作,所以要预先创建表
2 会进行双向全量同步,但是数据写入只会在单点写入,类似mysql的双主单写架构
3 ZK配置文件要写在config文件中,其他写入在/etc/metrika.xml中
4 复制引擎为ReplicatedMergeTree
5 任何情况下,不建议修改ZK的元数据。
三 配置文件 /etc/metrika.xml
<remote_servers incl="clickhouse_remote_servers" >
<remote_servers>
<distable>
<shard>
<!-- Optional. Shard weight when writing data. Default: 1. -->
<weight>1</weight>//权重
<!-- Optional. Whether to write data to just one of the replicas. Default: false (write data to all replicas). -->
<internal_replication>true</internal_replication>//单向写表
<replica>
<host>ip1</host>
<port>9000</port>
</replica>
<replica>
<host>ip2</host>
<port>9001</port>
</replica>
</shard>
</distable>
</remote_servers>
</remote_servers>
<clickhouse_compression> //压缩
<case>
<min_part_size>10000000000</min_part_size>
<min_part_size_ratio>0.01</min_part_size_ratio>
<method>lz4</method>
</case>
</clickhouse_compression>
配置文件/etc/config
<zookeeper>
<node index="1">
<host>ZK_IP</host>
<port>2181</port>
</node>
</zookeeper>
<interserver_http_host>本机IP</interserver_http_host>//添加IP绑定
<listen_host>::1</listen_host>
<listen_host>本机IP </listen_host>
这里一定要写在config里.不然不生效.我也是测试之后才发现的。。
四 创建复制引擎表
节点1
CREATE TABLE aa ENGINE = ReplicatedMergeTree('/clickhouse/tables/01-01/aa','IP1') ORDER BY id AS SELECT * FROM mysql('IP:prot', 'db', 'table', 'user', 'password') ;
因为create表操作不会同步
所以
根据/data/clickhouse/metadata/db/table.sql
节点2
CREATE TABLE aa
(
id UInt32,
uid UInt32,
repay_date Date,
repay_amount String,
type Int8,
loan_id String
)
ENGINE = ReplicatedMergeTree('/clickhouse/tables/01-01/aaa', 'IP1')//这里的IP1改成IP2
ORDER BY id
SETTINGS index_granularity = 8192;
clickhouse -d db < table.sql
然后观察即可,可以发现速度很快,这也是clickhouse的优势,同步秒级
五 ReplicatedMergeTree 引擎介绍
非同步选项
CREATE,DROP,ATTACH,DETACH and RENAME(针对分区表操作)
同步选项
insert 大部分DDL操作,包括列的操作,delete操作(只针对int类型,补充 全表删除 alter table delete where 1=1)
ALTER支持选项
ADD COLUMN, DROP COLUMN, CLEAR COLUMN, MODIFY COLUMN, MODIFY PRIMARY KEY, ATTACH PARTITION, DETACH PARTITION, DROP PARTITION, ATTACH PART, FETCH PARTITION, FREEZE PARTITION, DELETE WHERE, REPLACE PARTITION, ON
六 监控
select table,zookeeper_path,active_replicas,total_replicas from replicas;
通过对比table和total_replicas的对比,可以发现哪些表没有同步
通过对比active_replicas,total_replicas 可以发现集群服务是否都正常
七 伸缩节点
对于clickhouse副本集的节点伸缩
1 修改配置文件,而定义集群的XML文件是可以热加载的,所以非常方便
2 如果节点宕机,并且可恢复,重启后无需关注,CH会自动同步
3 如果节点宕机,且不可恢复,需要更换新的机器,新增节点,ZK路径毫无疑问需要一致,分片名称务必不能一致,需要更改副本名
八 补充
1 副本集可以扩展成分片集群.需要定义shard标签
2 对于不同步的语句要记得双向操作
3 对于单节点引擎的效率对比,明天将会给出结果
列式数据库~clickhouse 副本集架构的搭建的更多相关文章
- NoSQL数据库Mongodb副本集架构(Replica Set)高可用部署
NoSQL数据库Mongodb副本集架构(Replica Set)高可用部署 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. MongoDB 是一个基于分布式文件存储的数据库.由 C ...
- 列式数据库~clickhouse 场景以及安装
一 简介:列式数据库clickhouse的安装与基本操作二 基本介绍:ClickHouse来自俄罗斯,是一款列式数据库三 适用场景: 简单类型的大数据统计四 限制 1 不支持更新操作,不支持事 ...
- 数仓选型必列入考虑的OLAP列式数据库ClickHouse(上)
概述 定义 ClickHouse官网地址 https://clickhouse.com/ 最新版本22.4.5.9 ClickHouse官网文档地址 https://clickhouse.com/do ...
- 列式数据库~clickhouse 底层存储原理
简介:今天介绍列式数据库的一些基本原理 一 数据目录 Data目录 数据存储目录,数据按照part分成多个文件夹,每个文件夹下存储相应数据和对应的元信息文件 Metadata 表定义语句,存储所有表 ...
- 数仓选型必列入考虑的OLAP列式数据库ClickHouse(中)
实战 案例使用 背景 ELK作为老一代日志分析技术栈非常成熟,可以说是最为流行的大数据日志和搜索解决方案:主要设计组件及架构如下: 而新一代日志监控选型如ClickHouse.StarRocks特别是 ...
- 列式数据库~clickhouse日常管理
clickhouse日常管理一 变量相关 1 查看变量 system.setting相关表 2 设置变量 set variables= 请注意这里是session级别,如果想永久生 ...
- 列式数据库~clickhouse问题汇总
一 简介:常见的clickhouse 问题汇总 二 问题系列 1 内存问题 Code: 241. DB::Exception: Received from localhost:9000, : ...
- 列式数据库~clickhouse 数据同步使用
一 简介:进一步了解clickhouse二 数据操 1 单机建表 create TABLE aaa ( id UInt32, uid UInt32, amount Float64, ...
- Hbase与Oracle比较(列式数据库与行式数据库)
Hbase与Oracle比较(列式数据库与行式数据库) 1 主要区别 Hbase适合大量插入同时又有读的情况 Hbase的瓶颈是硬盘传输速度,Oracle的瓶颈是硬盘寻道时间. Hbase本质上只 ...
随机推荐
- 使用嵌入式jetty实现文件服务器
pom.xml <?xml version="1.0" encoding="UTF-8"?> <project xmlns="htt ...
- BZOJ1146[CTSC2008]网络管理——出栈入栈序+树状数组套主席树
题目描述 M公司是一个非常庞大的跨国公司,在许多国家都设有它的下属分支机构或部门.为了让分布在世界各地的N个 部门之间协同工作,公司搭建了一个连接整个公司的通信网络.该网络的结构由N个路由器和N-1条 ...
- 通俗理解TCP/IP协议三次握手四次分手流程
转自:https://blog.csdn.net/special23/article/details/54137298 三次握手流程 客户端发个请求“开门呐,我要进来”给服务器 服务器发个“进来吧,我 ...
- MT【61】含参数二次函数最大最小值
评:此类题目在高考中作为压轴题也曾考过,一般通性通法都如上面的做法,但是我们如果可以站在包络的角度,很多问题将变得很清晰:
- LOJ #6270. 数据结构板子题 (离线+树状数组)
题意 有 \(n\) 个区间,第 \(i\) 个区间是 \([l_i,r_i]\) ,它的长度是 \(r_i-l_i\) . 有 \(q\) 个询问,每个询问给定 \(L,R,K\) ,询问被 \([ ...
- 【BZOJ2244】[SDOI2011]拦截导弹(CDQ分治)
[BZOJ2244][SDOI2011]拦截导弹(CDQ分治) 题面 BZOJ 洛谷 题解 不难发现这就是一个三维偏序+\(LIS\)这样一个\(dp\). 那么第一问很好求,直接\(CDQ\)分治之 ...
- 【ARC065E】??
Description 链接 Solution 问题其实就是从一个点出发,每次可以走与其曼哈顿距离恰好为一个常数\(d\)的点 显然不可能一一走完所有的边,这样复杂度下界至少是\(O(ans)\) 我 ...
- hdu3516 Tree Construction (区间dp+四边形优化)
构造方法肯定是把相邻两个点连到一起,变成一个新点,然后再把新点和别的点连到一起.... 设f[i,j]为把第i到j个点都连到一起的代价,那么答案就是f[1,n] f[i,j]=min{f[i,k]+f ...
- WEB入门之十三 jQuery选择器
学习内容 jQuery层次选择器 jQuery属性选择器 jQuery表单选择器 jQuery过滤选择器 能力目标 熟悉jQuery各种选择器的使用场合 能熟练使用jQuery各种选择器 本章简介 上 ...
- centos6.5安装VNC、远程及启动关闭
标签: centos vnc 远程桌面 安装 详解 0.说明 安装服务的过程当中,最好是在联网环境下操作.由于涉及到远程连接的问题,系统的防火墙需要关闭,或者是做好相应的过滤策略.参考了网上很多大牛的 ...