clickhouse分布式集群

一.环境准备：

主机	系统	应用	ip
ckh-01	centos 8	jdk,zookeeper,clickhouse	192.168.205.190
ckh-02	centos 8	jdk,zookeeper,clickhouse	192.168.205.191
ckh-03	centos 8	jdk,zookeeper,clickhouse	192.168.205.192
ckh-04	centos 8	jdk,clickhouse	192.168.205.193
ckh-05	centos 8	jdk,clickhouse	192.168.205.194
ckh-06	centos 8	jdk,clickhouse	192.168.205.195

java环境和zookeeper集群安装省略

各节点安装clickhouse

yum -y  install yum-utils
rpm --import https://repo.clickhouse.tech/CLICKHOUSE-KEY.GPG yum-config-manager --add-repo https://repo.clickhouse.tech/rpm/stable/x86_64
dnf -y install clickhouse-server clickhouse-client

二.集群配置：（这里用原有配置文件/etc/clickhouse-server/config.xml）使用/etc/metrika.xml配置文件，后面测试配置无法生效

在配置文件/etc/clickhouse-server/config.xml找到

取消掉注释

<listen_host>::</listen_host>

使用3节点2副本6台服务器配置（以一台为例子，配置完成拷贝至其他节点。然后将副本改成唯一）

在<remote_servers></remote_servers>标签中加入如下配置

<!--<perftest_3shards_1replicas>可以改成自定义名-->
<perftest_3shards_1replicas>
    <shard>
        <internal_replication>true</internal_replication>
            <replica>
                <host>ckh-01</host>
                <port>9000</port>
                <user>admin</user>
                <password>111111</password>
            </replica>
            <replica>
                <host>ckh-02</host>
                <port>9000</port>
                <user>admin</user>
                <password>111111</password>
            </replica>
    </shard>
    <shard>
        <internal_replication>true</internal_replication>
            <replica>                             
                 <host>ckh-03</host>
                 <port>9000</port>
                 <user>admin</user>
                 <password>111111</password>
            </replica>
            <replica>
                <host>ckh-04/host>
                <port>9000</port>
                <user>admin</user>
                <password>111111</password>
            </replica>
     </shard>
     <shard>
        <internal_replication>true</internal_replication>
            <replica>
                 <host>ckh-05</host>
                 <port>9000</port>
                 <user>admin</user>
                 <password>111111</password>
            </replica>
            <replica>
                <host>ckh-06</host>
                <port>9000</port>
                <user>admin</user>
                <password>111111</password>
            </replica>
     </shard>
</perftest_3shards_1replicas>

将如下配置加入到<yandex></yandex>标签中

<!--zookeeper相关配置-->

        <zookeeper>
                <node>
                     <host>ckh-01</host>
                     <port>2181</port>
                </node>
                <node>
                      <host>ckh-02</host>
                      <port>2181</port>
                </node>
                <node >
                      <host>ckh-03</host>
                      <port>2181</port>
                </node>
        </zookeeper>
        <macros>
            <shard>01</shard>
             <replica>ckh-01-01</replica>
        </macros>
        <networks>
             <ip>::/0</ip>
        </networks>
        <clickhouse_compression>
                <case>
                    <min_part_size>10000000000</min_part_size>
                    <min_part_size_ratio>0.01</min_part_size_ratio>
                    <method>lz4</method>
                </case>
        </clickhouse_compression>

在<macros></macros>标签中接入对应分片和副本信息，确保每台副本唯一

主机名	分片	副本(主机名+副本编号)
ckh-01	01	ckh-01-01
ckh-02	01	ckh-02-02
ckh-03	02	ckh-03-01
ckh-04	02	ckh-04-02
ckh-05	03	ckh-05-01
ckh-06	03	ckh-06-02

修改以下文件，以便在一个节点上执行语句其他节点也同步执行

vim /etc/clickhouse-server/config.xml

三：用户密码配置

vim /etc/clickhouse-server/users.xml

如果配置密文加密请参照注释说明

clickhouse 默认用户为default 无密码可以登录，我们可以改成其他用户或禁用default

在<users></users>标签里添加其他用户配置

        <admin>
            <password>111111</password>
            <networks incl="networks" replace="replace">
                <ip>::/0</ip>
            </networks>
            <!-- Settings profile for user. -->
            <profile>default</profile>
            <!-- Quota for user. -->
            <quota>default</quota>
        </admin>

注 <networks incl="networks" replace="replace"> 此处需要加上 incl="networks" replace="replace"

高版本已取消，在使用flink运行任务时会出现连接clickhouse超时现象

四.进入clickhouse-client：（注意如果需要外部访问需要将vim /etc/clickhouse-server/config.xml配置文件listen_host改成如下设置）

各节点启动服务：

systemctl start clickhouse-server

然后连接通过以下命令连接(-m为多行命令操作)

clickhouse-client -h  192.168.205.190 --port 9000 -m -u admin --password 111111

查看数据库信息：

show databases;

五.查看集群信息（任意一节点均可查看）：

select * from system.clusters;

-------------------------------------------------------------------------------------------------------------------------------------

创建本地表及分布式表：

在各个节点分表创建数据库test(在一个节点执行即可)

create database test ON CLUSTER perftest_3shards_1replicas;

下面给出ReplicatedMergeTree引擎的完整建表DDL语句。

创建本地表及表引擎

Replicated Table & ReplicatedMergeTree Engines

CREATE TABLE IF NOT EXISTS test.events_local ON CLUSTER perftest_3shards_1replicas (  ts_date Date,  ts_date_time DateTime,  user_id Int64,  event_type String,  site_id Int64,  groupon_id Int64,  category_id Int64,  merchandise_id Int64,  search_text String ) ENGINE = ReplicatedMergeTree('/clickhouse/tables/{shard}/test/events_local','{replica}') PARTITION BY ts_date ORDER BY (ts_date,toStartOfHour(ts_date_time),site_id,event_type) SETTINGS index_granularity = 8192;

其中，ON CLUSTER语法表示分布式DDL，即执行一次就可在集群所有实例上创建同样的本地表。集群标识符{cluster}、分片标识符{shard}和副本标识符{replica}来自之前提到过的复制表宏配置，即config.xml中<macros>一节的内容，配合ON CLUSTER语法一同使用，可以避免建表时在每个实例上反复修改这些值。

分布式表及分布式表引擎

Distributed Table & Distributed Engine

ClickHouse分布式表的本质并不是一张表，而是一些本地物理表（分片）的分布式视图，本身并不存储数据。

支持分布式表的引擎是Distributed，建表DDL语句示例如下，_all只是分布式表名比较通用的后缀而已。

CREATE TABLE IF NOT EXISTS test.events_all ON CLUSTER perftest_3shards_1replicas AS test.events_local ENGINE = Distributed(perftest_3shards_1replicas,test,events_local,rand());

任意节点插入数据：

insert into test.events_all values('2021-03-03','2021-03-03 16:10:00',1,'ceshi1',1,1,1,1,'test1'),('2021-03-03','2021-03-03 16:20:01',2,'ceshi2',2,2,2,2,'test2'),('2021-03-03','2021-03-03 16:30:02',3,'ceshi2',3,3,3,3,'test3'),('2021-03-03','2021-03-03 16:40:03',4,'ceshi4',4,4,4,4,'test4'),('2021-03-03','2021-03-03 16:50:04',5,'ceshi5',5,5,5,5,'test5'),('2021-03-03','2021-03-03 17:00:05',6,'ceshi6',6,6,6,6,'test6');

查询各分片数据：

select * from test.events_all;

查看副本节点也复制了一份同样的数据

-------------------------------------------------------------------------------------

clickhouse基本操作：

查询clickhouse集群信息

select * from system.clusters;

创建数据库命令（一个节点上执行，多个节点同时创建）

create database test ON CLUSTER perftest_3shards_1replicas

删除数据库命令（一个节点上执行，多个节点同时删除）

drop database test ON CLUSTER perftest_3shards_1replicas

删除本地表数据（分布式表无法删除表数据）

alter table test.events_local ON CLUSTER perftest_3shards_1replicas delete where 1=1;

1=1表示删除所有数据，可以接字段名删除满足某个条件的数据

查看zookeeper下目录

select * from system.zookeeper WHERE path='/'

clickhouse分布式集群的更多相关文章

Hadoop伪分布式集群环境搭建
本教程讲述在单机环境下搭建Hadoop伪分布式集群环境,帮助初学者方便学习Hadoop相关知识. 首先安装Hadoop之前需要准备安装环境. 安装Centos6.5(64位).(操作系统再次不做过多描 ...
ElasticSearch 5学习(7)——分布式集群学习分享2
前面主要学习了ElasticSearch分布式集群的存储过程中集群.节点和分片的知识(ElasticSearch 5学习(6)--分布式集群学习分享1),下面主要分享应对故障的一些实践. 应对故障前 ...
ElasticSearch 5学习(6)——分布式集群学习分享1
在使用中我们把文档存入ElasticSearch,但是如果能够了解ElasticSearch内部是如何存储的,将会对我们学习ElasticSearch有很清晰的认识.本文中的所使用的ElasticSe ...
Redis分布式集群几点说道
原文地址:http://www.cnblogs.com/verrion/p/redis_structure_type_selection.html Redis分布式集群几点说道 Redis数据量日益 ...
Hadoop学习笔记—13.分布式集群中节点的动态添加与下架
开篇:在本笔记系列的第一篇中,我们介绍了如何搭建伪分布与分布模式的Hadoop集群.现在,我们来了解一下在一个Hadoop分布式集群中,如何动态(不关机且正在运行的情况下)地添加一个Hadoop节点与 ...
安装ClouderaManager以及使用ClouderaManager安装分布式集群的若干细节
目录前言整体介绍分步安装介绍总结一.前言周末干了近四十个小时中间只休息了五个小时终于成功安装了ClouderaManager以及分布式集群,其中各种辛酸无以言表,唯有泪两行. ...
Zookeeper分布式集群搭建
实验条件:3台安装linux的机子,配置好Java环境. 步骤1:下载并分别解包到每台机子的/home/iHge2k目录下,附上下载地址:http://mirrors.cnnic.cn/apache/ ...
分布式集群搭建(hadoop2.6.0+CentOS6.5)
摘要:之前安装过hadoop1.2.1集群,发现比较老了,后来安装cloudera(hadoop2.6.0),发现集成度比较高,想知道原生的hadoop什么样子,于是着手搭建一个伪分布式集群(三台), ...
MySQL分布式集群之MyCAT(转)
原文地址:http://blog.itpub.net/29510932/viewspace-1664499/ 隔了好久,才想起来更新博客,最近倒腾的数据库从Oracle换成了MySQL,研究了一段时间 ...

随机推荐

回文词——线性dp
#include<iostream> #include<cstdio> using namespace std; int n,f[5002][5002]; char str1[ ...
cuDNN概述
cuDNN概述 NVIDIACUDA深度神经网络库(cuDNN)是GPU加速的用于深度神经网络的原语库.cuDNN为标准例程提供了高度优化的实现,例如向前和向后卷积,池化,规范化和激活层. 全球的深度 ...
NSight Compute 用户手册（下）
主菜单文件新建项目使用"新建项目"对话框创建新的分析项目 4. Main Menu and Toolbar Information on the main menu and t ...
Redis6.x学习笔记（五）哨兵
前言最近学习Redis6.x,特做笔记以备忘,与大家共学.课程是从私塾在线下载的,他们把架构师课程都放出来了,大家可以去下载学习,不要钱的,地址是http://t.hk.uy/eK7,课程很不错,值 ...
c语言经典算法---计算Fibonacci数列
算法是一个程序和软件的灵魂,作为一名优秀的程序员,只有对一些基础的算法有着全面的掌握,才会在设计程序和编写代码的过程中显得得心应手.下面我就分享一个C语言中比较基础却极为重要的一个算法----计算Fi ...
【NX二次开发】Block UI 枚举
属性: 常规类型描述 BlockID String 控件ID Enable Logical 是否可操作 Group Logical ...
12：media配置以及后端指定资源暴露
django需要用到的静态文件默认都是放在static目录下而针对后期用户上传的静态文件也应该统一存储 # media配置:规定用户上传的静态文件存储位置 MEDIA_ROOT = os.path. ...
纯小白干货：Java import以及Java类的搜索路径
如果你希望使用Java包中的类,就必须先使用import语句导入.import语句与C语言中的 #include 有些类似,语法为:import package1[.package2-].classn ...
PowerMockito的一些注意事项
PowerMockito的一些注意事项目录 PowerMockito的一些注意事项 1 注解@PowerMockIgnore({"javax.crypto.*"}) 2 Powe ...
富文本编辑器之游戏角色升级ing
一.前言想必大家看到这个标题,心中不禁会浮现几个问题: 什么是富文本编辑器? 富文本编辑器和游戏角色有什么关系? 为什么是升级ing? 什么是富文本编辑器--富文本编辑器集成了格式设置.媒体嵌入.社 ...

clickhouse分布式集群

clickhouse分布式集群的更多相关文章

随机推荐

热门专题