列式数据库~clickhouse 场景以及安装

一简介:列式数据库clickhouse的安装与基本操作
二基本介绍:ClickHouse来自俄罗斯,是一款列式数据库
三适用场景: 简单类型的大数据统计
四限制
1 不支持更新操作,不支持事务

2 不支持二级索引,只有主键(主键包含单列主键和联合主键)

3 对精度相关类型有限制,包括存储和计算(时间类型经过验证最新版本已经支持)

4 有限的SQL支持，join实现与众不同。如果需要在从MySQL或Spark进行迁移，则可能必须重新编写包含联接的所有查询。
5 不支持窗口功能

6 复制集群不支持create,drop等操作

7 delete删除大量数据可能有延迟,如果删除全表数据建议使用truncate

五优势

1 列式存储数据库，数据压缩和查询效率对比mysql有了很大的提升
2 关系型、支持大部分标准SQL

3 针对MYSQL的数据迁移是非常友好的,不再需要第三方工具

4 分布式并行计算，把单机性能压榨到极限
5 复制集群

1极高的同步性能,支持多写

2 拥有数据校验功能,能保持复制的一致性

3 有很高的扩展性
6数据量级能达到PB级别

六引擎推荐
1 MergeTree，是CK里最Advanced的引擎，性能超高，单机写入可以达到50w峰值，查询性能非常快，单台DB首选
2 ReplicatedMergeTree，基于MergeTree，同时引入ZK，做了复制，
3 Distributed，分布式引擎，本身不存储数据，可认为就是一张View，如果写入，会把请求丢到集群里的节点（有算法控制），如果查询，会帮你做查询转发再聚合返回集群首选
七安装-单机部署
curl -s https://packagecloud.io/install/repositories/altinity/clickhouse/script.rpm.sh |bash

如果按照失败,需要禁用IPV6 echo 1 > /proc/sys/net/ipv6/conf/eth0/disable_ipv6
yum install -y clickhouse-server clickhouse-client
启动
service clickhouse-server start
登录
clickhouse-client
如果因为网络问题无法安装成功,需要自行下载四个rpm包
clickhouse-server-common clickhouse-server clickhouse-common-static clickhouse-client
八配置文件
/etc/clickhouse-server
config-preprocessed.xml
config.xml 数据库相关配置->具体配置请参考文档,这里只列出一些基本
<http_port>8123</http_port>//http端口
<tcp_port>9000</tcp_port>//tcp端口
<interserver_http_port>9009</interserver_http_port>//服务端口,和复制有关
<--data dictory-->
<path>/var/lib/clickhouse/</path>//数据存储目录
<max_connections>4096</max_connections>//最大连接数
<max_concurrent_queries>100</max_concurrent_queries>//并发查询连接数

users-preprocessed.xml
users.xml

九常见操作

cat a.json | clickhouse-client —query "INSERT INTO table_xxx FORMAT Json"// JSON导入

十补充

1 https://packagecloud.io/altinity/clickhouse rpm包下载

2 一定要选择社区最新的版本,重要的话说三遍,因为最新版是最完整的状态

列式数据库~clickhouse 场景以及安装的更多相关文章

数仓选型必列入考虑的OLAP列式数据库ClickHouse（上）
概述定义 ClickHouse官网地址 https://clickhouse.com/ 最新版本22.4.5.9 ClickHouse官网文档地址 https://clickhouse.com/do ...
列式数据库~clickhouse 底层存储原理
简介:今天介绍列式数据库的一些基本原理一数据目录 Data目录数据存储目录,数据按照part分成多个文件夹,每个文件夹下存储相应数据和对应的元信息文件 Metadata 表定义语句,存储所有表 ...
数仓选型必列入考虑的OLAP列式数据库ClickHouse(中)
实战案例使用背景 ELK作为老一代日志分析技术栈非常成熟,可以说是最为流行的大数据日志和搜索解决方案:主要设计组件及架构如下: 而新一代日志监控选型如ClickHouse.StarRocks特别是 ...
列式数据库~clickhouse日常管理
clickhouse日常管理一变量相关 1 查看变量 system.setting相关表 2 设置变量 set variables= 请注意这里是session级别,如果想永久生 ...
列式数据库~clickhouse问题汇总
一简介:常见的clickhouse 问题汇总二问题系列 1 内存问题 Code: 241. DB::Exception: Received from localhost:9000, : ...
列式数据库~clickhouse 副本集架构的搭建
clickhouse 搭建副本集一原理: 1 依赖ZK,ZK的基础上,ZK存储数据库元数据 2 使用复制表引擎创建复制表,包括ZK路径和副本名,相同ZK路径的表可以相互复制 3 复制表本身拥 ...
列式数据库~clickhouse 数据同步使用
一简介:进一步了解clickhouse二数据操 1 单机建表 create TABLE aaa ( id UInt32, uid UInt32, amount Float64, ...
Hbase与Oracle比较（列式数据库与行式数据库）
Hbase与Oracle比较(列式数据库与行式数据库) 1 主要区别 Hbase适合大量插入同时又有读的情况 Hbase的瓶颈是硬盘传输速度,Oracle的瓶颈是硬盘寻道时间. Hbase本质上只 ...
Hadoop HBase概念学习系列之HBase里的列式数据库（十七）
列式数据库,从数据存储方式上有别于行式数据库,所有数据按列存取. 行式数据库在做一些列分析时,必须将所有列的信息全部读取出来而列式数据库由于其是按列存取,因此只需在特定列做I/O即可完成查询与分析, ...

随机推荐

Java监听器Listener的使用详解
监听器用于监听Web应用中某些对象的创建.销毁.增加,修改,删除等动作的发生,然后作出相应的响应处理.当监听范围的对象的状态发生变化的时候,服务器自动调用监听器对象中的方法.常用于统计网站在线人数.系 ...
Lights inside a 3d Grid UVA - 11605(概率)
题意: 给出一个n * m * h的空间每次任意选择两个点使得在以这两个点连线为对角线的空间的点的值取反 (初始为0) 求经过k次操作后最后有多少点的值为1 解析: 遇到坐标分维去看把三 ...
CUBA在查询语句如何添加参数
在browse.xml中的collectionDatasource 可以添加查询语句,使用 “= :custom$param” 的形式 <collectionDatasource id=&qu ...
git报错failed to push some refs to 'git@github.com:Markprint/github.git'
这个不知名小错误用了我两天的空余时间mmp 就是这里报的错输入 git push origin master -f 解释为: 远程分支上存在本地分支中不存在的提交,往往是多人协作开发过程中遇到 ...
自学Linux Shell1.1-Linux初识
点击返回自学Linux命令行与Shell脚本之路 1.1-Linux初识(架构.内核.shell) 1. Linux架构 Linux系统一般有4个主要部分:内核.shell.文件系统和应用程序.(有 ...
自学Aruba4.1-Aruba开机初始化
点击返回:自学Aruba之路自学Aruba4.1-Aruba开机初始化无线控制器刚启动的时候,是没有任何配置的,需要进行初始化配置才能进行管理. 通过无线控制器的console端口连接无线控制器, ...
BZOJ 4212: 神牛的养成计划
4212: 神牛的养成计划 Time Limit: 10 Sec Memory Limit: 512 MBSubmit: 142 Solved: 30[Submit][Status][Discus ...
洛谷 P1984 [SDOI2008]烧水问题解题报告
P1984 [SDOI2008]烧水问题题目描述把总质量为1kg的水分装在n个杯子里,每杯水的质量均为(1/n)kg,初始温度均为0℃.现需要把每一杯水都烧开.我们可以对任意一杯水进行加热.把一杯 ...
LOJ#2095 选数
给定n,k,l,r 问从[l, r]中选出n个数gcd为k的方案数. 解:稍微一想就能想到反演,F(x)就是[l, r]中x的倍数个数的n次方. 后面那个莫比乌斯函数随便怎么搞都行,当然因为这是杜教筛 ...
【洛谷P1429】平面最近点对
题解:直接在输入点对的基础上建立 kd-tree,再每次以每个节点的坐标查询离这个点最近的点即可,同时需要忽略这个点本身对该点答案的贡献. 另外,直接在这些点上建立 kd-tree 会比一个一个插入点 ...

列式数据库~clickhouse 场景以及安装

列式数据库~clickhouse 场景以及安装的更多相关文章

随机推荐

热门专题