GraphiteMergeTree该引擎用来对Graphite数据(图数据)进行瘦身及汇总。对于想使用ClickHouse来存储Graphite数据的开发者来说可能有用。

如果不需要对Graphite数据做汇总，那么可以使用任意的ClickHouse表引擎；但若需要，那就采用GraphiteMergeTree引擎。它能减少存储空间，同时能提高Graphite数据的查询效率。

该引擎继承自MergeTree.

创建表

CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]

(

    Path String,

    Time DateTime,

    Value <Numeric_type>,

    Version <Numeric_type>

    ...

) ENGINE = GraphiteMergeTree(config_section)

[PARTITION BY expr]

[ORDER BY expr]

[SAMPLE BY expr]

[SETTINGS name=value, ...]

含有Graphite数据集的表应该包含以下的数据列：

指标名称(Graphite sensor)，数据类型：String
指标的时间度量，数据类型：DateTime
指标的值，数据类型：任意数值类型
指标的版本号，数据类型：任意数值类型

ClickHouse以最大的版本号保存行记录，若版本号相同，保留最后写入的数据。

以上列必须设置在汇总参数配置中。

GraphiteMergeTree参数

config_section - 配置文件中标识汇总规则的节点名称

建表语句

在创建GraphiteMergeTree表时，需要采用和clauses相同的语句，就像创建MergeTree一样。

汇总配置的参数

汇总的配置参数由服务器配置的graphite_rollup参数定义。参数名称可以是任意的。允许为多个不同表创建多组配置并使用。

汇总配置的结构如下：所需的列模式Patterns

所需的列

path_column_name — 保存指标名称的列名 (Graphite sensor). 默认值: Path.
time_column_name — 保存指标时间度量的列名. Default value: Time.
value_column_name — The name of the column storing the value of the metric at the time set * in time_column_name.默认值: Value.
version_column_name - 保存指标的版本号列. 默认值: Timestamp.

模式Patterns

patterns 的结构：

pattern

    regexp

    function

pattern

    regexp

    age + precision

    ...

pattern

    regexp

    function

    age + precision

    ...

pattern

    ...

default

    function

    age + precision

    ...

!!! 注意 "Attention" 模式必须严格按顺序配置：

不含'function' or 'retention'的Patterns
同时含有'function' and 'retention'的Patterns
'default'的Patterns.

ClickHouse在处理行记录时，会检查pattern节点的规则。每个pattern（含default）节点可以包含function用于聚合操作，或retention参数，或者两者都有。如果指标名称和regexp相匹配，相应pattern的规则会生效；否则，使用default节点的规则。

pattern和default节点的字段设置:

regexp– 指标名的pattern.
age – 数据的最小存活时间(按秒算).
precision– 按秒来衡量数据存活时间时的精确程度. 必须能被86400整除 (一天的秒数).
function – 对于存活时间在 [age, age + precision]之内的数据，需要使用的聚合函数

配置示例

<graphite_rollup>

    <version_column_name>Version</version_column_name>

    <pattern>

        <regexp>click_cost</regexp>

        <function>any</function>

        <retention>

            <age>0</age>

            <precision>5</precision>

        </retention>

        <retention>

            <age>86400</age>

            <precision>60</precision>

        </retention>

    </pattern>

    <default>

        <function>max</function>

        <retention>

            <age>0</age>

            <precision>60</precision>

        </retention>

        <retention>

            <age>3600</age>

            <precision>300</precision>

        </retention>

        <retention>

            <age>86400</age>

            <precision>3600</precision>

        </retention>

    </default>

</graphite_rollup>

资料分享

ClickHouse经典中文文档分享

参考文章

ClickHouse(15)ClickHouse合并树MergeTree家族表引擎之GraphiteMergeTree详细解析的更多相关文章

ClickHouse(10)ClickHouse合并树MergeTree家族表引擎之ReplacingMergeTree详细解析
目录建表语法数据处理策略资料分享参考文章 MergeTree拥有主键,但是它的主键却没有唯一键的约束.这意味着即便多行数据的主键相同,它们还是能够被正常写入.在某些使用场合,用户并不希望数据表 ...
ClickHouse(11)ClickHouse合并树MergeTree家族表引擎之SummingMergeTree详细解析
目录建表语法数据处理汇总的通用规则 AggregateFunction 列中的汇总嵌套结构数据的处理资料分享参考文章 SummingMergeTree引擎继承自MergeTree.区别在于 ...
ClickHouse(13)ClickHouse合并树MergeTree家族表引擎之CollapsingMergeTree详细解析
目录建表折叠数据算法资料分享参考文章该引擎继承于MergeTree,并在数据块合并算法中添加了折叠行的逻辑.CollapsingMergeTree会异步的删除(折叠)这些除了特定列Sig ...
ClickHouse(12)ClickHouse合并树MergeTree家族表引擎之AggregatingMergeTree详细解析
目录建表语法查询和插入数据数据处理逻辑 ClickHouse相关资料分享 AggregatingMergeTree引擎继承自 MergeTree,并改变了数据片段的合并逻辑.ClickHouse ...
Clickhouse表引擎之MergeTree
1.概述在Clickhouse中有多种表引擎,不同的表引擎拥有不同的功能,它直接决定了数据如何读写.是否能够并发读写.是否支持索引.数据是否可备份等等.本篇博客笔者将为大家介绍Clickhouse中 ...
UniqueMergeTree：支持实时更新删除的 ClickHouse 表引擎
UniqueMergeTree 开发的业务背景首先,我们看一下哪些场景需要用到实时更新. 我们总结了三类场景: 第一类是业务需要对它的交易类数据进行实时分析,需要把数据流同步到 ClickHouse ...
Clickhouse表引擎探究-ReplacingMergeTree
作者:耿宏宇 1 表引擎简述 1.1 官方描述 MergeTree 系列的引擎被设计用于插入极大量的数据到一张表当中.数据可以以数据片段的形式一个接着一个的快速写入,数据片段在后台按照一定的规则进行合 ...
ClickHouse入门：表引擎-HDFS
前言插件及服务器版本服务器:ubuntu 16.04Hadoop:2.6ClickHouse:20.9.3.45 文章目录简介引擎配置 HDFS表引擎的两种使用形式引用简介 ClickHous ...
ClickHouse(02)ClickHouse架构设计介绍概述与ClickHouse数据分片设计
ClickHouse核心架构设计是怎么样的?ClickHouse核心架构模块分为两个部分:ClickHouse执行过程架构和ClickHouse数据存储架构,下面分别详细介绍. ClickHouse执 ...
【大数据面试】ClickHouse：介绍、特点、数据类型、引擎、操作、副本、分片
1.介绍开源的列式存储数据库(DBMS),由C++编写,用于在线分析处理查询(OLAP) 可以通过SQL查询实时生成分析数据报告解释: DBMS:数据库管理系统常见的列式存储数据库:Hbase. ...

随机推荐

Linux 服务器更换主板后，网卡识别失败的处理方法
上周日,由于断电,公司所在的集群服务器在关机断电重启后,发现唯一的一个登陆节点主板出现了故障,以致于 log 登陆节点的 Red Hat Enterprise 6 系统无法启动. 由于集群是生信所有分 ...
JVM源码分析：深入剖析java.c文件中JavaMain方法中InitializeJVM的实现
经过前文<从JDK源码级深入剖析main方法的运行机制>的分析,我们知道了实现JavaMain方法的四个主要步骤: 初始化Java虚拟机加载主运行类通过加载的主运行类,获取main方法 ...
MRS-MRS相同功能代码管理应用笔记
MRS相同功能代码管理应用笔记使用 MounRiver(以下简称 MRS )进行 RISC-V 单片机开发时,工程目录下往往存在多个文件夹与文件,我们只需要着重关注截图中红框所示的部分,它们自上而下 ...
Python3.7源码编译
1.下载Python3.7.0源码 git clone https://github.com/python/cpython.gitgit checkout v3.7.0 wget https://ww ...
一文解开主流开源变更数据捕获技术之Flink CDC的入门使用
@ 目录概述定义什么是CDC? CDC的分类特性应用场景支持数据源实战 Flink DataStream方式代码示例 FlinkSQL方式代码示例概述定义 flink-cdc-con ...
一体化元数据管理平台——OpenMetadata入门宝典
大家好,我是独孤风,一位曾经的港口煤炭工人,目前在某国企任大数据负责人,公众号大数据流动主理人.在最近的两年的时间里,因为公司的需求,还有大数据的发展趋势所在,我开始学习数据治理的相关知识.今天给大家 ...
Hugging News #0717: 开源大模型榜单更新、音频 Transformers 课程完成发布！
每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新.社区活动.学习资源和内容更新.开源库和模型更新等,我们将其称之为「Hugging Ne ...
说说 Linux 的 curl 命令
cURL,熟悉 Linux 的同学,没有人不知道这个命令吧:) 它有非常非常多的参数,我这里就不复制粘贴了,有需要可以 -h 或者谷歌搜索看看. 我从实用性的角度,说下我比较常用的几个参数: -v:啰 ...
volatile是如何保证有序性的？
为什么需要保证有序性? 有如下代码,在int i = a;执行了的情况下,i的值最终会为几? public class NoVolatileExample { int a = 0; boolean f ...
你知道ES6中的这些属性吗
ES6,也称ESMAScript2015,这个版本增加了很多好用的特性变量声明 ES6之前用var来定义变量,ES6增加了两个变量声明的方式,分别为const和let,const用来定义常量,let ...

ClickHouse(15)ClickHouse合并树MergeTree家族表引擎之GraphiteMergeTree详细解析

创建表