一、关键概念

相比V1 移除了database 和 RP，增加了bucket。

V2具有以下几个概念：

timestamp、field key、field value、field set、tag key、tag value、tag set、measurement、series、point、bucket、bucket schema、organization

新增的概念：

bucket：所有 InfluxDB 数据都存储在一个存储桶中。一个桶结合了数据库的概念和存储周期（时间每个数据点仍然存在持续时间）。一个桶属于一个组织

bucket schema：具有明确的schema-type的存储桶需要为每个度量指定显式架构。测量包含标签、字段和时间戳。显式模式限制了可以写入该度量的数据的形状。

organization：InfluxDB组织是一组用户的工作区。所有仪表板、任务、存储桶和用户都属于一个组织。

二、系统结构

数据模式：InfluxDB数据元素存储在时间结构合并树 (TSM)和时间序列索引 (TSI)文件中，以有效压缩存储的数据。

默认路径：

Engine path	`~/.influxdbv2/engine/`	InfluxDB 存储时序数据的位置
Bolt path	`~/.influxdbv2/influxd.bolt`	非时间序列数据的基于文件的键值存储
Configs path	`~/.influxdbv2/configs`	配置文件(configs) 的文件路径

文件目录结构：

~/.influxdbv2/

engine/
- data/
  - TSM directories and files
- wal/
  - WAL directories and files
configs
influxd.bolt

Influxdb分片和分片组

InfluxDB在将数据存储到磁盘时将时间序列数据组织成分片。分片被分组到分片组中

表示具有4d 保留期和1d 分片组持续时间的存储桶：

分片删除：InfluxDB保留强制执行服务会例行检查早于其存储桶保留期的分片组。一旦分片组的开始时间超过存储桶的保留期，InfluxDB 将删除该分片组以及关联的分片和 TSM 文件(在具有无限保留期的存储桶中，分片无限期地保留在磁盘上)。

系统存储桶

_monitoring system bucket :该_monitoring系统桶存储InfluxDB数据用于监控数据并发送警报。数据保留：7天

_tasks system bucket: 该_tasks系统桶存储与数据InfluxDB任务的执行。数据保留：1天

标签和字段描述详见：https://docs.influxdata.com/influxdb/v2.0/reference/internals/system-buckets/

三、配置文件

当influxd启动时，它会在当前工作目录检查一个名为config.*的文件。

支持以下语法：

YAML (.yaml, .yml)
TOML (.toml)
JSON (.json)

配置选项(日志、并发压缩...)：https://docs.influxdata.com/influxdb/v2.0/reference/config-options/

四、Flux查询语句

Flux 是 InfluxData 的功能性数据脚本语言，设计用于查询、分析和处理数据，它是InfluxQL 和其他类似 SQL 的查询语言的替代品。

设计原则：受Javascript 启发，旨在设计出可用、可读、灵活、可组合、可测试、可贡献和可共享的语言。

示例查询：近一小时存储的数据，按cpu度量和cpu=cpu-total标签过滤，以 1 分钟为间隔对数据进行窗口化，并计算每个窗口的平均值






from(bucket:"example-bucket")





  |> range(start:-1h)





  |> filter(fn:(r) =>





    r._measurement == "cpu" and





    r.cpu == "cpu-total"





  )





  |> aggregateWindow(every: 1m, fn: mean)

1>关键概念

Pipe-forward operator（管道转发操作符" |> "）：Flux广泛使用管道转发运算符 "|>" 将操作链接在一起。在每个函数或操作之后，Flux 返回一个包含数据的表或表的集合。管道转发运算符将这些表通过管道输送到下一个函数或操作中，在那里它们将被进一步处理或操作。

Tables：Flux 构造表格中的所有数据。当数据从数据源流式传输时，Flux 将其格式化为带注释的逗号分隔值 (CSV)，表示表格。然后函数操作或处理它们并输出新表。

Group keys：每个表都有一个组键(Group keys)，用于描述表的内容。它是一个列列表，表中的每一行都具有相同的值。每行中具有唯一值的列不是组键的一部分。

示例 group key






 





Group key: [_start, _stop, _field]





                   _start:time                      _stop:time           _field:string                      _time:time                  _value:float





------------------------------  ------------------------------  ----------------------  ------------------------------  ----------------------------





2019-04-25T17:33:55.196959000Z  2019-04-25T17:34:55.196959000Z            used_percent  2019-04-25T17:33:56.000000000Z             65.55318832397461





2019-04-25T17:33:55.196959000Z  2019-04-25T17:34:55.196959000Z            used_percent  2019-04-25T17:34:06.000000000Z             65.52391052246094





2019-04-25T17:33:55.196959000Z  2019-04-25T17:34:55.196959000Z            used_percent  2019-04-25T17:34:36.000000000Z              65.536737442016

注意：_time和_value被排除在示例组键之外，它们对于每一行都是唯一的。

2>查询语法

https://docs.influxdata.com/influxdb/v2.0/query-data/get-started/query-influxdb/

指定数据源：from(bucket:"example-bucket")

指定时间范围：

使用管道转发运算符 ( |>) 将数据从数据源通过管道传输到range() 函数，该函数指定查询的时间范围。它接受两个参数：start和stop。范围可以是使用相对负持续时间或使用绝对时间






// Relative time range with start only. Stop defaults to now.





from(bucket:"example-bucket")





  |> range(start: -1h)





 





// Relative time range with start and stop





from(bucket:"example-bucket")





  |> range(start: -1h, stop: -10m)





 





//使用绝对时间





from(bucket:"example-bucket")





  |> range(start: 2018-11-05T23:30:00Z, stop: 2018-11-06T00:00:00Z)





 





//过去十五分钟的数据





from(bucket:"example-bucket")





  |> range(start: -15m)

3>数据过滤：

将范围数据传递到filter()函数中，以根据数据属性或列缩小结果范围。该filter()函数有一个参数，fn它需要一个匿名函数，该函数具有基于列或属性过滤数据的逻






// Pattern





(r) => (r.recordProperty comparisonOperator comparisonExpression)





 





// Example with single filter





(r) => (r._measurement == "cpu")





 





// Example with multiple filters





(r) => (r._measurement == "cpu") and (r._field != "usage_system" )





 





//按cpu度量、usage_system字段和cpu-total标记值过滤





from(bucket:"example-bucket")





  |> range(start: -15m)





  |> filter(fn: (r) =>





    r._measurement == "cpu" and





    r._field == "usage_system" and





    r.cpu == "cpu-total"





  )

4>生成指定查询数据

Flux 的yield()函数将过滤后的表作为查询结果输出。

Flux 会yield()在每个脚本的末尾自动假设一个函数，以便输出和可视化数据。yield()只有在同一个 Flux 查询中包含多个查询时，才需要显式调用。每组返回的数据都需要使用该yield()函数命






from(bucket:"example-bucket")





  |> range(start: -15m)





  |> filter(fn: (r) =>





    r._measurement == "cpu" and





    r._field == "usage_system" and





    r.cpu == "cpu-total"





  )





  |> yield()

5>数据转换

使用函数，将数据聚合为平均值、下采样数据等






 





//更新范围从最后一小时拉取数据





from(bucket:"example-bucket")





  |> range(start: -1h)





  |> filter(fn: (r) =>





    r._measurement == "cpu" and





    r._field == "usage_system" and





    r.cpu == "cpu-total"





  )





 





//以五分钟为间隔的窗口化数据





from(bucket:"example-bucket")





  |> range(start: -1h)





  |> filter(fn: (r) =>





    r._measurement == "cpu" and





    r._field == "usage_system" and





    r.cpu == "cpu-total"





  )





  |> window(every: 5m)





 





//聚合窗口数据





from(bucket:"example-bucket")





  |> range(start: -1h)





  |> filter(fn: (r) =>





    r._measurement == "cpu" and





    r._field == "usage_system" and





    r.cpu == "cpu-total"





  )





  |> window(every: 5m)





  |> mean()





 





//添加时间列到聚合函数





from(bucket:"example-bucket")





  |> range(start: -1h)





  |> filter(fn: (r) =>





    r._measurement == "cpu" and





    r._field == "usage_system" and





    r.cpu == "cpu-total"





  )





  |> window(every: 5m)





  |> mean()





  |> duplicate(column: "_stop", as: "_time")





 





//取消窗口聚合表，将所有点收集到一个无限的窗口中





from(bucket:"example-bucket")





  |> range(start: -1h)





  |> filter(fn: (r) =>





    r._measurement == "cpu" and





    r._field == "usage_system" and





    r.cpu == "cpu-total"





  )





  |> window(every: 5m)





  |> mean()





  |> duplicate(column: "_stop", as: "_time")





  |> window(every: inf)





 





//辅助函数(将聚合或选择器函数应用于固定的时间窗口,通过every指定窗口的持续时间)





from(bucket:"example-bucket")





  |> range(start: -1h)





  |> filter(fn: (r) =>





    r._measurement == "cpu" and





    r._field == "usage_system" and





    r.cpu == "cpu-total"





  )





  |> aggregateWindow(every: 5m, fn: mean)

6>语法基础与通量函数

语法基础：https://docs.influxdata.com/influxdb/v2.0/query-data/get-started/syntax-basics/

通量函数包：https://docs.influxdata.com/influxdb/v2.0/reference/flux/stdlib/

比如：mean()函数对每个时间窗口内的值求平均值(https://docs.influxdata.com/influxdb/v2.0/reference/flux/stdlib/built-in/transformations/aggregates/mean/)

五、可视化数据

https://docs.influxdata.com/influxdb/v2.0/visualize-data/visualization-types/

支持的可视化类型：

Band （乐队）：显示随时间变化的数据组的上限和下限

guage（仪表盘）：仪表视图中显示时间序列的单个值最新值

graph（图形）：折线图

Graph + Single Stat（图表+单一统计）：以折线图显示指定的时间序列，并将最近的单个值叠加为一个大数值

heatmap（热图）：显示 x 和 y 轴上的数据分布，其中颜色代表不同的数据点浓度

histogram（直方图）：一种查看数据分布的方法。y 轴专用于计数，x 轴分为 bin

mosaic（马赛克）：化显示时间序列数据中的状态变化

scatter（散点图）：视图使用散点图来显示时间序列数据

single stat（单项统计）：将指定时间序列的最新值显示为数值

table（表格视图）：表格视图中显示查询结果

本地制造数据，通过图表数据展示案例：

grafana集成数据展示：

结论：

influxdb控制台提供接入sdk源码，可直接在代码中使用，其他模块可直接在界面操作influxdb，使用体验较好
influxdb可视化图表数量有限，如果图表无法满足需求，可以选择使用grafana展示数据，总体感觉grafana使用起来更舒适，数据显示更清晰
flux刚开始不会写，通过控制台操作图表选择属性或函数，可以生成简单的flux语句

遗留问题

问：V1版本的RP+CQ在V2版本应该怎样使用？

答：

RP存储周期，完全由bucket决定，在创建bucket时需要指定bucket的数据保留时间。

需要注意的是：bucket的数据存储时间并不能随意更换，可以将永久存储的数据改成Retention存储，但是也存在限制；无法将有Retention的数据改成永久存储。

CQ需要使用task代替，InfluxQL需要使用Flux代替。

task示例：每小时执行一次，收集一个小时内的数据，输出到另一个bucket中(可使用内置函数，本案例为了验证功能使用直接输出)






option task = {name: "tast2", every: 1h}





 





from(bucket: "bucket1")





	|> range(start: -task.every)





	|> filter(fn: (r) =>





		(r._measurement == "mem2"))





	|> filter(fn: (r) =>





		(r._field == "used_percent"))





	|> set(key: "_measurement", value: "average3-mem2")





	|> to(org: "test", bucket: "bucket1/mem2-rp")

CQ转Task官方描述：https://docs.influxdata.com/influxdb/v2.0/upgrade/v1-to-v2/migrate-cqs/

Task使用介绍：https://docs.influxdata.com/influxdb/v2.0/process-data/get-started/

问：V2版本数据如何备份？文件拷贝是否可行？

答：

官方提供的备份方式：






//将所有数据备份到一个目录





influx backup /path/to/backup/dir/





 





//将特定存储桶备份到目录





influx backup --bucket example-bucket /path/to/backup/dir/

文件拷贝方式（/var/lib/influxdb）：与V1一致，服务重启时生效。

相比V1 : (1)它在文件层次使用ID区分具体存储桶 (2)它无法在插入过程中更换数据文件，即使更换了也会失效，不过成功启动之后删了它的数据文件，它也不会报错

结论：(1)可以使用官方提供的命令进行冷备份，服务器上备份前需要进行token配置 (2)文件拷贝是可行的，但是必须要重启服务，否则数据将会不准确。

官方描述：https://docs.influxdata.com/influxdb/v2.0/reference/cli/influx/backup/

附录

官网地址：https://docs.influxdata.com/influxdb/v2.0/

它也可集成grafana+echart完成自定义视图：

[转帖]【InfluxDB V2.0】介绍与使用，flux查询、数据可视化的更多相关文章

Superset 0.37 发布——颜值最高的数据可视化平台
Superset 0.37,增加可视化插件,行级权限控制使用Superset已经有一段时间,其良好的体验与丰富的图表功能节省了大量的时间.但是对于权限,自定义图表,图表下载,报警邮件一直没有很好的支 ...
百度——LBS.云 v2.0——创建自己的地理云数据
随着云技术和地理信息(GIS)技术的发展,今年终于进入了.地理分享的新纪元.百度提供了LBS的云存储.真是个不错的功能.下面让我们来看看如何使用吧. 1.注册百度开发者账号(此处略去88个字) 2.创 ...
基于Dapper的开源Lambda扩展LnskyDB 2.0已支持多表查询
LnskyDB LnskyDB是基于Dapper的Lambda扩展,支持按时间分库分表,也可以自定义分库分表方法.而且可以T4生成实体类免去手写实体类的烦恼. 文档地址: https://lining ...
ComponentSpace SAML v2.0 for .NET 使用介绍
下载地址:http://samlsso.codeplex.com/ 以下描叙参考版本为其官网最新版本2.5.0.6.相对2.4版本,2.5有了很大改进,很多接口方法都变了.使用起来更方便,易懂. 广告 ...
【Beta】“北航社团帮”测试报告——小程序v2.0与网页端v1.0
目录测试计划.过程和结果后端测试--单元测试与覆盖率后端测试--压力测试展示部分数据平均数据前端测试--小程序v2.0 授权登录与权限检查新功能的测试兼容性测试性能测试前端测试-- ...
JuCheap V2.0响应式后台管理系统模板正式发布beta版本
JuCheap V1.* 查看地址: http://blog.csdn.net/allenwdj/article/details/49155339 经过半年的努力,JuCheap后台通用响应式管理后台 ...
【JS】heatmap.js v1.0 到 v2.0，详细总结一下:)
前段时间,项目要开发热力图插件,研究了heatmap.js,打算好好总结一下. 本文主要有以下几部分内容: 部分源码理解如何迁移到v2.0 v2.0官方文档译文关于heatmap.js介绍,请看这 ...
开源任务管理平台TaskManagerV2.0介绍及升级说明
上一篇开源任务管理平台TaskManager介绍发布后,有网友联系我看看能不能做个后台管理界面,方便管理系统中所有的任务.由于时间和技术问题1.0版本的时候,新增了一个3分钟读取配置文件动态修改任务的 ...
微信快速开发框架（六）-- 微信快速开发框架（WXPP QuickFramework）V2.0版本上线--源码已更新至github
4月28日,已增加多媒体上传及下载API,对应MediaUploadRequest和MediaGetRequest ------------------------------------------ ...
Restful.Data v2.0发布，谢谢你们的支持和鼓励
v1.0发布后,承蒙各位博友们的热心关注,也给我不少意见和建议,在此我真诚的感谢 @冰麟轻武等朋友,你们的支持和鼓励,是这个开源项目最大的推动力. v2.0在除了细枝末节外,在功能上主要做了一下更新 ...

随机推荐

mysql 数据库定时备份到阿里云盘
仓库地址: gitee:db_backup_script: mysql 数据库定时/实时备份数据库到阿里云盘,备份成功后消息可通知到钉钉群.企业微信群.wxpusher (gitee.com gi ...
C# 将XML转为Word（附VB.NET代码）
本文介绍如何通过C#程序代码方法将XML文件转换为Word文档,包括转为.doc /.docx等格式.并附VB.NET代码,有需要可供参考. 程序中所需必要程序集如下图: ★ 程序集获取:官方地址: ...
C++篇：第四章_数组_知识点大全
C++篇为本人学C++时所做笔记(特别是疑难杂点),全是硬货,虽然看着枯燥但会让你收益颇丰,可用作学习C++的一大利器四.数组 (一)数组标准以数组名作函数参数时,实参数组与形参数组都不必定义长度 ...
Volcano：带你体验容器与批量计算的碰撞的火花
摘要:今年(2020)7月初,Volcano 发布了1.0版本.1.0做为里程碑版本,在Volcano整个规划中起到了承上启下的作用.此次发布的1.0版本支持了GPU共享,作业动态扩缩容,批任务抢占等 ...
震惊！火爆全网的ChatGPT背后使用的数据库居然是……
摘要:ChatGPT承认了自己背后使用的数据库是Cassandra. OpenAI最近发布的AI驱动的智能聊天机器人ChatGPT在互联网上掀起了一阵风暴,热衷于尝试这一新AI成果的网民不在少数.Ch ...
有了这个算法，图像上文字擦除再也用不上PS了
摘要:本文介绍几篇关于自然场景下文字擦除的论文工作. 图像文字擦除方法给定一幅自然场景图像,只将图像中文字区域抹去而不改动其他区域像素值的方法称为文字擦除算法.该方法在隐私保护,身份信息篡改,数据增 ...
带你梳理Roach全量恢复的整体流程
摘要:本文将梳理Roach全量恢复的整体流程,描述Roach集群全量备份场景的运转机制. 数据备份恢复是保护数据安全的重要手段之一.Roach工具支持多种备份恢复类型,例如集群级的物理备份,表级备份的 ...
DevUI开源经验分享：从0到1开始运营你的开源项目
摘要:DevUI是面向企业中后台产品的开源前端解决方案,于2019年6月正式在GitHub开源,从当时的无人问津到去年8月累计1000 Star,再到现如今上千名社区成员.上百位贡献者.达成了3000 ...
40个问题让你快速掌握Java多线程的精髓
摘要:多线程可以理解为在同一个程序中能够同时运行多个不同的线程来执行不同的任务,这些线程可以同时利用CPU的多个核心运行. 多线程可以理解为在同一个程序中能够同时运行多个不同的线程来执行不同的任务,这 ...
5步带你掌握工作流Activiti框架的使用
摘要:本文通过一个工作流Activiti框架的具体使用示例,具体详尽的介绍了工作流Activiti框架的使用方式. 本文分享自华为云社区<一个使用示例,五个操作步骤!从此轻松掌握项目中工作流的开 ...

[转帖]【InfluxDB V2.0】介绍与使用，flux查询、数据可视化