openfalcon源码分析之transfer
本节内容
- transfer功能
- transfer接收数据来源
- transfer数据去向
- transfer的一致性hash
- transfer的一致性hash key的计算
- transfer源码分析
- 2.1 初始化连接池,发送队列
- 2.2 初始化rpc和socket接收端
- 2.3 初始化http服务
- transfer设计优缺点
- 优点:
- 缺点:
1. transfer功能
transfer模块的作用是接收所有被监控服务器上发送过来的数据进行一些判断和处理之后转发至后面的graph和judge模块。
transfer接收数据来源
transfer主要从四个来源接收数据:
- agent采集的数据
- agent执行用户自定义插件返回的数据
- client-library,业务系统内嵌的监控收集数据并上报
- 用户自己产生的一些自定义数据,可通过RPC接口上报
transfer数据去向
transfer设计时支持三种数据后端,分别是:judge、graph、OpenTSDB.传输给judge是为了对收集上来的数据进行实时告警判断,graph是使用RRD技术存储监控数据的组件,OpenTSDB是开源的时间序列数据存储服务。
transfer的一致性hash
transfer的后端judge和graph为了提供高可用及负载均衡,都可能部署了多节点,transfer使用一致性hash对数据映射到不同节点。而OpenTSDB没有使用一致性hash,只提供了一个接口写数据。
transfer的一致性hash key的计算
transfer通过接收的数据的endpoint+metric+排序后的tags组成的pk作为key,进行hash(进行crc32循环冗余校验),最后获取该数据应该发送到的node。下面是pk生成的源码:
func PK(endpoint, metric string, tags map[string]string) string {
if tags == nil || len(tags) == 0 {
return fmt.Sprintf("%s/%s", endpoint, metric)
}
return fmt.Sprintf("%s/%s/%s", endpoint, metric, SortedTags(tags))
}
2. transfer源码分析
transfer源码分析需要结合数据流动的方向来进行梳理。
2.1 初始化连接池,发送队列
初始化时首先初始化连接池,然后初始化发送队列,最后初始化一致性hash环。
初始化完成之后开始执行发送数据任务startSendTasks将会定期将队列中的数据发送到不同的后端,至于最后的startSenderCron是开启定时任务,记录不同队列发送数据的情况。
- 创建连接池时,judge集群是循环获取judge集群中的每一个node,生成一个node连接池组成的连接池。graph集群是循环集群中的每个node,每个node可能又有多个主机地址,最后把这所有的地址进行去重后创建一个大的连接池。
- 创建发送队列时,judge根据每个node创建一个
safe list。graph是两层循环,拼接成node+addr创建一个safe list。tsdb如果开启,创建了一个safe list。 - 调用
initNodeRings创建一致性hash环时,只获取了judge和graph的node名称,通过名称生成hash值,再生成hash环。 - 调用
startSendTasks发送数据时,对于judge,循环每个judge node队列中的数据,将其发送到对应的node中,对于graph node队列,将循环该node列表中的所有地址,每个地址将接收到一份数据,这样,同一份数据被拷贝了len(node.addr)份发送。
// 初始化数据发送服务, 在main函数中调用
func Start() {
// 初始化默认参数
MinStep = g.Config().MinStep
if MinStep < 1 {
MinStep = 30 //默认30s
}
//
initConnPools()
initSendQueues()
initNodeRings()
// SendTasks依赖基础组件的初始化,要最后启动
startSendTasks()
startSenderCron()
log.Println("send.Start, ok")
}
2.2 初始化rpc和socket接收端
transfer接收数据有三种方式,除了Http提供数据接收之外,另两种,一种是使用golang的rpc模块,另一种是使用socket直接传输数据,两种方式将在下面介绍:
- RPC方式:
| rpc方法 | 接收数据 | 作用 |
|---|---|---|
| Ping | 空 | 检测transfer是否存活,code=0说明正常,code=1说明请求异常 |
| Update | MetricValue列表 |
将上报的数据进行简单处理,检测是否满足格式条件,最后将数据发送到队列中 |
- socket方式:
socket方式提供两个接口,一个是quit,用来退出数据发送,另一个是update,上报数据,数据之间用\n进行分割。
| socket指令 | 接收数据 | 作用 |
|---|---|---|
| quit | 空 | 退出该次处理 |
| update | 上报数据,用\n分隔 |
上报数据进行处理后发送到对应的发送队列中 |
在open-falcon中基本都是使用rpc和http进行传输数据,这里添加了socket支持,可能是为了用户使用其他语言写的客户端,发送一些自定义的监控数据的上报,基本不使用。
2.3 初始化http服务
http服务含有一个上报数据的接口,是"/api/push",该接口可以接受其他服务push上来的数据,其他主要是一些关于transfer统计信息,状态信息等的获取。
3. transfer设计优缺点
优点:
- transfer将数据集中汇总,再分散到不同的后端处理程序,相当于充当了数据集散地的作用
缺点:
- transfer提供的数据接入方式除了
golang能用的rpc和Http以外,另外提供的socket感觉不友好,希望能够改进以支持其他语言编写的服务能够比较方便的上报数据。
openfalcon源码分析之transfer的更多相关文章
- openfalcon源码分析之graph
openfalcon源码分析之graph 本节内容 graph功能 graph源码分析 2.1 graph中重要的数据结构 2.2 graph的简要流程图 2.3 graph处理数据过程 2.4 gr ...
- openfalcon源码分析之Judge
openfalcon源码分析之Judge 本节内容 Judge功能 源码分析 设计优缺点 1. Judge功能 在open-falcon中,Judge模块的功能是通过从HBS上同步告警的strateg ...
- openfalcon源码分析之hbs
openfalcon源码分析之hbs 本节内容 hbs功能 hbs源码分析 hbs设计优劣 1. hbs功能 hbs在整个open-falcon项目中承担的角色就是连接数据库,作为数据库缓存,缓存配置 ...
- openfalcon源码分析之agent
本节内容 agent功能 1.1 agent上报数据 1.2 agent与HBS同步 1.3 agent Http服务 agent源码分析 2.1 初始化config配置 2.2 初始化根目录,本地I ...
- Java并发包源码分析
并发是一种能并行运行多个程序或并行运行一个程序中多个部分的能力.如果程序中一个耗时的任务能以异步或并行的方式运行,那么整个程序的吞吐量和可交互性将大大改善.现代的PC都有多个CPU或一个CPU中有多个 ...
- 【JUC】JDK1.8源码分析之ConcurrentHashMap(一)
一.前言 最近几天忙着做点别的东西,今天终于有时间分析源码了,看源码感觉很爽,并且发现ConcurrentHashMap在JDK1.8版本与之前的版本在并发控制上存在很大的差别,很有必要进行认真的分析 ...
- 【JUC】JDK1.8源码分析之SynchronousQueue(九)
一.前言 本篇是在分析Executors源码时,发现JUC集合框架中的一个重要类没有分析,SynchronousQueue,该类在线程池中的作用是非常明显的,所以很有必要单独拿出来分析一番,这对于之后 ...
- HashMap实现原理及源码分析
哈希表(hash table)也叫散列表,是一种非常重要的数据结构,应用场景及其丰富,许多缓存技术(比如memcached)的核心其实就是在内存中维护一张大的哈希表,而HashMap的实现原理也常常出 ...
- Java集合源码分析(七)HashMap<K, V>
一.HashMap概述 HashMap基于哈希表的 Map 接口的实现.此实现提供所有可选的映射操作,并允许使用 null 值和 null 键.(除了不同步和允许使用 null 之外,HashMap ...
随机推荐
- python 面向对象 isinstance
查看某个对象是否 这个类实例 是返回True 否则返回False class Foo(object): pass obj = Foo() class Boo(object): pass print(i ...
- (转)Spring Boot中使用AOP统一处理Web请求日志
AOP为Aspect Oriented Programming的缩写,意为:面向切面编程,通过预编译方式和运行期动态代理实现程序功能的统一维护的一种技术.AOP是Spring框架中的一个重要内容,它通 ...
- 数据结构顺序表Java实现
Java实现顺序表算法:1:首先我们需要定义我们的接口,关于顺序表的一些基本的操作:顺序表中的操作都有增删改查. //List接口 public interface IList { //返回线性表的大 ...
- flask应用中取得config的配置
from flask import current_app config = current_app.config SITE_DOMAIN = config.get('SITE_DOMAIN')
- DB开发之postgresql
1.环境变量配置: PGLIB=/usr/local/pgsql/lib PGDATA=$HOME/data PATH=$PATH:/usr/local/pgsql/bin MANPATH=$MANP ...
- mongodb的存储引擎
mongodb版本为3.4 mongodb存储引起的一些概述 存储引擎是MongoDB的核心组件,负责管理数据如何存储在硬盘和内存上.从MongoDB 3.2 版本开始,MongoDB 支持多数据存储 ...
- poj3421 X-factor Chains(重复元素的全排列)
poj3421 X-factor Chains 题意:给定正整数$x(x<=2^{20})$,求$x$的因子组成的满足任意前一项都能整除后一项的序列的最大长度,以及满足最大长度的子序列的个数. ...
- Codeforces Round #413, rated, Div. 1 + Div. 2 C. Fountains(贪心 or 树状数组)
http://codeforces.com/contest/799/problem/C 题意: 有n做花园,有人有c个硬币,d个钻石 (2 ≤ n ≤ 100 000, 0 ≤ c, d ≤ 100 ...
- POJ 3468 A Simple Problem with Integers(线段树:区间更新)
http://poj.org/problem?id=3468 题意: 给出一串数,每次在一个区间内增加c,查询[a,b]时输出a.b之间的总和. 思路: 总结一下懒惰标记的用法吧. 比如要对一个区间范 ...
- Codeforces Beta Round #57 (Div. 2) A,B,C,D,E
A. Ultra-Fast Mathematician time limit per test 2 seconds memory limit per test 256 megabytes input ...