Flume介绍

http://flume.apache.org/FlumeUserGuide.html

一、Flume架构图

含义
Source	规定收集数据的来源
Channel	相当于一个管道，连接source和sink
Sink	flume agent收集到数据后，数据写到哪里

使用Flume，就是定义好source,channel, sink, 它负责监控Linux文件系统，并将文件写入HDFS中

二、多个Flume整合

注意启动顺序！！！

先启动node2,后启动node1（先启动后面的Flume2, 在启动前面的Flume1）

Nginx集群，每一个Nginx对应多个web server,再每一个web server安装Flume1,Flume2,Flume3...然后各个Flume交给总的Flume Agent,写入到HDFS中

三、Flume中Source, Channel, Sink的类型

Flume Source

Source类型 | 说明

Avro Source | 支持Avro协议（实际上是Avro RPC），内置支持

Thrift Source | 支持Thrift协议，内置支持

Exec Source | 基于Unix的command在标准输出上生产数据，监控文件的变化

JMS Source | 从JMS系统（消息、主题）中读取数据

Spooling Directory Source | 监控指定目录内数据变更，监控目录的变化

Twitter 1% firehose Source|通过API持续下载Twitter数据，试验性质

Netcat Source | 监控某个端口，将流经端口的每一个文本行数据作为Event输入

Sequence Generator Source | 序列生成器数据源，生产序列数据

Syslog Sources | 读取syslog数据，产生Event，支持UDP和TCP两种协议

HTTP Source | 基于HTTP POST或GET方式的数据源，支持JSON、BLOB表示形式

Legacy Sources | 兼容老的Flume OG中Source（0.9.x版本）

Flume Channel

Channel类型说明

Memory Channel | Event数据存储在内存中

JDBC Channel | Event数据存储在持久化存储中，当前Flume Channel内置支持Derby

File Channel | Event数据存储在磁盘文件中

Spillable Memory Channel | Event数据存储在内存中和磁盘上，当内存队列满了，会持久化到磁盘文件

Pseudo Transaction Channel | 测试用途

Custom Channel | 自定义Channel实现

Flume Sink

Sink类型说明

HDFS Sink | 数据写入HDFS

Logger Sink | 数据写入日志文件

Avro Sink | 数据被转换成Avro Event，然后发送到配置的RPC端口上

Thrift Sink | 数据被转换成Thrift Event，然后发送到配置的RPC端口上

IRC Sink | 数据在IRC上进行回放

File Roll Sink | 存储数据到本地文件系统

Null Sink | 丢弃到所有数据

HBase Sink | 数据写入HBase数据库

Morphline Solr Sink | 数据发送到Solr搜索服务器（集群）

ElasticSearch Sink | 数据发送到Elastic Search搜索服务器（集群）

Kite Dataset Sink | 写数据到Kite Dataset，试验性质的

Custom Sink | 自定义Sink实现

Flume介绍的更多相关文章

Flume介绍与安装
搭建环境部署节点操作系统为CentOS,防火墙和SElinux禁用,创建了一个shiyanlou用户并在系统根目录下创建/app目录,用于存放 Hadoop等组件运行包.因为该目录用于安装hadoo ...
flume介绍与原理(一)
1 .背景 flume是由cloudera软件公司产出的可分布式日志收集系统,后与2009年被捐赠了apache软件基金会,为hadoop相关组件之一.尤其近几年随着flume的不断被完善以及升级版本 ...
整体认识flume：Flume介绍、分布式安装、常见问题及解决方案
问题导读 1.什么是flume? 2.flume包含哪些组件? 3.Flume在读取utf-8格式的文件时会出现解析不了时间戳,该如何解决? Flume是一个分布式.可靠.和高可用的海量日志采集.聚合 ...
flume介绍及应用
版权声明:本文为yunshuxueyuan原创文章.如需转载请标明出处: http://www.cnblogs.com/sxt-zkys/QQ技术交流群:299142667 flume的概念 1. ...
Flume介绍安装使用
APache Flume官网:http://flume.apache.org/releases/content/1.9.0/FlumeUserGuide.html#memory-channel 目录 ...
flume介绍以及环境的部署
收集.聚合时间流数据分布式框架.通常用户log数据采用ad-hoc方案,明显有点如下: 可靠的.可伸缩.可管理.可定制.高性能声名式配置,可以动态配置提供上下文路由功能支持负载均衡和故障转移 ...
分布式日志收集系统- Cloudera Flume 介绍
Flume是Cloudera提供的日志收集系统,具有分布式.高可靠.高可用性等特点,对海量日志采集.聚合和传输, Flume支持在日志系统中定制各类数据发送方, 同时,Flume提供对数据进行 ...
具体说明 Flume介绍、安装和配置
社论: 本文总结"Hadoop生态系统"中的当中一员--Apache Flume 写在前面二: 所用软件说明: 一.什么是Apache Flume 官网:Flume is a di ...
具体图解 Flume介绍、安装配置
写在前面一: 本文总结"Hadoop生态系统"中的当中一员--Apache Flume 写在前面二: 所用软件说明: 一.什么是Apache Flume 官网:Flume is a ...

随机推荐

Linux(CentOS7.1)修改默认yum源为国内的阿里云yum源
官方的yum源在国内访问效果不佳. 需要改为国内比较好的阿里云或者网易的yum源修改方式: 下载wget yum install wget -y echo 备份当前的yum源 mv /etc/yum ...
Qt编写QUI皮肤生成器
用Qt写项目写多了,为了满足不同客户的需求,需要定制不同样式的界面,QUI皮肤生成器应运而生.思考这个工具的架构花了一年时间,如何从复杂的配色方案中提取出共性,然后将共性转为具体的QSS文件.思考架构 ...
JMeter集合点
位置:添加--> 定时器-->Synchronizing Timer 注意:集合点放在所有操作之前. 假设线程组线程数设置的是50个,那么希望50个都准备好一块上,那么集合点中 ...
PHP按行读取文件去掉换行符"\n"
第一种: $content=str_replace("\n","",$content); echo $content; 或者: $content=str_rep ...
CheckForIllegalCrossThreadCalls = false
多线程程序中,新创建的线程不能访问UI线程创建的窗口控件,这时如果想要访问窗口的控件,发现无法对其控制. 这时可将窗口构造函数中的CheckForIllegalCrossThreadCalls设置为f ...
SpringCloud学习笔记(6)——Eureka高可用
参考Spring Cloud官方文档第12章12.3.12.5.12.6小节 12.3 High Availability, Zones and Regions 默认情况下,每一个Eureka服务器同 ...
JAVA中的设计模式三（策略模式）
问题: 如何让算法和对象分开来,使得算法可以独立于使用它的客户而变化? 方案: 把一个类中经常改变或者将来可能改变的部分提取出来,作为一个接口,然后在类中包含这个对象的实例,这样类的实例在运行时就 ...
win10安装Tensorflow
win10安装Tensorflow 前提: 保证你的pip>=8.1版本否则利用python -m pip install -U pip 进行升级,或下载pip源文件确定你的显卡是否支持c ...
JavaScript(jquery)实现二级菜单联动
为什么写这篇随笔? 二级菜单的联动一直是我心中一块石头,犹记得大一的时候只会用一点的Dreamweaver,当时做二级菜单难受啊,啥都不会,网上找了些资料,也看不懂别人的代码更别说用起来了前些日子. ...
【转载】Linux cgroup资源隔离各个击破之 - cpu隔离1
Linux cgroup 有两个子系统支持CPU隔离.一个是cpu子系统,另一个是cpuset子系统. cpu子系统根据进程设置的调度属性,选择对应的CPU资源调度方法 .1. 完全公平调度 Comp ...

Flume介绍

Flume介绍

一、Flume架构图

二、多个Flume整合

三、Flume中Source, Channel, Sink的类型

Flume介绍的更多相关文章

随机推荐

热门专题