flume kafka 配置指南

1、官方网站也有配置：

https://flume.apache.org/FlumeUserGuide.html#kafka-source

2、clodera 官方配置

https://www.cloudera.com/documentation/kafka/2-0-x/topics/kafka_flume.html

 tier1.sources  = source1

 tier1.channels = channel1

 tier1.sinks = sink1

 tier1.sources.source1.type = org.apache.flume.source.kafka.KafkaSource

 tier1.sources.source1.zookeeperConnect = zk01.example.com:

 tier1.sources.source1.topic = weblogs

 tier1.sources.source1.groupId = flume

 tier1.sources.source1.channels = channel1

 tier1.sources.source1.interceptors = i1

 tier1.sources.source1.interceptors.i1.type = timestamp

 tier1.sources.source1.kafka.consumer.timeout.ms = 

 tier1.channels.channel1.type = memory

 tier1.channels.channel1.capacity =

 tier1.channels.channel1.transactionCapacity = 

 tier1.sinks.sink1.type = hdfs

 tier1.sinks.sink1.hdfs.path = /tmp/kafka/%{topic}/%y-%m-%d

 tier1.sinks.sink1.hdfs.rollInterval =

 tier1.sinks.sink1.hdfs.rollSize =

 tier1.sinks.sink1.hdfs.rollCount =

 tier1.sinks.sink1.hdfs.fileType = DataStream

 tier1.sinks.sink1.channel = channel1

tier1.sources  = source1

 tier1.channels = channel1

 tier1.sinks = sink1

 tier1.sources.source1.type = exec

 tier1.sources.source1.command = /usr/bin/vmstat

 tier1.sources.source1.channels = channel1

 tier1.channels.channel1.type = memory

 tier1.channels.channel1.capacity =

 tier1.channels.channel1.transactionCapacity = 

 tier1.sinks.sink1.type = org.apache.flume.sink.kafka.KafkaSink

 tier1.sinks.sink1.topic = sink1

 tier1.sinks.sink1.brokerList = kafka01.example.com:,kafka02.example.com:

 tier1.sinks.sink1.channel = channel1

 tier1.sinks.sink1.batchSize =

tier1.sources = source1

tier1.channels = channel1

tier1.sinks = sink1

tier1.sources.source1.type = exec

tier1.sources.source1.command = /usr/bin/vmstat

tier1.sources.source1.channels = channel1

tier1.channels.channel1.type = org.apache.flume.channel.kafka.KafkaChannel

tier1.channels.channel1.capacity =

tier1.channels.channel1.transactionCapacity =

tier1.channels.channel1.brokerList = kafka02.example.com:,kafka03.example.com:

tier1.channels.channel1.topic = channel2

tier1.channels.channel1.zookeeperConnect = zk01.example.com:

tier1.channels.channel1.parseAsFlumeEvent = true

tier1.sinks.sink1.type = hdfs

tier1.sinks.sink1.hdfs.path = /tmp/kafka/channel

tier1.sinks.sink1.hdfs.rollInterval =

tier1.sinks.sink1.hdfs.rollSize =

tier1.sinks.sink1.hdfs.rollCount =

tier1.sinks.sink1.hdfs.fileType = DataStream

tier1.sinks.sink1.channel = channel1

总结：

这样配置以后我们可以通过监控，或者消费kafka console打印效果

/bin/kafka-console-consumer.sh --bootstrap-server master:9092 --topic topicTest2 --from-beginning

flume kafka 配置指南的更多相关文章

Scala + Thrift+ Zookeeper+Flume+Kafka配置笔记
1. 开发环境 1.1. 软件包下载 1.1.1. JDK下载地址 http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downl ...
Flume - Kafka日志平台整合
1. Flume介绍 Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集.聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据:同时,Flume提供 ...
Kafka权威指南——broker的常用配置
前面章节中的例子,用来作为单个节点的服务器示例是足够的,但是如果想要把它应用到生产环境,就远远不够了.在Kafka中有很多参数可以控制它的运行和工作.大部分的选项都可以忽略直接使用默认值就好,遇到一些 ...
【转】flume+kafka+zookeeper 日志收集平台的搭建
from:https://my.oschina.net/jastme/blog/600573 flume+kafka+zookeeper 日志收集平台的搭建收藏 jastme 发表于 10个月前阅 ...
hadoop 之 kafka 安装与 flume -> kafka 整合
62-kafka 安装 : flume 整合 kafka 一.kafka 安装 1.下载 http://kafka.apache.org/downloads.html 2. 解压 tar -zxvf ...
Flume+Kafka+Strom基于伪分布式环境的结合使用
目录: 一.Flume.Kafka.Storm是什么,如何安装? 二.Flume.Kafka.Storm如何结合使用? 1) 原理是什么? 2) Flume和Kafka的整合 3) Kafka和St ...
【Flume NG用户指南】（1）设置
作者:周邦涛(Timen) Email:zhoubangtao@gmail.com 转载请注明出处: http://blog.csdn.net/zhoubangtao/article/details ...
【Flume NG用户指南】（2）构造
作者:周邦涛(Timen) Email:zhoubangtao@gmail.com 转载请注明出处: http://blog.csdn.net/zhoubangtao/article/details ...
最新 Zookeeper + Flume + Kafka 简易整合教程
在大数据领域有很多耳熟能详的框架,今天要介绍的就是 zookeeper.flume.kafka.因为平时是做数据接入的,所以对这些实时的数据处理系统不是很熟悉.通过官网的简要介绍,搭建了一套简要的平台 ...

随机推荐

[UGUI]渲染层级关系
参考链接: http://blog.csdn.net/meegomeego/article/details/42060389 Unity中的渲染顺序自上而下大致可以分为三层: 1.Camera层.可以 ...
理解 with递归调用 Sqlserver 树查询
--with用法 --可以这么理解 with SQL语句变量或者叫临时表名 as( SQL语句 ) select * from SQL语句变量或者叫临时表名 --递归调用 with CTE as( s ...
虚拟机安装 gentoo 的时候，通过 filezilla 上传 stage3 文件
最近需要在虚拟机里面安装gentoo,但因为虚拟机里面自动下载的 stage3 太慢了,所以也在寻找解决办法,最终发现 filezilla 是个好办法. 主要参考 https://www.linux ...
【HQL】常用函数
CONCAT_WS(separator, str1, str2,...) 多列转1列,以分割符分割使用场景: 1.多列在一列显示: 2.多列转多行作为辅助,结合split和explode使用 SEL ...
python3封装Api接口
注:本篇的代码和语法基于Python3.5环境,下面将用到Python 的Flask框架封装接口主要讲静态接口(无参数传入).动态接口(有参数传入,不同参数返回的信息不同).针对动态接口有三种传参方 ...
RDD、DataFrame、Dataset
RDD是Spark建立之初的核心API.RDD是不可变分布式弹性数据集,在Spark集群中可跨节点分区,并提供分布式low-level API来操作RDD,包括transformation和actio ...
spark sql 中的结构化数据
1. 连接mysql 首先需要把mysql-connector-java-5.1.39.jar 拷贝到 spark 的jars目录里面: scala> import org.apache.spa ...
Flex 画图
<?xml version="1.0" encoding="utf-8"?> <mx:Application xmlns:mx="h ...
Docker 在 Linux 平台的安装以及一些常见命令
1,添加,清理 yum 源,查看应用列表 1.1,yum install -y epel-release 1.2,yum clean all 1.3,yum list (可以不运行) 2,安装, 启 ...
gridEh的bug
grideh的bug,delphi和c++builder都存在. RAD自带的原始grid控件是好的. procedure TForm12.DBGridEh2ColExit(Sender: TObje ...

flume kafka 配置指南

flume kafka 配置指南的更多相关文章

随机推荐

热门专题