62-kafka 安装 : flume 整合 kafka

一.kafka 安装

1.下载

http://kafka.apache.org/downloads.html

2. 解压

tar -zxvf kafka_2.10-0.8.1.1.tgz

3.启动服务

3.1 首先启动zookeeper服务

bin/zookeeper-server-start.sh config/zookeeper.properties

3.2启动Kafka

bin/kafka-server-start.sh config/server.properties >/dev/null 2>&1 &

3.3创建topic

创建一个"test"的topic，一个分区一个副本

bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test

查看主题

bin/kafka-topics.sh --list --zookeeper localhost:2181

查看主题详情

bin/kafka-topics.sh --describe --zookeeper localhost:2181 --topic test

删除主题

bin/kafka-topics.sh --zookeeper localhost:2181 --delete --topic test

二. flume -整合 --kafka

1.启动 flume (配置文件)

flume-ng agent --conf conf -f /bigdata/flume-1.6/conf/kafka.conf -name producer -Dlume.root.logger=DEBUG,console

2.启动 kafka

bin/zookeeper-server-start.sh config/zookeeper.properties

bin/kafka-server-start.sh config/server.properties >/dev/null 2>&1 &

3. 发送消息

echo 'wo l g q .' |nc -u hadoop1 8285

4.--启动consumer查看是否接受到信息

bin/kafka-console-consumer.sh --zookeeper localhost:2181 --topic test --from-beginning

三.flume - kafka 错误



java.lang.ClassNotFoundException: org.apache.flume.plugins.KafkaSink

jar -tf flume-ng-kafka-sink-1.6.0.jar | fgrep KafkaSink，你就能确定这里面有没有KafkaSink了

producer.sinks.sink1.type = org.apache.flume.sink.kafka.KafkaSink

　　(一定要参考官网配置 agent)

　　flume 官网

　　

四. kafka.conf

producer agent 配置

#memory channel called ch1 on agent1

producer.channels.channel1.type = memory

# Define an Avro source called avro-source1 on agent1 and tell it

# to bind to 0.0.0.0:41414. Connect it to channel ch1.

producer.sources.source1.channels = channel1

producer.sources.source1.type = syslogudp

producer.sources.source1.bind = 127.0.0.1

producer.sources.source1.port = 8285

# Define a logger sink that simply logs all events it receives

# and connect it to the other end of the same channel.

producer.sinks.sink1.channel = channel1

producer.sinks.sink1.type = org.apache.flume.sink.kafka.KafkaSink

producer.sinks.sink1.brokerList=127.0.0.1:9092

producer.sinks.sink1.topic=test

producer.sinks.sink1.batchSize=20

# Finally, now that we've defined all of our components, tell

# agent1 which ones we want to activate.

producer.channels = channel1

producer.sources = source1

producer.sinks = sink1

hadoop 之 kafka 安装与 flume -> kafka 整合的更多相关文章

Kafka安装及开启SASL_PLAINTEXT认证（用户名和密码认证）
前些日子要封装一个kafka的客户端驱动,配置了下kafka环境,发现配置复杂度完爆rabbitmq很多倍啊,而且发布订阅模式使用起来也很麻烦,可能就胜在分布式了吧. kafka需要java环境,自行 ...
Kafka安装与配置（windows）
作者:灬花儿灬出处:http://www.cnblogs.com/flower1990/ 本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则 ...
kafka安装和使用
kafka安装和启动 kafka的背景知识已经讲了很多了,让我们现在开始实践吧,假设你现在没有Kafka和ZooKeeper环境. Step 1: 下载代码下载0.10.0.0版本并且解压它. &g ...
Flume+Kafka+Storm+Hbase+HDSF+Poi整合
Flume+Kafka+Storm+Hbase+HDSF+Poi整合需求: 针对一个网站,我们需要根据用户的行为记录日志信息,分析对我们有用的数据. 举例:这个网站www.hongten.com(当 ...
flume+kafka+spark streaming整合
1.安装好flume2.安装好kafka3.安装好spark4.流程说明: 日志文件->flume->kafka->spark streaming flume输入:文件 flume输 ...
Flume+Kafka+Storm整合
Flume+Kafka+Storm整合 1. 需求: 有一个客户端Client可以产生日志信息,我们需要通过Flume获取日志信息,再把该日志信息放入到Kafka的一个Topic:flume-to-k ...
Flume+Kafka整合
脚本生产数据---->flume采集数据----->kafka消费数据------->storm集群处理数据日志文件使用log4j生成,滚动生成! 当前正在写入的文件在满足一定的数 ...
Flume+Kafka+storm的连接整合
Flume-ng Flume是一个分布式.可靠.和高可用的海量日志采集.聚合和传输的系统. Flume的文档可以看http://flume.apache.org/FlumeUserGuide.html ...
Flume简介与使用（三）——Kafka Sink消费数据之Kafka安装
前面已经介绍了如何利用Thrift Source生产数据,今天介绍如何用Kafka Sink消费数据. 其实之前已经在Flume配置文件里设置了用Kafka Sink消费数据 agent1.sinks ...

随机推荐

Guava 学习计划
Guava这个框架,我想参加过工作了Java程序员都应该不会陌生,这个框架甚至比Apache Commons Lang3框架更受Java程序员的喜欢.但是遗憾的是怎么优秀和成熟的框架,在国内我居然没有 ...
Codeforces Intel Code Challenge Final Round (Div. 1 + Div. 2, Combined) B. Batch Sort（暴力）
传送门 Description You are given a table consisting of n rows and m columns. Numbers in each row form a ...
POJ 1182 食物链（带权并查集）
传送门食物链 Time Limit: 1000MS Memory Limit: 10000K Total Submissions: 65579 Accepted: 19336 Descri ...
Linux 内核高-低端内存设置代码跟踪（ARM构架）
对于ARM中内核如何在启动的时候设置高低端内存的分界线(也是逻辑地址与虚拟地址分界线(虚拟地址)减去那个固定的偏移),这里我稍微引导下(内核分析使用Linux-3.0): 首先定位设置内核虚拟地址起始 ...
机器学习笔记—Logistic回归
本文申明:本系列笔记全部为原创内容,如有转载请申明原地址出处.谢谢序言:what is logistic regression? Logistics 一词表示adj.逻辑的;[军]后勤学的n.[逻] ...
Blast本地化
转载]Blast本地化:使用Blastall进行数据库比对 (2012-02-13 21:25:31) 用blastall进行序列比对 blastall是最常用的blast程序之一,其功能非常强大 ...
Emgu学习之（四）——图像阈值
http://www.cnblogs.com/CoverCat/p/5043833.html Visual Studio Community 2015 工程和代码:http://pan.baidu.c ...
细说Linux下软件包的安装与管理
一源码安装方式由于linux操作系统开放源代码,因而在其上安装的软件大部分也都是开源软件,例如apache.tomcat.php等软件.开源软件基本都提供源码下载,源码安装的方式:源码安 ...
Eclipse搭建Python开发环境+Python中文处理
1.基本需求 1.Eclipse 集成开发环境下载 http://115.com/file/c2vz7io5 JDK6下载 http://115.com/file/c2vz7idq 2. ...
自然语言15_Part of Speech Tagging with NLTK
https://www.pythonprogramming.net/part-of-speech-tagging-nltk-tutorial/?completed=/stemming-nltk-tut ...

hadoop 之 kafka 安装与 flume -> kafka 整合