flume+kafka+spark streaming整合

1.安装好flume
2.安装好kafka
3.安装好spark
4.流程说明:
　　日志文件->flume->kafka->spark streaming
　　flume输入:文件
　　flume输出:kafka的输入
　　kafka输出:spark 输入
5.整合步骤:
　　(1).将插件jar拷贝到flume的lib目录下
　　　　a. flumeng-kafka-plugin.jar
　　　　b. metrics-annotation-2.2.0.jar

　　(2).将配置文件producer.properties拷贝到flume的conf目录下
　　　　配置文件内容如下:
　　　　　　#agentsection
　　　　　　producer.sources=s
　　　　　　producer.channels=c
　　　　　　producer.sinks=r

　　　　　　#sourcesection
　　　　　　producer.sources.s.type=exec
　　　　　　producer.sources.s.command=tail -f -n+1 /opt/apache-flume-1.6.0/data/testFlumeKafka.txt
　　　　　　producer.sources.s.channels=c

　　　　　　# Eachsink's type must be defined
　　　　　　producer.sinks.r.type=org.apache.flume.plugins.KafkaSink
　　　　　　producer.sinks.r.metadata.broker.list=namenode:19092,datanode1:19092,datanode2:19092
　　　　　　producer.sinks.r.partition.key=0
　　　　　　producer.sinks.r.partitioner.class=org.apache.flume.plugins.SinglePartition
　　　　　　producer.sinks.r.serializer.class=kafka.serializer.StringEncoder
　　　　　　producer.sinks.r.request.required.acks=0
　　　　　　producer.sinks.r.max.message.size=1000000
　　　　　　producer.sinks.r.producer.type=sync
　　　　　　producer.sinks.r.custom.encoding=UTF-8
　　　　　　producer.sinks.r.custom.topic.name=test //需建好对应topic

　　　　　　#Specifythe channel the sink should use
　　　　　　producer.sinks.r.channel=c

　　　　　　# Eachchannel's type is defined.
　　　　　　producer.channels.c.type=memory
　　　　　　producer.channels.c.capacity=1000
　　　　　　producer.channels.c.transactionCapacity=100

　　　　(3).启动flume-ng
　　　　　　命令如下:flume-ng agent -c . -f /opt/apache-flume-1.6.0/conf/producer.conf -n producer

　　　　(4).启动kafka-server
　　　　　　命令如下:bin/kafka-server-start.sh config/server.properties

　　　　(5).启动kafka-consumer(默认已经创建了test topic)
　　　　　　命令如下:bin/kafka-console-consumer.sh --zookeeper namenode:12181,datanode1:12181,datanode2:12181 --topic test --from-beginning

　　　　(6).启动spark
　　　　　　命令如下:sbin/start-all.sh

　　　　(7).运行spark streaming Demo
　　　　　　命令如下:run-example org.apache.spark.examples.streaming.JavaKafkaWordCount namenode:12181 test-consumer-group test 3 >> test.log

　　　　(8).在对应的日志文件中输入内容,则可以在test.log文件看到单词计数的结果

flume+kafka+spark streaming整合的更多相关文章

日志=>flume=>kafka=>spark streaming=>hbase
日志=>flume=>kafka=>spark streaming=>hbase 日志部分 #coding=UTF-8 import random import time ur ...
demo2 Kafka+Spark Streaming+Redis实时计算整合实践 foreachRDD输出到redis
基于Spark通用计算平台,可以很好地扩展各种计算类型的应用,尤其是Spark提供了内建的计算库支持,像Spark Streaming.Spark SQL.MLlib.GraphX,这些内建库都提供了 ...
Spark学习之路（十六）—— Spark Streaming 整合 Kafka
一.版本说明 Spark针对Kafka的不同版本,提供了两套整合方案:spark-streaming-kafka-0-8和spark-streaming-kafka-0-10,其主要区别如下: s ...
Spark学习之路（十五）—— Spark Streaming 整合 Flume
一.简介 Apache Flume是一个分布式,高可用的数据收集系统,可以从不同的数据源收集数据,经过聚合后发送到分布式计算框架或者存储系统中.Spark Straming提供了以下两种方式用于Flu ...
Spark 系列（十五）—— Spark Streaming 整合 Flume
一.简介 Apache Flume 是一个分布式,高可用的数据收集系统,可以从不同的数据源收集数据,经过聚合后发送到分布式计算框架或者存储系统中.Spark Straming 提供了以下两种方式用于 ...
Spark 系列（十六）—— Spark Streaming 整合 Kafka
一.版本说明 Spark 针对 Kafka 的不同版本,提供了两套整合方案:spark-streaming-kafka-0-8 和 spark-streaming-kafka-0-10,其主要区别如下 ...
Spark Streaming 整合 Flume
Spark Streaming 整合 Flume 一.简介二.推送式方法 2.1 配置日志收集Flume 2.2 项目依赖 2.3 Spark Strea ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（二十一）NIFI1.7.1安装
一.nifi基本配置 1. 修改各节点主机名,修改/etc/hosts文件内容. 192.168.0.120 master 192.168.0.121 slave1 192.168.0.122 sla ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（十三）kafka+spark streaming打包好的程序提交时提示虚拟内存不足（Container is running beyond virtual memory limits. Current usage: 119.5 MB of 1 GB physical memory used; 2.2 GB of 2.1 G）
异常问题:Container is running beyond virtual memory limits. Current usage: 119.5 MB of 1 GB physical mem ...

随机推荐

Swift3.0变化分享
Swift 3.0 做出的改变很大,在这篇文章中,我将尽我所能,利用代码样例给大家解释Swift 3.0最重要(要命)的改变,希望大家能够做好升级Swift 3.0 的准备.Swift 3.0的改变不 ...
又一枚精彩的弹幕效果jQuery实现
精彩的弹幕效果分享给大家,具有一定的参考价值,感兴趣的朋友可以尝试制作弹幕,具体内容如下简易弹幕效果:将发布的内容随机显示在弹幕右侧,逐渐左移最后消失. 涉及知识点:val().random ...
String StringBuffer StringBuilder
package com.test; import java.util.Date; /*** * * // 输出的结果是:// 来一个测试// 来一个测试如果只输出这句就证明了String是不可变的// ...
gvim 安装YCM
gvim的插件安装笔记 1.安装vunble插件该插件主要用于管理别的插件,借助与git,从github来下载插件,实现自动安装前提条件是git安装正确,可以听过cnd使用,并且可以正确访问gith ...
iOS小知识：使UIButton中的图片和文字实现左对齐
UIButton setImage 和 setTitle之后,默认的 image和title 对齐方式是居中, 由于 title 长度不固定,所以如果要几个这样有image有title的按钮纵向排列对 ...
Javascript数组学习
记录下学习数组的过程 1.创建数组 var ary1 = new Array();//空数组 var ary2= [] ;//字面量 2.数组检测 //方法一 if(array instanceof ...
ms08-067漏洞--初识渗透测试--想必很多初学者都会遇到我文中提及的各种问题
最近读了一本书--<<渗透测试实践指南>>,测试了书中的一些例子后,开始拿ms08-067这个经典的严重漏洞练手,实践当中遇到诸多问题,好在一一解决了,获益匪浅. 在谷歌搜索的 ...
Git的checkout, reset, revert
不管是修改还是新建文件,都必须通过git add把这次修改从工作区加到暂存区: commit只是提交暂存区的修改,还没add到暂存区处于工作区的修改是不会commit的: git checkout ...
Qt拖拽界面 (*.ui) 缩放问题及解决办法
问题使用Qt Designer 设计的界面,在缩放的时候不能随着主窗口一起缩放. 解决办法之前遇到这个问题的时候,都是直接重写resizeEvent接口来实现的,在自动生成的Ui_Widget或U ...
解决Unsupported major.minor version 51.0错误
解决Unsupported major.minor version 51.0错误使用jdk6运行项目时发生了Unsupported major.minor version 51.0错误.经过网上搜索发 ...

flume+kafka+spark streaming整合

flume+kafka+spark streaming整合的更多相关文章

随机推荐

热门专题