flume的安装和使用
1.下载
[linyouyi@hadoop01 software]$ wget https://mirrors.aliyun.com/apache/flume/1.9.0/apache-flume-1.9.0-bin.tar.gz
---- ::-- https://mirrors.aliyun.com/apache/flume/1.9.0/apache-flume-1.9.0-bin.tar.gz
Resolving mirrors.aliyun.com (mirrors.aliyun.com)... 27.148.180.227, 119.147.111.230, 119.147.111.231, ...
Connecting to mirrors.aliyun.com (mirrors.aliyun.com)|27.148.180.227|:... connected.
HTTP request sent, awaiting response... OK
Length: (65M) [application/gzip]
Saving to: ‘apache-flume-1.9.-bin.tar.gz’ %[=======================================================================>] ,, .0MB/s in .2s -- :: (30.0 MB/s) - ‘apache-flume-1.9.-bin.tar.gz’ saved [/]
2.解压
[linyouyi@hadoop01 software]$ tar -zxvf apache-flume-1.9.-bin.tar.gz -C /hadoop/module/
[linyouyi@hadoop01 software]$ cd /hadoop/module/
[linyouyi@hadoop01 module]$ cd apache-flume-1.9.-bin/
[linyouyi@hadoop01 apache-flume-1.9.-bin]$ ll
total
drwxr-xr-x linyouyi linyouyi Sep : bin
-rw-rw-r-- linyouyi linyouyi Nov CHANGELOG
drwxr-xr-x linyouyi linyouyi Sep : conf
-rw-r--r-- linyouyi linyouyi Nov DEVNOTES
-rw-r--r-- linyouyi linyouyi Nov doap_Flume.rdf
drwxrwxr-x linyouyi linyouyi Dec docs
drwxrwxr-x linyouyi linyouyi Sep : lib
-rw-rw-r-- linyouyi linyouyi Dec LICENSE
-rw-r--r-- linyouyi linyouyi Nov NOTICE
-rw-r--r-- linyouyi linyouyi Nov README.md
-rw-rw-r-- linyouyi linyouyi Dec RELEASE-NOTES
drwxrwxr-x linyouyi linyouyi Sep : tools
[linyouyi@hadoop01 apache-flume-1.9.-bin]$ ll conf/
total
3.启动agent
使用名为flume-ng的shell脚本启动代理程序,该脚本位于Flume发行版的bin目录中。您需要在命令行上指定代理名称,config目录和配置文件:
bin/flume-ng agent -n $agent_name -c conf -f conf/flume-conf.properties.template -n agent_name #取名称
-c conf #配置文件夹
-f conf/flume-conf.properties.template #配置文件
4.一个简单的例子
http://flume.apache.org/FlumeUserGuide.html#netcat-tcp-source
在这里,我们给出一个示例配置文件,描述单节点Flume部署。此配置允许用户生成事件,然后将其记录到控制台。
[linyouyi@hadoop01 apache-flume-1.9.-bin]$ vim conf/example.conf
#example.conf:单节点Flume配置 #在此代理上命名组件
a1.sources = r1
a1.sinks = k1
a1.channels = c1 #描述/配置源
a1.sources.r1.type = netcat
a1。 sources.r1.bind = localhost
a1.sources.r1.port = #描述接收器
a1.sinks.k1.type = logger #使用一个缓冲内存中事件的通道
a1.channels.c1.type = memory
a1.channels .c1.capacity =
a1.channels.c1.transactionCapacity = #将源和接收器绑定到通道
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1
此配置定义名为a1的单个代理。a1有一个侦听端口44444上的数据的源,一个缓冲内存中事件数据的通道,以及一个将事件数据记录到控制台的接收器。配置文件命名各种组件,然后描述其类型和配置参数。给定的配置文件可能会定义几个命名的代理 当一个给定的Flume进程启动时,会传递一个标志,告诉它要显示哪个命名代理。
鉴于此配置文件,我们可以按如下方式启动Flume:
[linyouyi@hadoop01 apache-flume-1.9.-bin]$ bin/flume-ng agent --conf conf --conf-file conf/example.conf --name a1 -Dflume.root.logger=INFO,console
请注意,在完整部署中,我们通常会包含一个选项: - conf=<conf-dir>。所述<CONF-DIR>目录将包括一个shell脚本flume-env.sh和潜在的一个log4j的属性文件。在这个例子中,我们传递一个Java选项来强制Flume登录到控制台,我们没有自定义环境脚本。
从一个单独的终端,我们可以telnet端口44444并向Flume发送一个事件:
$ telnet localhost
Trying 127.0.0.1...
Connected to localhost.localdomain (127.0.0.1).
Escape character is '^]'.
Hello world! <ENTER>
OK
原始的Flume终端将在日志消息中输出事件。
// :: INFO source.NetcatSource: Source starting
// :: INFO source.NetcatSource: Created serverSocket:sun.nio.ch.ServerSocketChannelImpl[/127.0.0.1:]
// :: INFO sink.LoggerSink: Event: { headers:{} body: 6C 6C 6F 6F 6C 0D Hello world!. }
恭喜 - 您已成功配置并部署了Flume代理!后续部分更详细地介绍了代理配置。
5.exec采集
http://flume.apache.org/FlumeUserGuide.html#exec-source
[linyouyi@hadoop01 apache-flume-1.9.-bin]$ cp conf/example.conf conf/example-exec.conf
[linyouyi@hadoop01 apache-flume-1.9.-bin]$ vim conf/example-exec.conf
#example.conf:单节点Flume配置 #在此代理上命名组件
a1.sources = r1
a1.sinks = k1
a1.channels = c1 #描述/配置源
a1.sources.r1.type = exec
a1。 sources.r1.command = tail -F /hadoop/module/text.log #描述接收器
a1.sinks.k1.type = logger #使用一个缓冲内存中事件的通道
a1.channels.c1.type = memory
a1.channels .c1.capacity =
a1.channels.c1.transactionCapacity = #将源和接收器绑定到通道
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1
启动
[linyouyi@hadoop01 apache-flume-1.9.-bin]$ bin/flume-ng agent --conf conf --conf-file conf/example-exec.conf --name a1 -Dflume.root.logger=INFO,console
打开另一个客户端往/hadoop/module/text.log不断写数据,发现原始的Flume终端消息中输出信息
[linyouyi@hadoop01 module]$ echo "flume" >> text.log
[linyouyi@hadoop01 module]$ echo "flume" >> text.log
[linyouyi@hadoop01 module]$ cat text.log
flume
flume
flume
[linyouyi@hadoop01 module]$ echo "flume" >> text.log
[linyouyi@hadoop01 module]$ echo "hello linyouyi" >> text.log
原始终端输出信息
-- ::, (lifecycleSupervisor--) [INFO - org.apache.flume.source.ExecSource.start(ExecSource.java:)] Exec source starting with command: tail -F /hadoop/module/text.log
-- ::, (lifecycleSupervisor--) [INFO - org.apache.flume.instrumentation.MonitoredCounterGroup.register(MonitoredCounterGroup.java:)] Monitored counter group for type: SOURCE, name: r1: Successfully registered new MBean.
-- ::, (lifecycleSupervisor--) [INFO - org.apache.flume.instrumentation.MonitoredCounterGroup.start(MonitoredCounterGroup.java:)] Component type: SOURCE, name: r1 started
-- ::, (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:)] Event: { headers:{} body: 6C 6D flume }
-- ::, (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:)] Event: { headers:{} body: 6C 6D flume }
-- ::, (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:)] Event: { headers:{} body: 6C 6D flume }
-- ::, (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:)] Event: { headers:{} body: 6C 6D flume }
-- ::, (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:)] Event: { headers:{} body: 6C 6C 6F 6C 6E 6F hello linyouyi }
在配置文件中使用环境变
http://flume.apache.org/FlumeUserGuide.html
flume的安装和使用的更多相关文章
- Flume的安装与配置
Flume的安装与配置 一. 资源下载 资源地址:http://flume.apache.org/download.html 程序地址:http://apache.fayea.com/fl ...
- 日志采集框架Flume以及Flume的安装部署(一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统)
Flume支持众多的source和sink类型,详细手册可参考官方文档,更多source和sink组件 http://flume.apache.org/FlumeUserGuide.html Flum ...
- 日志收集框架flume的安装及简单使用
flume介绍 Flume是一个分布式.可靠.和高可用的海量日志采集.聚合和传输的系统. Flume可以采集文件,socket数据包等各种形式源数据,又可以将采集到的数据输出到HDFS.hbase.h ...
- Flume(3)-安装部署
一. 下载 Flume官网地址 http://flume.apache.org/ 文档查看地址 http://flume.apache.org/FlumeUserGuide.html 下载地址 htt ...
- Flume的安装,配置及使用
1,上传jar包 2,解压 3,改名 4,更改配置文件 将template文件重镜像 root@Ubuntu-1:/usr/local/apache-flume/conf# cat flume-env ...
- 02_ Flume的安装部署及其简单使用
一.Flume的安装部署: Flume的安装非常简单,只需要解压即可,当然,前提是已有hadoop环境 安装包的下载地址为:http://www-us.apache.org/dist/flume/1. ...
- Flume介绍安装使用
APache Flume官网:http://flume.apache.org/releases/content/1.9.0/FlumeUserGuide.html#memory-channel 目录 ...
- Flume NG安装部署及数据采集测试
转载请注明出处:http://www.cnblogs.com/xiaodf/ Flume作为日志收集工具,监控一个文件目录或者一个文件,当有新数据加入时,采集新数据发送给消息队列等. 1 安装部署Fl ...
- 让你系统认识flume及安装和使用flume1.5传输数据到hadoop2.2
本文链接: http://www.aboutyun.com/thread-7949-1-1.html 问题导读:1.什么是flume?2.如何安装flume?3.flume的配置文件与其它软件有什么不 ...
- flume学习安装
近期项目组有需求点击流日志须要自己收集,学习了一下flume而且成功安装了.相关信息记录一下. 1)下载flume1.5版本号 wget http://www.apache.org/dyn/clos ...
随机推荐
- 2、Python 接口框架
common:存放通用的工具类 config:存放配置文件信息 result:存放result.html run_suite.py:最后执行的文件 1.excel_util:利用 openpyxl 进 ...
- jstl jsp long to date
jsp 页面中使用jstl el 将long转换为时间类型,并格式化输出 <%@ taglib uri="http://java.sun.com/jsp/jstl/core" ...
- JMeter Http请求之content-type用法
转载自https://www.cnblogs.com/imyalost/p/6726795.html 本文讲三种content-type以及在Jmeter中对应的参数输入方式 第一部分:目前工作中涉及 ...
- DOM学习总结(四)DOM修改
DOOM修改 找到标签之后就可以对它进行修改了可以修改:1.改变HTML元素 比如说把 p 改为 span2.改变HTML属性 比如说 id class3.改变CSS样式 比如说改变字体颜色4.添加或 ...
- P1523 旅行商简化版
P1523 旅行商简化版 题目背景 欧几里德旅行商(Euclidean Traveling Salesman)问题也就是货郎担问题一直是困扰全世界数学家.计算机学家的著名问题.现有的算法都没有办法在确 ...
- shell重定向的顺序问题
三个默认的文件描述符 0: stdin(标准输入) 1: stdout(标准输出) 2: stderr(标准错误输出) 系统中这3个文件描述符所对应的文件: 重定向顺序 示例脚本 echo " ...
- (3)centos7 目录结构
根目录下的文件下 根目录: / 注意:根目录只存放目录,并且/etc./bin./dev./lib./sbin应该和根目录放置在一个分区中 /bin 二进制目录,存放用户级的GUN工具 /bo ...
- git clone慢的解决办法
转自:http://www.kindemh.cn/ 转自Kindem的博客 问题 大家可能都遇到过从github使用git clone指令奇慢无比的问题,网上很多人说使用代理来加速git,但是这也不是 ...
- TLS/SSL 协议 - ServerHello
ServerHello ServerHello消息的意义是将服务器选择的连接参数传送回客户端.这个消息的结构与ClientHello类似,只是每个字段只包含一个选项. 服务器无需支持客户端支持的最佳版 ...
- 【Java多线程系列四】控制线程执行顺序
假设有线程1/线程2/线程3,线程3必须在线程1/线程2执行完成之后开始执行,有两种方式可实现 Thread类的join方法:使宿主线程阻塞指定时间或者直到寄生线程执行完毕 CountDownLatc ...