下载和解压 Flume

实验环境可能需要回至第四，五，六章(hadoop和hive)，否则后面传输数据可能报错（猜测）！
可以从官网下载 Flume 组件安装包，下载地址如下 URL 链接所示：https://archive.apache.org/dist/flume/1.6.0/

使用 root用户解压 Flume安装包到“/usr/local/src”路径，并修改解压后文件夹名为 flume

[root@master ~]#tar zxvf /opt/software/apache-flume-1.6.0-bin.tar.gz -C /usr/local/src

[root@master ~]#cd /usr/local/src/

[root@master ~]#mv apache-flume-1.6.0-bin/ flume  #修改 Flume安装路径文件夹名称

[root@master ~]#chown -R hadoop:hadoop flume/   #修改文件夹归属用户和归属组为 hadoop用户和 hadoop组

Flume 组件部署

步骤一：使用 root 用户设置 Flume 环境变量，并使环境变量对所有用户生效

[root@master ~]#vi /etc/profile  #编辑系统环境变量配置文件

# set flume environment

export FLUME_HOME=/usr/local/src/flume  #Flume安装路径

export PATH=$PATH:$FLUME_HOME/bin  #添加系统 PATH环境变量

步骤二：修改 Flume 相应配置文件

#首先，切换到 hadoop用户，并切换当前工作目录到 Flume的配置文件夹。

[root@master ~]#su - hadoop

[hadoop@master ~]$source /etc/profile

[hadoop@master ~]$cd /usr/local/src/flume/conf

#拷贝 flume-env.sh.template文件并重命名为 flume-env.sh

[hadoop@master ~]$cp flume-env.sh.template flume-env.sh

步骤三：修改并配置 flume-env.sh 文件

#删除 JAVA_HOME变量前的注释，修改为 JDK的安装路径

[hadoop@master ~]$ vi /usr/local/src/flume/conf/flume-env.sh

#修改 JAVA_HOME参数值为 jdk安装路径

export JAVA_HOME=/usr/local/src/jdk

#使用 flume-ng version 命令验证安装是否成功，若能够正常查询 Flume组件版本为1.6.0，则表示安装成功

[hadoop@master ~]$ flume-ng version

Flume 1.6.0  #查询到 Flume版本为 1.6.0

Source code repository: https://git-wip-us.apache.org/repos/asf/flume.git

Revision: 2561a23240a71ba20bf288c7c2cda88f443c2080

Compiled by hshreedharan on Mon May 11 11:15:44 PDT 2015

From source with checksum b29e416802ce9ece3269d34233baf43f

#如果报error并出现版本号则可能是环境文件冲突

vim /usr/local/src/hbase/conf/hbase-env.sh

修改：

使用 Flume 发送和接受信息

通过 Flume将 Web服务器中数据传输到 HDFS中

步骤一：在 Flume 安装目录中创建 simple-hdfs-flume.conf 文件

[hadoop@master ~]$ cd /usr/local/src/flume/

[hadoop@master ~]$ vi /usr/local/src/flume/simple-hdfs-flume.conf

#写入：

a1.sources=r1

a1.sinks=k1

a1.channels=c1

a1.sources.r1.type=spooldir

a1.sources.r1.spoolDir=/usr/local/src/hadoop/logs/

a1.sources.r1.fileHeader=true

a1.sinks.k1.type=hdfs

a1.sinks.k1.hdfs.path=hdfs://master:9000/tmp/flume

a1.sinks.k1.hdfs.rollsize=1048760

a1.sinks.k1.hdfs.rollCount=0

a1.sinks.k1.hdfs.rollInterval=900

a1.sinks.k1.hdfs.useLocalTimeStamp=true

a1.channels.c1.type=file

a1.channels.c1.capacity=1000

a1.channels.c1.transactionCapacity=100

a1.sources.r1.channels = c1

a1.sinks.k1.channel = c1

#测试下是否能访问master:9000

步骤二：使用 flume-ng agent 命令加载 simple-hdfs-flume.conf 配置信息，启动 flume 传输数据

[hadoop@master flume] $ flume-ng agent --conf-file simple-hdfs-flume.conf --name a1

#如果一直在输出则表面成功，否则报错

#ctrl+c 退出 flume 传输

#ctrl+z

步骤三：查看 Flume 传输到 HDFS 的文件，若能查看到 HDFS 上/tmp/flume 目录有传输的数据文件，则表示数据传输成功

[hadoop@master flume] $ hdfs dfs -ls /tmp/flume  #查看HDFS文件系统/tmp/f1ume目录下文件

-rw-r--r-- 2 hadoop super group 1325 2022-04-29 17:13 /tmp/flume/FlumeData.1559747635008

-rw-r--r-- 2 hadoop super group 1344 2022-04-29 17:13 /tmp/flume/F1umeData.1559747635009

-rw-r--r-- 2 hadoop super qroup 1442 2022-04-29 17:13 /tmp/flume/FlumeData.1559747635010

Flume 组件安装配置的更多相关文章

ZooKeeper 组件安装配置
ZooKeeper 组件安装配置下载和安装 ZooKeeper ZooKeeper最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/ 来获取,安装 Zoo ...
Hive 组件安装配置
下载和解压安装文件基础环境和安装准备 Hive组件的部署规划和软件包路径如下: (1)当前环境中已安装 Hadoop全分布系统 (2)本地安装 MySQL数据库(账号 root,密码 Passwor ...
Flume的安装配置
flume是一个分布式.可靠.和高可用的海量日志采集.聚合和传输的系统.支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(比如文本.HDF ...
【Hadoop】10、Flume组件
目录 Flume组件安装配置 1.下载和解压 Flume 2.Flume 组件部署 3.使用 Flume 发送和接受信息 Flume组件安装配置 1.下载和解压 Flume # 传Flume安装包 [ ...
hadoop伪分布式组件安装
一.版本建议 Centos V7.5 Java V1.8 Hadoop V2.7.6 Hive V2.3.3 Mysql V5.7 Spark V2.3 Scala V2.12.6 Flume V1. ...
kerberos安装配置
目录前言服务端安装组件安装配置krb5.conf 配置kdc.conf 配置kadm5.acl 创建kdc数据库在server端创建一个管理员账号,方便远程登录管理kerberos 正式启动 ...
01 Flume系列（一）安装配置
01 Flume系列(一)安装配置 Flume(http://flume.apache.org/) is a distributed, reliable, and available service ...
具体图解 Flume介绍、安装配置
写在前面一: 本文总结"Hadoop生态系统"中的当中一员--Apache Flume 写在前面二: 所用软件说明: 一.什么是Apache Flume 官网:Flume is a ...
Linux安装配置Flume
概述 Apache Flume是一个分布式,可靠且可用的系统,用于高效地收集,汇总和将来自多个不同源的大量日志数据移动到集中式数据存储.Apache Flume的使用不仅限于日志数据聚合.由于数据源是 ...

随机推荐

SAP Office Excel Intergration
*&---------------------------------------------------------------------* *& Report DEMOEXCEL ...
记一次beego通过go get命令后找不到bee.exe的坑
学习goweb开发,gin是个轻量级的框架.如果想要一个类如aspnetmvc帮我们搭建好了的goweb框架,beego值得去学习.否则gin下面需要动手构建好多代码.新手还是先学现成的节约时间成本. ...
ansible对文件内容操作
ansible lineinfile 简介 lineinfile该模块是操作文件中的每一行内容,他是按照行为单位的,和下面的replace模块并不冲突. 修改匹配行,如果不存在就会添加 tasks: ...
为什么新的5G标准将为技术栈带来更低的 TCO
摘要新5G标准和边缘计算对低延迟的要求,给那些试图将一堆不同组件组装成一个不会出现故障且仍具有低延迟的高成本效益应用程序公司带来了严峻的挑战.事实上,这个问题非常严重,以至于需要重新考虑架构. ...
C#/VB.NET 将PDF转为Excel
PDF文档可以避免可防⽌他⼈⽆意中触到键盘修改⽂件内容.但是在避免他人⽆意修改的同时也妨碍了正常的修改.如果你想处理或修改PDF文档中的数据,不妨试试用Excel来实现.Excel拥有强大的数据处理功 ...
AI 绘画极简教程
昨天在朋友圈发了几张我用AI绘画工具Disco Diffusion画的画既然有同学问,就写个极简教程吧,画个图是足够了,想要深入了解还是自行百度吧,可以找到更详细的教程. 第 0 步:学会上网,注册 ...
skip-host-cache skip-name-resolve
在mysql 的data 文件夹下生成了一个.err的文件,打开发展,经常有人访问这个,服务器部署在腾讯云上. 2017-05-23 0:49:04 2996 [Warning] IP addres ...
构建 API 的7个建议【翻译】
迄今为止,越来越多的企业依靠API来为客户提供服务,以确保竞争的优势和业务可见性.出现这个情况的原因是微服务和无服务器架构正变得越来越普遍,API作为其中的关键节点,继承和承载了更多业务. 在这个前提 ...
kubernetes下kubelet无法启动
错误如下: 09:58:45 kubernetes-node01 kubelet[6248]: F0124 09:58:45.902571 6248 server.go:265] failed to ...
raspberrypi系统在加入k8s作为node节点时遇到的问题
新买的树莓派4b到货后就迫不及待的烧录上raspberrypi系统,将新派加入我的k8s集群,期间遇到了点小挫折,好歹也一个一个解决了: 一.kubelet版本不对导致无法加入k8s集群在执行kub ...

Flume 组件安装配置

下载和解压 Flume

Flume 组件部署

步骤一：使用 root 用户设置 Flume 环境变量，并使环境变量对所有用户生效

步骤二：修改 Flume 相应配置文件

步骤三：修改并配置 flume-env.sh 文件

使用 Flume 发送和接受信息

步骤一：在 Flume 安装目录中创建 simple-hdfs-flume.conf 文件

步骤二：使用 flume-ng agent 命令加载 simple-hdfs-flume.conf 配置信息，启动 flume 传输数据

步骤三：查看 Flume 传输到 HDFS 的文件，若能查看到 HDFS 上/tmp/flume 目录有传输的数据文件，则表示数据传输成功

Flume 组件安装配置的更多相关文章

随机推荐

热门专题