入门大数据---Flume的搭建

一线大数据 2024-10-09 03:59:20 原文

一、下载并解压到指定目录

崇尚授人以渔的思想，我说给大家怎么下载就行了，就不直接放连接了，大家可以直接输入官网地址 http://flume.apache.org ，一般在官网的上方或者左边都会有Download按钮，这个在左侧，然后点进去下载想要的版本即可。这个会有点慢，如果嫌弃的化，可以通过相关镜像网站进行下载，可以百度搜索软件镜像，就能搜到很多镜像网站，在里面就可以下载，如果你下载的东西属于Apache旗下的，可以看的有专门的一个Apache目录，里面存的都是Apache旗下相关产品。

可以先本地下载，然后通过ftp上传，也可以直接在服务器下载。

我这里下载好后，解压到了服务器/opt 目录下面，并修改了下目录名称为flume(你也可以不改，配置环境变量的时候按照实际情况来就行了。)

二、在flume-env.sh里面配置Java路径

进入到 conf目录下面，对flume-env.sh进行编辑，将export JAVA_HOME修改为实际路径。

cd /opt/flume/conf/

vim flume-env.sh

export JAVA_HOME=/opt/java/jdk1.8.0_221

三、添加Flume环境变量

环境变量存放的是软件的具体位置，运行程序命令会根据配置的变量找到软件并执行，否则会报错。（通过手动下载并上传到Linux服务器的都需要配置环境变量。）

vim /etc/profile

export FLUME_HOME=/opt/flume

export FLUME_CONF_DIR=/opt/flume/conf

PATH=$FLUME_HOME/bin

source /etc/profile

四、通过flume-ng version验证是否配置成功

直接控制台运行 flume-ng version

显示Flume 1.6.0 就好了，如果显示了Error什么报错信息先不用管。

系列传送门

入门大数据---Flume的搭建的更多相关文章

入门大数据---Flume 简介及基本使用
一.Flume简介 Apache Flume 是一个分布式,高可用的数据收集系统.它可以从不同的数据源收集数据,经过聚合后发送到存储系统中,通常用于日志数据的收集.Flume 分为 NG 和 OG ( ...
入门大数据---Flume整合Kafka
一.背景先说一下,为什么要使用 Flume + Kafka? 以实时流处理项目为例,由于采集的数据量可能存在峰值和峰谷,假设是一个电商项目,那么峰值通常出现在秒杀时,这时如果直接将 Flume 聚合 ...
入门大数据---Kafka的搭建与应用
前言上一章介绍了Kafka是什么,这章就讲讲怎么搭建以及如何使用. 快速开始 Step 1:Download the code Download the 2.4.1 release and un-t ...
入门大数据---通过Yarn搭建MapReduce和应用实例
上一篇中我们了解了MapReduce和Yarn的基本概念,接下来带领大家搭建下Mapreduce-HA的框架. 结构图如下: 开始搭建: 一.配置环境注:可以现在一台计算机上进行配置,然后分发给其它 ...
入门大数据---Hive的搭建
本博客主要介绍Hive和MySql的搭建: 学习视频一天就讲完了,我看完了自己搭建MySql遇到了一堆坑,然后花了快两天才解决完,终于把MySql搭建好了.然后又去搭建Hive,又遇到了很多坑,就这 ...
入门大数据---基于Zookeeper搭建Kafka高可用集群
一.Zookeeper集群搭建为保证集群高可用,Zookeeper 集群的节点数最好是奇数,最少有三个节点,所以这里搭建一个三个节点的集群. 1.1 下载 & 解压下载对应版本 Zooke ...
入门大数据---基于Zookeeper搭建Spark高可用集群
一.集群规划这里搭建一个 3 节点的 Spark 集群,其中三台主机上均部署 Worker 服务.同时为了保证高可用,除了在 hadoop001 上部署主 Master 服务外,还在 hadoop0 ...
Ambari——大数据平台的搭建利器之进阶篇
前言本文适合已经初步了解 Ambari 的读者.对 Ambari 的基础知识,以及 Ambari 的安装步骤还不清楚的读者,可以先阅读基础篇文章<Ambari——大数据平台的搭建利器>. ...
入门大数据---Spark_Streaming整合Flume
一.简介 Apache Flume 是一个分布式,高可用的数据收集系统,可以从不同的数据源收集数据,经过聚合后发送到分布式计算框架或者存储系统中.Spark Straming 提供了以下两种方式用于 ...

随机推荐

分布式事务专题笔记（三）分布式事务解决方案之TCC（三阶段提交）
个人博客网:https://wushaopei.github.io/ (你想要这里多有) 1.什么是TCC事务 TCC是Try.Confifirm.Cancel三个词语的缩写,TCC要求每个分支 ...
Java实现偶数矩阵（Even Parity, UVa 11464）
偶数矩阵(Even Parity, UVa 11464) 问题描述给你一个n×n的01矩阵(每个元素非0即1),你的任务是把尽量少的0变成1, 使得每个元素的上.下.左.右的元素(如果存在的话)之和 ...
Java实现LeetCode 110. Balanced Binary Tree
/** * Definition for a binary tree node. * public class TreeNode { * int val; * TreeNode left; * Tre ...
Java动态规划实现最短路径问题
问题描述给定一个加权连通图(无向的或有向的),要求找出从每个定点到其他所有定点之间的最短路径以及最短路径的长度. 2.1 动态规划法原理简介动态规划算法通常用于求解具有某种最优性质的问题.在这类问 ...
Java实现洛谷 P1217 [USACO1.5]回文质数 Prime Palindromes
import java.util.Scanner; public class Main { private static Scanner cin; public static void main(St ...
彻底搞懂 etcd 系列文章（二）：etcd 的多种安装姿势
0 专辑概述 etcd 是云原生架构中重要的基础组件,由 CNCF 孵化托管.etcd 在微服务和 Kubernates 集群中不仅可以作为服务注册与发现,还可以作为 key-value 存储的中间件 ...
数据结构与算法-python描述-双向链表
# coding:utf-8 # 双向链表的相关操作: # is_empty() 链表是否为空 # length() 链表长度 # travel() 遍历链表 # add(item) 链表头部添加 # ...
Android getMeasuredHeight()与getHeight()的区别
getMeasuredHeight()返回的是原始测量高度,与屏幕无关 getHeight()返回的是在屏幕上显示的高度实际上在当屏幕可以包裹内容的时候,他们的值是相等的,只有当view超出屏幕后, ...
javaCV开发详解之12：视频转apng动态图片实现，支持透明通道，也支持摄像机、桌面屏幕、流媒体等视频源转apng动态图
wjavaCV系列文章: javacv开发详解之1:调用本机摄像头视频 javaCV开发详解之2:推流器实现,推本地摄像头视频到流媒体服务器以及摄像头录制视频功能实现(基于javaCV-FFMPEG. ...
matplotlib 示例
示例1 import numpy as np import matplotlib.pyplot as plt #plt.rcParams['font.family'] = ['sans-serif'] ...