1.flume概述
我们的web服务器等等每天会产生大量的日志,我们要把这些日志收集起来,移动到hadoop平台上进行分析。
那么如何移动这些数据呢?一种方法是通过shell cp到hadoop集群上,然后通过hdfs dfs -put,这种方法毫无疑问是可行的,但是有一个问题。如果在移动数据的时候一台机器宕掉了,该怎么办?这种方法没办法进行监控,以及做负载均衡什么的,这个时候就需要flume了。
webserver(源端) ==》flume ==》hdfs(目的地)
flume是一个分布式、高可靠、高可用的服务,用于高效地收集、聚合、移动大量的日志数据。有着基于流式数据流的简单且灵活的架构,flume非常健壮并且具有容错性,具有能够从故障中恢复过来的机制,并使用一种简单易扩展的模型,允许在线分析。

这个架构图也清晰显示了flume的架构,source和web server对接,将日志收集起来,存放到channel里,然后sink(下沉)到hdfs里面
一句话总结flume:就是一个搬运工,将数据从A地方搬到B地方。
通常情况,flume会对决kafka、storm、spark streaming等等。
设计目标:
可靠性,数据不会有丢失
扩展性,可以线性添加机器
管理型,我们是一个source一个channel一个sink组成一个agent,在使用flume,只需要配置agent的配置文件即可。
1.flume概述的更多相关文章
- Flume概述和简单实例
		
Flume概述 Flume是一个分布式.可靠.和高可用的海量日志采集.聚合和传输的系统.支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方( ...
 - Flume 概述/企业案例
		
概述 1 Flume定义 Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集.聚合和传输的系统.Flume基于流式架构,灵活简单. 下面我们来详细介绍一下Flume架构中的 ...
 - Flume 概述+环境配置+监听Hive日志信息并写入到hdfs
		
Flume介绍Flume是Apache基金会组织的一个提供的高可用的,高可靠的,分布式的海量日志采集.聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据:同时,Flume提供 ...
 - Flume概述
		
flume是分布式的,可靠的,用于从不同的来源有效收集 聚集 和 移动 大量的日志数据用以集中式的数据存储的系统. 是apache的一个顶级项目. 系统需求:jdk1.6以上,推荐java1.7
 - Flume的概述和安装部署
		
一.Flume概述 Flume是一种分布式.可靠且可用的服务,用于有效的收集.聚合和移动大量日志文件数据.Flume具有基于流数据流的简单灵活的框架,具有可靠的可靠性机制和许多故障转移和恢复机制,具有 ...
 - 大数据技术之_09_Flume学习_Flume概述+Flume快速入门+Flume企业开发案例+Flume监控之Ganglia+Flume高级之自定义MySQLSource+Flume企业真实面试题(重点)
		
第1章 Flume概述1.1 Flume定义1.2 Flume组成架构1.2.1 Agent1.2.2 Source1.2.3 Channel1.2.4 Sink1.2.5 Event1.3 Flum ...
 - Hadoop应用开发实战(flume应用开发、搜索引擎算法、Pipes、集群、PageRank算法)
		
Hadoop是2013年最热门的技术之一,通过北风网robby老师<深入浅出Hadoop实战开发>.<Hadoop应用开发实战>两套课程的学习,普通Java开发人员可以在最快的 ...
 - [ETL] Flume 理论与demo(Taildir Source & Hdfs Sink)
		
一.Flume简介 1. Flume概述 Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集.聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据: ...
 - 学习笔记:分布式日志收集框架Flume
		
业务现状分析 WebServer/ApplicationServer分散在各个机器上,想在大数据平台hadoop上进行统计分析,就需要先把日志收集到hadoop平台上. 思考:如何解决我们的数据从其他 ...
 
随机推荐
- BZOJ 1923 SDOI2010 外星千足虫 异或方程组+bitset
			
题目链接:http://www.lydsy.com/JudgeOnline/problem.php?id=1923 懒得贴题目了......这就是解一个异或方程组的裸题...... YY了一下异或方程 ...
 - 软件工程项目组Z.XML会议记录 2013/11/06
			
软件工程项目组Z.XML会议记录 [例会时间]2013年11月06日星期二21:00-22:00 [例会形式]小组讨论 [例会地点]三号公寓楼会客厅 [例会主持]李孟 [会议记录]薛亚杰 会议整体流程 ...
 - eclipse mylyn.tasks.ui
			
sudo rm workspace/.metadata/.lock ./Applications/eclipse/Eclipse.app/Contents/MacOS/eclipse -clean - ...
 - 软工实践 - 第二十八次作业 Beta 冲刺(6/7)
			
队名:起床一起肝活队 组长博客:https://www.cnblogs.com/dawnduck/p/10146478.html 作业博客:班级博客本次作业的链接 组员情况 组员1(队长):白晨曦 过 ...
 - linux下搜索find命令拾遗
			
强制删除项目下面的所有.svn文件目录,find . -name ‘.svn’ -exec rm -rf {} \; empty显示所有的空白文件,并显示详细:find . -empty size显示 ...
 - Codeforces Round #392(Div 2) 758F(数论)
			
题目大意 求从l到r的整数中长度为n的等比数列个数,公比可以为分数 首先n=1的时候,直接输出r-l+1即可 n=2的时候,就是C(n, 2)*2 考虑n>2的情况 不妨设公比为p/q(p和q互 ...
 - warning LNK4070的解决办法
			
原文链接地址:http://blog.csdn.net/clever101/article/details/5898073#comments 重命名了一个MFC常规DLL ...
 - 12.25模拟赛T2
			
https://www.luogu.org/blog/a23333/post-xing-xuan-mu-ni-sai-path-ji-wang-zui-duan-lu 如果设f[i]表示从i到n的期望 ...
 - 浅析JavaScript的垃圾回收机制
			
JavaScript语言是一门优秀的脚本语言.其中包含脚本语言的灵活性外还拥有许多高级语言的特性.例如充许构建和实例化一个对象,垃圾回收机制(GC:Garbage Collecation).通常我们使 ...
 - shell里的getopts
			
By francis_hao Jul 5,2017 getopts是shell的一个内置命令. 概述 getopts optstring name [args]OPTIND,OPTARG,O ...