flume1.8实现hdfsSink整点滚动文件
由于官方的1.8版本hdfs-sink不能在每天的0点滚动文件,所以修改了flume-hdfs-sink源码。
flume-hdfs-sink中修改了HDFSEventSink.java文件,其他文件未改动。
使用该程序打包,替换掉官方到flume-hdfs-sink.jar(建议备份一份), 也可以直接下载编译后的jjar包。
| timeRollerFlag | 默认值: day 可以设置minutes, hour, day minutes 每分钟滚动文件 hour 每小时滚动文件 day 每天0点滚动文件 | 
paas2.sinks.k1.type = hdfs
paas2.sinks.k1.hdfs.path = hdfs://ns1/user/hive/warehouse/dw_stg.db/tg_paas_business/dt=%Y%m%d
paas2.sinks.k1.hdfs.filePrefix = paas_business_%Y%m%d
paas2.sinks.k1.hdfs.fileSuffix = .json
paas2.sinks.k1.hdfs.rollInterval = 0
paas2.sinks.k1.hdfs.rollCount = 0
paas2.sinks.k1.hdfs.round = false
paas2.sinks.k1.hdfs.roundValue=12
paas2.sinks.k1.hdfs.roundUnit=hour
paas2.sinks.k1.hdfs.rollSize = 134217728
paas2.sinks.k1.hdfs.fileType = DataStream
paas2.sinks.k1.hdfs.timeRollerFlag=day
源程序gitee地址如下:
https://gitee.com/pang123/flume-hdfs-sink-king
编译后的jar包如下地址:
https://gitee.com/pang123/flume-hdfs-sink-king/tree/master/target_jar
flume1.8实现hdfsSink整点滚动文件的更多相关文章
- flume中sink到hdfs,文件系统频繁产生文件,文件滚动配置不起作用?
		在测试hdfs的sink,发现sink端的文件滚动配置项起不到任何作用,配置如下: a1.sinks.k1.type=hdfs a1.sinks.k1.channel=c1 a1.sinks.k1.h ... 
- Flume1.9.0的安装、部署、简单应用(含分布式、与Hadoop3.1.2、Hbase1.4.9的案例)
		目录 目录 前言 什么是Flume? Flume的特点 Flume的可靠性 Flume的可恢复性 Flume的一些核心概念 Flume的官方网站在哪里? Flume在哪里下载以及如何安装? 设置环境变 ... 
- flume中HdfsSink参数说明
		flume到hdfsSink: type hdfs path 写入hdfs的路径,需要包含文件系统标识,比如:hdfs://namenode/flume/webdata/ 可以使用flume提供的日期 ... 
- flume1.9 用户指南(中文版)
		概述 Apache Flume是一个分布式,可靠且可用的系统,用于有效地从许多不同的source收集,聚合和移动大量日志数据到集中式数据存储. Apache Flume的使用不仅限于日志数据聚合.由于 ... 
- 利用FlashPaper在web页面中显示PDF文件(兼容各浏览器)
		应项目需求要把PDF内嵌到网页中显示,其中有了很多办法,比如用<embed/>元素放入PDF文件,但是效果不理想,浏览器兼容不理想,在ie9/8(其他版本没有测试)显示会提示下载pdf文件 ... 
- 使用log4j配置不同文件输出不同内容
		敲代码中很不注意写日志,虽然明白很重要.今天碰到记录日志,需要根据内容分别输出到不同的文件. 参考几篇文章: 感觉最详细:http://blog.csdn.net/azheng270/article/ ... 
- 文件并发(日志处理)--队列--Redis+Log4Net
		多线程操作同一个文件时会出现并发问题.解决的一个办法就是给文件加锁(lock),但是这样的话,一个线程操作文件时,其它的都得等待,这样的话性能非常差.另外一个解决方案,就是先将数据放在队列中,然后开启 ... 
- Linux命令大全----常用文件操作命令
		林炳文Evankaka原创作品.转载请注明出处http://blog.csdn.net/evankaka ls 这个命令是经常用到的,用来显示当前目录下有哪些文件 ,ls最常用的参数有三个: -a - ... 
- 转:NLog之:文件类型目标(File target)
		转:http://www.cnblogs.com/RitchieChen/archive/2012/07/16/2594308.html 英文原文[http://nlog-project.org/wi ... 
随机推荐
- 基于Android平台的会议室管理系统具体设计说明书
			会议室管理系统具体设计说明书 第一部分 引言 1.编写目的 本说明对会议室管理系统项目的各模块.页面.脚本分别进行了实现层面上的要求和说明. 软件开发小组的产品实现成员应该阅读和參考本说明进行代码的 ... 
- 查看mysql状态的常用命令
			在mysql客户端输入"show status"之后将会看到如下输出: 如果想要查看某个具体的值,可以使用如下命令: show status LIKE "%具体变量%&q ... 
- 微信小程序图片宽100%显示并且不变形
			<view class="meiti" style="background-color:red;"> <image src="htt ... 
- The type org.apache.commons.cli.Options cannot be resolved. It is indirectly referenced from required .class files
			在搭建好Hadoop Eclipse开发环境后,编写map-reduce,遇到如下的问题: 从字面上可以看出,工程缺少org.apache.commons.cli.Options,这个包被间接的被其他 ... 
- Hadoop JobTracker和NameNode运行时参数查看
			1)JobTracker运行时参数: hadoop@ubuntu:/home/zhangchao3$ ps -ef | grep job hadoop 29563 1 0 11:34 pts/12 ... 
- redis 3.2.3的源码安装
			Install necessary packages On CentOS : yum install wget make gcc tcl On CentOS yum install wget make ... 
- JDK1.6新特性,基础类库篇,Jar与Zip增强
			1. API改变 增加了两个实现类 java.util.zip.DeflaterInputStream: 此类为解压缩 "deflate" 压缩格式的数据实现流过滤器.它还用作其他 ... 
- 不错位的java .class 反编译工具推荐
			我们经常会反编译看一些class文件,但是反编译出来的文件里面会有很多杂乱的东西 一直以来都是用的idea来反编译的,只要把class文件往里面一拖就行了 这么用没问题,用来看看源码什么的都OK 但是 ... 
- zabbix 对服务器的负载做监控
			# cat /etc/zabbix/zabbix_agentd.d/average.conf UserParameter=average[*],uptime|awk '{print $NF}' 自定义 ... 
- linux命令(51):set 指定行,直接替换并修改文件
			sed 命令: 指定行,从第一行到第一行: 把该行的ssd,换成cd: -i 表示的是替换并直接修改文件: sed -i '1,1s/ssd/cd/g' test_file 命令使用: sed - ... 
