flume 使用 spool source的时候字符集出错

1. 错误所在

-- ::, (pool--thread-) [ERROR - org.apache.flume.source.SpoolDirectorySource$SpoolDirectoryRunnable.run(SpoolDirectorySource.java:)] FATAL: Spool Directory source source1: { spoolDir: /home/hadoop_admin/movielog/ }: Uncaught exception in SpoolDirectorySource thread. Restart or reconfigure Flume to continue processing.

java.nio.charset.MalformedInputException: Input length =

        at java.nio.charset.CoderResult.throwException(CoderResult.java:)

        at org.apache.flume.serialization.ResettableFileInputStream.readChar(ResettableFileInputStream.java:)

        at org.apache.flume.serialization.LineDeserializer.readLine(LineDeserializer.java:)

        at org.apache.flume.serialization.LineDeserializer.readEvent(LineDeserializer.java:)

        at org.apache.flume.serialization.LineDeserializer.readEvents(LineDeserializer.java:)

        at org.apache.flume.client.avro.ReliableSpoolingFileEventReader.readEvents(ReliableSpoolingFileEventReader.java:)

        at org.apache.flume.source.SpoolDirectorySource$SpoolDirectoryRunnable.run(SpoolDirectorySource.java:)

        at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:)

        at java.util.concurrent.FutureTask.runAndReset(FutureTask.java:)

        at java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.access$(ScheduledThreadPoolExecutor.java:)

        at java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.run(ScheduledThreadPoolExecutor.java:)

        at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:)

        at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:)

        at java.lang.Thread.run(Thread.java:)

2. 解决方法

　　原因的inputCharset属性的默认值UTF-8,但是所读取的日志文件的字符集却是GBK,所以更改一下这个属性值就可以了

agent1.sources = source1

agent1.channels = channel1

agent1.sinks = sink1

# For each one of the sources, the type is defined

agent1.sources.source1.type = spooldir

agent1.sources.source1.spoolDir =/home/hadoop_admin/movielog/

agent1.sources.source1.inputCharset = GBK

agent1.sources.source1.fileHeader = true

agent1.sources.source1.deletePolicy = immediate

agent1.sources.source1.batchSize =

agent1.sources.source1.channels = channel1

# Each sink's type must be defined

agent1.sinks.sink1.type = hdfs

agent1.sinks.sink1.hdfs.path = hdfs://master:9000/flumeTest

agent1.sinks.sink1.hdfs.filePrefix = master-

agent1.sinks.sink1.hdfs.writeFormat = Text

agent1.sinks.sink1.hdfs.fileType = DataStream

agent1.sinks.sink1.hdfs.rollInterval =

agent1.sinks.sink1.hdfs.rollSize =

agent1.sinks.sink1.hdfs.batchSize =

agent1.sinks.sink1.hdfs.callTimeout =

agent1.sinks.sink1.channel = channel1

# Each channel's type is defined.

agent1.channels.channel1.type = memory

agent1.channels.channel1.capacity =

agent1.channels.channel1.transactionCapacity =

agent1.channels.channel1.keep-alive =

flume 使用 spool source的时候字符集出错的更多相关文章

Hadoop生态圈-Flume的主流source源配置
Hadoop生态圈-Flume的主流source源配置作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 本篇博客只是配置的是Flume主流的Source,想要了解更详细的配置信息请参 ...
flume组件汇总 source、sink、channel
Flume Source Source类型说明 Avro Source 支持Avro协议(实际上是Avro RPC),内置支持 Thrift Source 支持Thrift协议,内置支持 Exec ...
flume-ng 使用spool source 传输文件到hdfs
Flume 1.4.0 User Guide 地址:http://archive.cloudera.com/cdh4/cdh/4/flume-ng-1.4.0-cdh4.6.0/FlumeUserGu ...
Hadoop实战-Flume之自定义Source(十八)
import java.nio.charset.Charset; import java.util.HashMap; import java.util.Random; import org.apach ...
Flume学习之路（二）Flume的Source类型
一.概述官方文档介绍:http://flume.apache.org/FlumeUserGuide.html#flume-sources 二.Flume Sources 描述 2.1 Avro So ...
Flume（二）Flume的Source类型
一.概述官方文档介绍:http://flume.apache.org/FlumeUserGuide.html#flume-sources 二.Flume Sources 描述 2.1 Avro So ...
Flume Source官网剖析(博主推荐）
不多说,直接上干货! 一切来源于flume官网 http://flume.apache.org/FlumeUserGuide.html Flume Sources Avro Source Thrift ...
一次flume exec source采集日志到kafka因为单条日志数据非常大同步失败的踩坑带来的思考
本次遇到的问题描述,日志采集同步时,当单条日志(日志文件中一行日志)超过2M大小,数据无法采集同步到kafka,分析后,共踩到如下几个坑.1.flume采集时,通过shell+EXEC(tail -F ...
Flume简介与使用（二）——Thrift Source采集数据
Flume简介与使用(二)——Thrift Source采集数据继上一篇安装Flume后,本篇将介绍如何使用Thrift Source采集数据. Thrift是Google开发的用于跨语言RPC通信 ...

随机推荐

IOS- 堆和栈详解
Objective-C的对象在内存中是以堆的方式分配空间的,并且堆内存是由你释放的,即release 栈由编译器管理自动释放的,在方法中(函数体)定义的变量通常是在栈内,因此如果你的变量要跨函数的话就 ...
objective-c数组笔记
数组与可变数组 2015年6月14日 1.数组数组的初始化方式 1.初始化一个空数组 NSArray *array = [[NSArray alloc] init];//不可变数组,数组内不可以添加 ...
openssl/asn1.h file not found的解决方法
iOS 引入支付宝缺少 #include <openssl/asn1.h> 报错解决方法: 在 Building Settings -> Search Paths -& ...
supersr--addSubview和 insertSubView 区别
A addSubview B 是将B直接覆盖在A的最上层例子: [self.view addSubview:scrollView]; A insertSubView B AtIndex:2 是将 ...
in addition to 和 except for
except for 除了...以外(与 except for 连用的整体词与 except for 所跟的词往往不是同类的,是指整体中除去一个细节.) eg:Your composition is ...
数据存储--sqlite总结
SQLite SQLite(轻量级的数据库,关系型数据库) 辅助工具:Navicat Premium 等原理:ios针对存储问题封装了sqlite数据库(c语言数据库). 1 app获取沙盒地址命名 ...
iOS开发人员不容错过的10大工具
内容简介 1.iOS简介 2.iOS开发十大实用工具之开发环境 3.iOS开发十大实用工具之图标设计 4.iOS开发十大实用工具之原型设计 5.iOS开发十大实用工具之演示工具 6.iOS开发十大实用 ...
SVM NG课件1
SVM NG课件1 2014年9月28日 16:39 一个二维空间点的示例已使用 Microsoft OneNote 2013 创建.
【jquery】幻灯片效果
闲着无聊,用Jquery写了一个幻灯片效果. 我这人喜欢造轮子,除了jquery这种有强大开发团队的框架级别JS,其实的一些小程序都是尽量自己写. 一是因为怕出问题了没人问,二是自己写的改起来也方便. ...
MVC4 WEBAPI(一)使用概述
所谓概述,也就是总结一些WEB API常用的使用用法.MVC APIWEB是一个轻量级的服务接口,完全符合RestFul框架设计,每个URL代表一种资源,使用方便,没有WCF那么庞大,但是麻雀虽小五脏 ...

flume 使用 spool source的时候字符集出错

flume 使用 spool source的时候字符集出错的更多相关文章

随机推荐

热门专题