即将上线的flume服务器面临的一系列填坑笔记

　　　　　　　　　　　　　　　　　　即将上线的flume服务器面临的一系列填坑笔记

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　作者：尹正杰

一.flume缺少依赖包导致启动失败！

报错信息如下：

2018-10-17 11:07:43,369 (conf-file-poller-0) [ERROR - org.apache.flume.node.PollingPropertiesFileConfigurationProvider$FileWatcherRunnable.run(PollingPropertiesFileConfigurationProvider.java:146)] Failed to start agent because dependencies were not found in classpath. Error follows.

　　上面的报错信息很明显的告诉了我们，缺少依赖包。没有找到依赖环境！我对比了线上的flume的lib目录下和我新集群的lib目录，发现是有点不一样！下图就是我线上的环境：

　　下图就是我新集群的环境：

　　此时相信大家看到这种情况，已经迫不及待的想把线上的jar包都拷贝过来，观察问题是否解决，没错，我也是这么想的，于是我将线上的jar包拷贝到了我的集群。如下图：

　　拷贝完成后，观察我的新集群的jar包和线上jar包环境是一致的！如下图：

　　我新集群的环境和线上的保持一致后，重新执行上述的错误就不在出现啦！

二.内存溢出，导致flume运行崩溃

解决了上面关于依赖包的问题，发现新错又出现了，报错OOM，报错信息如下：

Exception in thread "PollableSourceRunner-KafkaSource-kafkaSource" java.lang.OutOfMemoryError: GC overhead limit exceeded
at java.util.ArrayList.iterator(ArrayList.java:834)

Exception: java.lang.OutOfMemoryError thrown from the UncaughtExceptionHandler in thread "PollableSourceRunner-KafkaSource-kafkaSource"
Exception in thread "SinkRunner-PollingRunner-DefaultSinkProcessor" java.lang.OutOfMemoryError: GC overhead limit exceeded

Exception: java.lang.OutOfMemoryError thrown from the UncaughtExceptionHandler in thread "SinkRunner-PollingRunner-DefaultSinkProcessor"

　　相必须看到上述的报错的小伙伴应该都跟我一样，第一反应就是调大内存，在将堆内存调大之前，我们先看一下flume默认给我分配堆堆内存是多大，如下图：（我们看到flume默认指定堆堆大堆内存为20M，它崩溃了是理所当然的，毕竟我们公司的数据量也不小！）

　　你是不是很好奇，这个20M大小在哪里设置的呢？其实就是在flume-ng这个脚本里写死了，编辑你的flume-ng脚本，查看第225行，如下图：

　　找到原因呢后，我们可以修改这个上面的配置文件（/soft/apache-flume-1.7.0-bin/bin/flume-ng，这个路径跟你安装flume的路径去找，推荐使用which，find命令将他找出来！）参数（JAVA_OPTS="-Xmx10240m"），我们将20M改为10G，具体操作如下：

　　当然，如果你不想修改默认的参数，我们也可以在启动的时候修改JVM的堆内存空间。我在命令行启动flume进程的时候手动分配Java的堆内存大小为2G，如下图：

三.缺少Hadoop的运行环境导致无法通过kafka将数据拷贝到hdfs中。

报错信息如下：

2018-10-17 13:06:45,287 (SinkRunner-PollingRunner-DefaultSinkProcessor) [WARN - org.apache.flume.sink.hdfs.BucketWriter.getRefIsClosed(BucketWriter.java:182)] isFileClosed is not available in the version of HDFS being used. Flume will not attempt to close files if the close fails on the first attempt
java.lang.NoSuchMethodException: org.apache.hadoop.fs.LocalFileSystem.isFileClosed(org.apache.hadoop.fs.Path)

　　遇到上面的这种情况，首先请确认你的hdfs的环境是否安装了，我的flume机器上仅仅部署了jdk和flume环境，其他的环境都没部署。如果你跟我一样没有部署的话，我给你个思路：

　　　　1>.去Apache官网下载和你集群中hdfs版本一致的包，安装到你的服务器上；（我cdh默认hdfs版本是2.6.0，于是我就去官网下载相应的包：https://archive.apache.org/dist/hadoop/common/hadoop-2.6.0/）

　　　　2>.安装过程很简单，解压即可，然后在“/etc/profile”这个配置文件中配置一下环境变了，最后别忘记将你要上传到hdfs集群中的配置文件(core-site.xml和hdfs-site.xml )拷贝一份到本地，将这两个配置文件覆盖到本地到配置文件,配置文件生效后，需要使用“source /etc/profile”命令来重新加载一个系统的环境变量的配置文件，配置完成后我们可以通过下面的命令查看hdfs的版本。

　　　　按照上述方法操作后，我们再次运行flume，发现不报错了，数据也开始在hdfs中写了，是不是没有报错信息了？没有报错就是最好的结果，如下图：

　　接下来我们去集群的webUI查看相应的文件是否生产，果不其然，文件已经写到hdfs中了：

四.broker节点时间不同步导致的

报错信息如下：

2018-10-18 16:28:37,329 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.kafka.clients.consumer.internals.AbstractCoordinator$SyncGroupRequestHandler.handle(AbstractCoordinator.java:431)] SyncGroup for group flume-consumer-against_cheating_01 failed due to coordinator rebalance, rejoining the group
2018-10-18 16:28:37,957 (PollableSourceRunner-KafkaSource-kafkaSource) [WARN - org.apache.flume.channel.kafka.KafkaChannel$KafkaTransaction.doCommit(KafkaChannel.java:560)] Sending events to Kafka failed
java.util.concurrent.ExecutionException: org.apache.kafka.common.errors.TimeoutException: The request timed out.
at org.apache.kafka.clients.producer.internals.FutureRecordMetadata.valueOrError(FutureRecordMetadata.java:56)
at org.apache.kafka.clients.producer.internals.FutureRecordMetadata.get(FutureRecordMetadata.java:43)
at org.apache.kafka.clients.producer.internals.FutureRecordMetadata.get(FutureRecordMetadata.java:25)
at org.apache.flume.channel.kafka.KafkaChannel$KafkaTransaction.doCommit(KafkaChannel.java:552)
at org.apache.flume.channel.BasicTransactionSemantics.commit(BasicTransactionSemantics.java:151)
at org.apache.flume.channel.ChannelProcessor.processEventBatch(ChannelProcessor.java:194)
at org.apache.flume.source.kafka.KafkaSource.doProcess(KafkaSource.java:295)
at org.apache.flume.source.AbstractPollableSource.process(AbstractPollableSource.java:60)
at org.apache.flume.source.PollableSourceRunner$PollingRunner.run(PollableSourceRunner.java:133)
at java.lang.Thread.run(Thread.java:748)
Caused by: org.apache.kafka.common.errors.TimeoutException: The request timed out.

　　这个问题，困扰了我好久，百度谷歌接近2个小时，都没有找到答案，手动去kafka集群拉去数据也是可以正常拉去都，就是一直报上面都错误，最后我们运维小组都人一起在办公室帮我分析一下原因，我自己也纳闷，为什么上午还好好都，下午就不好使了。我一个同时说会不会是下午你让我同步Hadoop集群都时间了？导致这个错误都发生？我寻思了一番，于是重启了一下Hadoop集群，发现以上错误烟消云散啦！那么问题来了，为什么会这样的呢？

　　说到这，我们就不得不探讨一下Kafka的工作原理了。

即将上线的flume服务器面临的一系列填坑笔记的更多相关文章

即将上线的Spark服务器面临的一系列填坑笔记
即将上线的Spark服务器面临的一系列填坑笔记作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 把kafka和flume倒腾玩了,以为可以轻松一段时间了,没想到使用CDH部署的spa ...
即将上线的YARN服务器面临的一系列填坑笔记
即将上线的YARN服务器面临的一系列填坑笔记作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 折腾了一个星期,终于让开发将数据跑起来了,可通过yarn的webUI界面,发现这里的核心 ...
即将上线的Hive服务器面临的一系列填坑笔记
即将上线的Spark服务器面临的一系列填坑笔记作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.18/10/19 16:36:31 WARN metastore.ObjectSt ...
即将上线的Kafka服务器面临的一系列填坑笔记
即将上线的Kafka服务器面临的一系列填坑笔记作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.Kafka日志报错:[error] k.m.j.KafkaJMX$ - Fai ...
即将上线的Kafka 集群（用CM部署的）无法使用“--bootstrap-server”进行消费，怎么破？
即将上线的Kafka 集群(用CM部署的)无法使用“--bootstrap-server”进行消费,怎么破? 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.报错:org.a ...
http://182.92.241.20/mypro/login 偶的点金项目细化分包管理平台即将上线！！
http://182.92.241.20/mypro/login 偶的点金项目细化分包管理平台即将上线!! 敬请期待! 项目外包利器项目管理利器
<a href="javascript:void(0);" id='test' onclick="javascript:alert('即将上线，敬请期待！');"><em class="rmwd"></em>征稿平台</a>
<a href="javascript:void(0);" id='test' onclick="javascript:alert('即将上线,敬请期待!');&q ...
NGK生态商城即将上线官网，推动生态落地应用
NGK生态商城即将上线官网,以推动生态落地应用.此举意味着NGK生态将跻身区块链顶尖之列,同时,NGK代币.NGK Dapp游戏 "呼叫河马" 以及NGK DeFi项目Baccar ...
没想到即将上线的NGK生态应用这么厉害？！
话说这即将上线的NGK公链可不是闹着玩的,这条公链的蛰伏时间长达两年,恐怕这个准备时间,连最初的区块链1.0时代的项目都无法比拟,现在的话那都差太远了. 编程一段代码并不难,难的是耐得住赚快钱的心.人 ...

随机推荐

Linux内核第六节 20135332武西垚
如何描述一个进程:进程描述符的数据结构: 如何创建一个进程:内核是如何执行的,以及新创建的进程从哪里开始执行: 使用gdb跟踪新进程的创建过程. 进程的描述操作系统三大功能: 进程管理(最核心最基础 ...
嵌入式linux教程
串口通信minicom $ sudo apt-get install minicom ///安装 # minicom –s //运行 //CTRL+A Z 弹出菜单 2.NFS网络文件配置 ...
PAT 1008 数组元素循环右移问题
https://pintia.cn/problem-sets/994805260223102976/problems/994805316250615808 一个数组A中存有N(N&gt0)个整 ...
PGSQL 获取数据库大小以及表达小等的SQL
SELECT d.datname AS Name, pg_catalog.pg_get_userbyid(d.datdba) AS Owner, CASE WHEN pg_catalog.has_da ...
使用Hexo搭建Github静态博客
1. 环境环境 1.1 安装Git 默认配置就好 1.2 安装node.js 下载:http://nodejs.org/download/ 安装时直接保持默认配置即可. 2. 配置Github 1.1 ...
设计模式笔记：策略模式（Strategy）
1. 策略模式简介 1.1 定义策略是为达到某一目的而采取的手段或方法,策略模式的本质是目标与手段的分离,手段不同而最终达成的目标一致.客户只关心目标而不在意具体的实现方法,实现方法要根据具体的环境 ...
loadrunner基础学习笔记六-运行负载
controller视图: 场景组窗格:查看场景组内vuser状态,使用窗格右侧的按钮可以启动.停止和重置场景,查看各个vuser的状态,通过手动添加更多vuser增加场景运行期间应用程序的负载场 ...
MySQL在Read Uncommitted级别下写操作加X锁
很多文章认为MySQL在读未提交(Read Uncommitted)的隔离级别下,写操作是不加锁的,然而实际上并不是,在RU级别下,写操作加有X锁. 实践出真知以前,我也认为RU隔离级别下,写操作不 ...
servlet生成验证码代码
package forward; import java.awt.Color;import java.awt.Font;import java.awt.Graphics;import java.awt ...
Linux下创建和删除软、硬链接可临时处理空间不足
在Linux系统中,内核为每一个新创建的文件分配一个Inode(索引结点),每个文件都有一个惟一的inode号.文件属性保存在索引结点里,在访问文件时,索引结点被复制到内存在,从而实现文件的快速访问. ...

即将上线的flume服务器面临的一系列填坑笔记

即将上线的flume服务器面临的一系列填坑笔记的更多相关文章

随机推荐

热门专题