重启hdfs集群的时候，报大量的gc问题。

问题现象：

2019-03-11 12:30:52,174 INFO org.apache.hadoop.util.JvmPauseMonitor: Detected pause in JVM or host machine (eg GC): pause of approximately 7653ms

GC pool 'ConcurrentMarkSweep' had collection(s): count=1 time=7692ms

2019-03-11 12:31:00,573 INFO org.apache.hadoop.util.JvmPauseMonitor: Detected pause in JVM or host machine (eg GC): pause of approximately 7899ms

GC pool 'ConcurrentMarkSweep' had collection(s): count=1 time=7951ms

2019-03-11 12:31:08,952 INFO org.apache.hadoop.util.JvmPauseMonitor: Detected pause in JVM or host machine (eg GC): pause of approximately 7878ms

GC pool 'ConcurrentMarkSweep' had collection(s): count=1 time=7937ms

2019-03-11 12:31:17,405 INFO org.apache.hadoop.util.JvmPauseMonitor: Detected pause in JVM or host machine (eg GC): pause of approximately 7951ms

GC pool 'ConcurrentMarkSweep' had collection(s): count=1 time=8037ms

2019-03-11 12:31:26,611 INFO org.apache.hadoop.util.JvmPauseMonitor: Detected pause in JVM or host machine (eg GC): pause of approximately 8705ms

GC pool 'ConcurrentMarkSweep' had collection(s): count=1 time=8835ms

2019-03-11 12:31:35,009 INFO org.apache.hadoop.util.JvmPauseMonitor: Detected pause in JVM or host machine (eg GC): pause of approximately 7897ms

GC pool 'ConcurrentMarkSweep' had collection(s): count=1 time=8083ms

2019-03-11 12:31:43,806 INFO org.apache.hadoop.util.JvmPauseMonitor: Detected pause in JVM or host machine (eg GC): pause of approximately 8296ms

GC pool 'ConcurrentMarkSweep' had collection(s): count=1 time=8416ms

2019-03-11 12:31:52,317 INFO org.apache.hadoop.util.JvmPauseMonitor: Detected pause in JVM or host machine (eg GC): pause of approximately 8010ms

GC pool 'ConcurrentMarkSweep' had collection(s): count=1 time=8163ms

2019-03-11 12:32:00,680 INFO org.apache.hadoop.util.JvmPauseMonitor: Detected pause in JVM or host machine (eg GC): pause of approximately 7862ms

gc一段时间后出现：

2019-03-11 12:27:15,820 ERROR org.apache.hadoop.hdfs.server.namenode.NameNode: Failed to start namenode.

java.lang.OutOfMemoryError: Java heap space

        at java.lang.StringCoding$StringEncoder.encode(StringCoding.java:300)

        at java.lang.StringCoding.encode(StringCoding.java:344)

        at java.lang.String.getBytes(String.java:918)

        at java.io.UnixFileSystem.getBooleanAttributes0(Native Method)

        at java.io.UnixFileSystem.getBooleanAttributes(UnixFileSystem.java:242)

        at java.io.File.exists(File.java:819)

        at sun.misc.URLClassPath$FileLoader.getResource(URLClassPath.java:1282)

        at sun.misc.URLClassPath.getResource(URLClassPath.java:239)

        at java.net.URLClassLoader$1.run(URLClassLoader.java:365)

        at java.net.URLClassLoader$1.run(URLClassLoader.java:362)

        at java.security.AccessController.doPrivileged(Native Method)

        at java.net.URLClassLoader.findClass(URLClassLoader.java:361)

        at java.lang.ClassLoader.loadClass(ClassLoader.java:424)

        at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:349)

        at java.lang.ClassLoader.loadClass(ClassLoader.java:357)

        at org.apache.hadoop.hdfs.server.namenode.JournalSet.close(JournalSet.java:244)

        at org.apache.hadoop.hdfs.server.namenode.FSEditLog.close(FSEditLog.java:400)

        at org.apache.hadoop.hdfs.server.namenode.FSEditLogAsync.close(FSEditLogAsync.java:112)

        at org.apache.hadoop.hdfs.server.namenode.FSImage.close(FSImage.java:1408)

        at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.loadFSImage(FSNamesystem.java:1079)

        at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.loadFromDisk(FSNamesystem.java:681)

        at org.apache.hadoop.hdfs.server.namenode.NameNode.loadNamesystem(NameNode.java:666)

        at org.apache.hadoop.hdfs.server.namenode.NameNode.initialize(NameNode.java:728)

        at org.apache.hadoop.hdfs.server.namenode.NameNode.<init>(NameNode.java:953)

        at org.apache.hadoop.hdfs.server.namenode.NameNode.<init>(NameNode.java:932)

        at org.apache.hadoop.hdfs.server.namenode.NameNode.createNameNode(NameNode.java:1673)

        at org.apache.hadoop.hdfs.server.namenode.NameNode.main(NameNode.java:1741)

2019-03-11 12:27:15,827 INFO org.apache.hadoop.util.ExitUtil: Exiting with status 1: java.lang.OutOfMemoryError: Java heap space

2019-03-11 12:27:15,830 INFO org.apache.hadoop.hdfs.server.namenode.NameNode: SHUTDOWN_MSG:

或者出现下面的错误：

2019-03-11 11:09:16,124 ERROR org.apache.hadoop.hdfs.server.namenode.NameNode: Failed to start namenode.

java.lang.OutOfMemoryError: GC overhead limit exceeded

        at com.google.protobuf.CodedInputStream.<init>(CodedInputStream.java:573)

        at com.google.protobuf.CodedInputStream.newInstance(CodedInputStream.java:55)

        at com.google.protobuf.AbstractParser.parsePartialFrom(AbstractParser.java:199)

        at com.google.protobuf.AbstractParser.parsePartialDelimitedFrom(AbstractParser.java:241)

        at com.google.protobuf.AbstractParser.parseDelimitedFrom(AbstractParser.java:253)

        at com.google.protobuf.AbstractParser.parseDelimitedFrom(AbstractParser.java:259)

        at com.google.protobuf.AbstractParser.parseDelimitedFrom(AbstractParser.java:49)

        at org.apache.hadoop.hdfs.server.namenode.FsImageProto$INodeSection$INode.parseDelimitedFrom(FsImageProto.java:10867)

        at org.apache.hadoop.hdfs.server.namenode.FSImageFormatPBINode$Loader.loadINodeSection(FSImageFormatPBINode.java:233)

        at org.apache.hadoop.hdfs.server.namenode.FSImageFormatProtobuf$Loader.loadInternal(FSImageFormatProtobuf.java:250)

        at org.apache.hadoop.hdfs.server.namenode.FSImageFormatProtobuf$Loader.load(FSImageFormatProtobuf.java:176)

        at org.apache.hadoop.hdfs.server.namenode.FSImageFormat$LoaderDelegator.load(FSImageFormat.java:226)

        at org.apache.hadoop.hdfs.server.namenode.FSImage.loadFSImage(FSImage.java:937)

        at org.apache.hadoop.hdfs.server.namenode.FSImage.loadFSImage(FSImage.java:921)

        at org.apache.hadoop.hdfs.server.namenode.FSImage.loadFSImageFile(FSImage.java:794)

        at org.apache.hadoop.hdfs.server.namenode.FSImage.loadFSImage(FSImage.java:724)

        at org.apache.hadoop.hdfs.server.namenode.FSImage.recoverTransitionRead(FSImage.java:322)

        at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.loadFSImage(FSNamesystem.java:1052)

        at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.loadFromDisk(FSNamesystem.java:681)

        at org.apache.hadoop.hdfs.server.namenode.NameNode.loadNamesystem(NameNode.java:666)

        at org.apache.hadoop.hdfs.server.namenode.NameNode.initialize(NameNode.java:728)

        at org.apache.hadoop.hdfs.server.namenode.NameNode.<init>(NameNode.java:953)

        at org.apache.hadoop.hdfs.server.namenode.NameNode.<init>(NameNode.java:932)

        at org.apache.hadoop.hdfs.server.namenode.NameNode.createNameNode(NameNode.java:1673)

        at org.apache.hadoop.hdfs.server.namenode.NameNode.main(NameNode.java:1741)

2019-03-11 11:09:16,127 INFO org.apache.hadoop.util.ExitUtil: Exiting with status 1: java.lang.OutOfMemoryError: GC overhead limit exceeded

解决：

打开hadoop-env.sh文件，找到HADOOP_HEAPSIZE= 和HADOOP_NAMENODE_INIT_HEAPSIZE= 调整这两个参数，具体调整多少，视情况而定，默认是1000m，也就是一个g，我这里调整如下：

export HADOOP_HEAPSIZE=32000

export HADOOP_NAMENODE_INIT_HEAPSIZE=16000                  这两个参数去掉前面的#号，两台namenode节点都要调整

接着重新启动hdfs，如果还不行，打开hadoop-env.sh文件，找到HADOOP_NAMENODE_OPTS

export HADOOP_NAMENODE_OPTS="-Dhadoop.security.logger=${HADOOP_SECURITY_LOGGER:-INFO,RFAS} -Dhdfs.audit.logger=${HDFS_AUDIT_LOGGER:-INFO,NullAppender}  $HADOOP_NAMENODE_OPTS"    ----这是系统默认值

调整如下：

export HADOOP_NAMENODE_OPTS="-Dhadoop.security.logger=${HADOOP_SECURITY_LOGGER:-INFO,RFAS} -Dhdfs.audit.logger=${HDFS_AUDIT_LOGGER:-INFO,NullAppender}  -Xms6000m -Xmx6000m -XX:+UseCompressedOops -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:+CMSClassUnloadingEnabled -XX:+UseCMSCompactAtFullCollection -XX:CMSFullGCsBeforeCompaction=0 -XX:+CMSParallelRemarkEnabled -XX:+DisableExplicitGC -XX:+UseCMSInitiatingOccupancyOnly -XX:CMSInitiatingOccupancyFraction=75 -XX:SoftRefLRUPolicyMSPerMB=0 $HADOOP_NAMENODE_OPTS"

接着重新启动hdfs，如果还是报上面的错误，那就继续调大上面

HADOOP_HEAPSIZE和

HADOOP_NAMENODE_INIT_HEAPSIZE  的值

重启hdfs集群的时候，报大量的gc问题。的更多相关文章

vivo 万台规模 HDFS 集群升级 HDFS 3.x 实践
vivo 互联网大数据团队-Lv Jia Hadoop 3.x的第一个稳定版本在2017年底就已经发布了,有很多重大的改进. 在HDFS方面,支持了Erasure Coding.More than 2 ...
大数据学习之hdfs集群安装部署04
1-> 集群的准备工作 1)关闭防火墙(进行远程连接) systemctl stop firewalld systemctl -disable firewalld 2)永久修改设置主机名 vi ...
HDFS集群常见报错汇总
HDFS集群常见报错汇总作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.DataXceiver error processing WRITE_BLOCK operation 报 ...
大数据学习笔记03-HDFS-HDFS组件介绍及Java访问HDFS集群
HDFS组件概述 NameNode 存储数据节点信息及元文件,即:分成了多少数据块,每一个数据块存储在哪一个DataNode中,每一个数据块备份到哪些DataNode中这个集群有哪些DataNode ...
马士兵hadoop第二课：hdfs集群集中管理和hadoop文件操作
马士兵hadoop第一课:虚拟机搭建和安装hadoop及启动马士兵hadoop第二课:hdfs集群集中管理和hadoop文件操作马士兵hadoop第三课:java开发hdfs 马士兵hadoop第 ...
马士兵hadoop第二课：hdfs集群集中管理和hadoop文件操作（转）
马士兵hadoop第一课:虚拟机搭建和安装hadoop及启动马士兵hadoop第二课:hdfs集群集中管理和hadoop文件操作马士兵hadoop第三课:java开发hdfs 马士兵hadoop第 ...
大数据（2）---HDFS集群搭建
一.准备工作 1.准备几台机器,我这里使用VMware准备了四台机器,一个name node,三个data node. VMware安装虚拟机:https://www.cnblogs.com/niju ...
HDFS集群balance（2）-- 架构概览
转载请注明博客地址:http://blog.csdn.net/suileisl HDFS集群balance,对应版本balance design 6 如需word版本,请QQ522173163联系索要 ...
HDFS集群balance（3）-- 架构细节
转载请注明博客地址:http://blog.csdn.net/suileisl HDFS集群balance,对应版本balance design 6 如需word版本,请QQ522173163联系索要 ...

随机推荐

threejs CameraHelper 查看照相机的观察范围
简单例子这个例子,是在一个视图中,看到照相机的辅助线,也就是,一个照相机的观察访问这样,就需要两个照相机,一个是主照相机,一个是加有辅助线的照相机(有两种,正交和透视,这里辅助的使用的是正交的) ...
阿里云服务器（Ubuntu16.04 64位）的使用
购买阿里云服务器 1.打开阿里云官方网站,账号登录,选择产品中的云服务器 ECS 2.根据自身需求,选择合适的阿里云服务器系统,(1)点击一键购买,(2)选择地域,(3)根据自身需求,选择系统,这里选 ...
Linux安全：Linux如何防止木马
(一)解答战略去企业面试时是有多位竞争者的,因此要注意答题的维度和高度,一定要直接秒杀竞争者,搞定高薪offer. (二)解答战术因为Linux下的木马常常是恶意者通过Web的上传目录的方式来上传 ...
Flutter中的按钮组件介绍
Flutter 里有很多的 Button 组件很多,常见的按钮组件有:RaisedButton.FlatButton.IconButton.OutlineButton.ButtonBar.Floati ...
MySQL面试问题
1.MySQL的复制原理以及流程 (1).复制基本原理流程 1. 主:binlog线程——记录下所有改变了数据库数据的语句,放进master上的binlog中: 2. 从:io线程——在使用start ...
安装pytest
1.安装pytest 2.执行一个用例进入测试用例目录下,运行以test开头的一个用例. 执行成功. 备注:1.其实测试函数或方法只要以test开头就可以被运行的2.测试文件的名字,其实可以是任意的 ...
网站添加logo图片
网站添加log图片第一种方法这里使用的图片一般为16*16大小的图片 <link rel="shortcut icon" href="http://xxx.xx ...
关于WAMP的apache 人多了就访问非常卡的问题解决方法
一直用WAMP 但人多了(在线人数上了500) 就卡得不得了而这时服务器负载却很小 CPU15% 内存25% 整了好久都没个结果偶然看到一篇教程原来是连接数限制的问题改了就速度飞快了打开ap ...
cc 视频的使用
1. 先上传视频 2.复制代码 3.贴在页面上就可以使用了 4.通过id指定播放那个视频
jquery头部高亮显示方法
做网站都有头部导航栏,但导航栏的高亮显示一般都是后台技术人员做传参判断来显示高亮样式,今天来教大家一个用jquery来显示废话不多说,直接上代码第一步,在需要的页面中写入 <input ty ...

重启hdfs集群的时候，报大量的gc问题。

重启hdfs集群的时候，报大量的gc问题。的更多相关文章

随机推荐

热门专题