cdh日常维护常见问题及解决方案

为数据节点添加新硬盘

- 挂载硬盘到指定文件夹。如`/dfs_diskb`；

- 打开cloudera manager -> hdfs -> 配置 -> DataNode -> DataNode Default Group,添加新硬盘所挂载的目录，注意节点所在群；

- 重启hdfs服务。

hdfs数据平衡

在主节点（其它节点未测试）执行命令:sudo -u hdfs hdfs balancer。

集群时钟同步

- ntp服务端和外网同步：`sudo /etc/init.d/ntp restart`

-　客户端与内网ntp服务器同步`sudo ntpdate ntp_server_ip`

hive表在生成过程中产生过多的小文件导致chd报警，`Concerning : The DataNode has 814,837 blocks. Warning threshold: 500,000 block(s).`

- 通过命令`hadoop fsck /user/hive/warehouse/db_name`查询后发现该数据块下平均文件块仅仅为5kb，远远小于128m。

- 设置参数似的hive在存储sql执行后对执行结果中的大小较小的文件进行合并

```

hive.merge.mapfiles 在map-only job后合并文件，默认true

hive.merge.mapredfiles 在map-reduce job后合并文件，默认false

hive.merge.size.per.task 合并后每个文件的大小，默认256000000

hive.merge.smallfiles.avgsize 平均文件大小，是决定是否执行合并操作的阈值，默认16000000

```

修改hive的配置参数

<name>mapred.max.split.size</name><value>512000000</value></property><property><name>hive.merge.mapredfiles</name><value>true</value></property><property><name>hive.exec.compress.output</name><value>true</value></property><property><name>mapred.min.split.size.per.node</name><value>100000000</value></property><property><name>hive.merge.smallfiles.avgsize</name><value>64000000 </value></property>

对于输出文件是压缩文件的，需要将表的存储格式修改为SEQUENCEFILE

NFS Gateway服务启动失败

原因：节点已经启动了nfs服务，需要关闭

命令：sudo service nfs-kernel-server stop

重启该服务，成功上线

host monitor与agent失去连接

造成该问题的原因是在root权限下启动了cloudera manager服务。可以关闭当前的cloudera manager服务，然后在非root用户下来启动cloudera manager的angent和service服务，问题解决。

cdh日常维护常见问题及解决方案的更多相关文章

oracle 容灾库日常维护 ,健康检查脚本以及常见问题分析
select DEST_ID, APPLIED_SCN FROM v$archive_dest select * from v$dataguard_status; SELECT gvi.thread# ...
MapReduce On Yarn的配置详解和日常维护
MapReduce On Yarn的配置详解和日常维护作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.MapReduce运维概述 MapReduce on YARN的运维主要是 ...
XHTML CSS 常见问题和解决方案
原文地址:XHTML CSS 常见问题和解决方案作为前端开发人员,在日常的页面制作时,不可避免的会碰上这样那样的问题,我挑选了其中的一些进行总结归档,希望对大家会有所帮助: 1.如何定义高度很小的容 ...
Redis常见问题及解决方案
在Redis的运维使用过程中你遇到过那些问题,又是如何解决的呢?本文收集了一些Redis的常见问题以及解决方案,与大家一同探讨. 码字不易,欢迎大家转载,烦请注明出处:谢谢配合你的Redis有big ...
ORACLE分区表梳理系列（二）- 分区表日常维护及注意事项（红字需要留意）
版权声明:本文发布于http://www.cnblogs.com/yumiko/,版权由Yumiko_sunny所有,欢迎转载.转载时,请在文章明显位置注明原文链接.若在未经作者同意的情况下,将本文内 ...
数据库日常维护-CheckList_01历史Agent Job执行情况检查
检查Agent Job中日常维护作业或业务作业是否成功,如每天的备份.碎片整理.索引维护.历史备份文件清除等,可利用SSMS工具,通过CDC下面设置好的DB Server List,运行下面脚本一次, ...
《PDF.NE数据框架常见问题及解决方案-初》
<PDF.NE数据框架常见问题及解决方案-初> 1.新增数据库后,获取标识列的值: 解决方案: PDF.NET数据框架,已经为我们考略了很多,因为用PDF.NET进行数据的添加操作时 ...
MS SQL 日常维护管理常用脚本(二)
监控数据库运行下面是整理.收集监控数据库运行的一些常用脚本,也是MS SQL 日常维护管理常用脚本(一)的续集,欢迎大家补充.提意见. 查看数据库登录名信息 Code Snippet SELEC ...
2.goldengate日常维护命令(转载)
goldengate日常维护命令发表于 2013 年 7 月 4 日由 Asysdba 1.查看进程状态 GGSCI (PONY) 2> info all 2.查看进程详细状态,有助于排错 ...

随机推荐

VueJS第2天初阅API（初识MarkDown）
指令是带有前缀 v-,以表示它们是 Vue 提供的特殊特性.可能你已经猜到了,它们会在渲染的 DOM 上应用特殊的响应式行为 v-bind --> 数据绑定 v-for --> 循环 v- ...
orm 复习
day70 2018-05-14 1. 内容回顾 1. ORM 1. ORM常用字段和属性 1. AutoField(primary_key=True) 2. CharField(max_length ...
orm 扩展
"""ORM小练习如何在一个Python脚本或文件中加载Django项目的配置和变量信息""" import os if __name_ ...
SPOJ 1811 LCS - Longest Common Substring
思路和SPOJ 1812 LCS2 - Longest Common Substring II一个思路,改成两个串就有双倍经验了代码 #include <cstdio> #includ ...
Linux 下 LXD 容器搭建 Hadoop 集群
配置要求主机内存 4GB . 磁盘 100 GB 以上. HOST 机安装常用 Linux 发行版. Linux Container ( LXD ) 以主机 ubuntu 16.04 为例. 安装 ...
dao层、service和action的运用和区别
DAO层叫数据访问层,全称为data access object,属于一种比较底层,比较基础的操作,对于数据库的操作,具体到对于某个表的增删改查, 也就是说某个DAO一定是和数据库的某一张表一一对应的 ...
mint修改host
sudo xed /etc/hosts # Pycharm 0.0.0.0 account.jetbrains.com0.0.0.0 www.jetbrains.com #sublime text3 ...
关于Oracle单行函数的讲解
单行函数:对单个数值进行操作,并返回一个值. 分类:1.字符函数 1)concat(a,b) 拼接a,b两个字符串数据 2)initcap(x) 将每个单词x首字母大写 3)low ...
python -- 返回函数、匿名函数、装饰器
返回函数高阶函数的参数可以是函数,那么其返回值也可以是函数. 闭包对于高阶函数,内部函数可以引用外部函数的参数和局部变量.当调用外部函数返回内部函数时,相关参数和变量都保存在返回的函数(即内部函数 ...
可编程并行接口8255A详解