hadoop运维经验

0、优化：http://dongxicheng.org/mapreduce/hadoop-optimization-0/

http://dongxicheng.org/mapreduce/hadoop-optimization-1/

1、各个节点的配置文件的内容要一致：core|hdfs|mapred|yarn-site.xml。修改一个的节点的配置文件内容后，集群中所有的节点要同步修改，报错的原因大部分是由于节点之间配置文件不一致导致！

2、修改完配置文件后要重启hdfs或yarn服务。

3、有时会碰到修改配置文件后，重启hadoop的服务后，跑程序仍然会出错的问题，要先查一下添加的<name>xxx</name>有没有拼写错误，如果没有错误，就关闭服务然后重新启动集群(如果还报错，建议重启主机)。

4、各个节点的VERSION的clusterid要一致，否则会导致datanode自动关闭（删除VERSION或将各个节点的clusterid改成一致）。

5、经常备份集群可以正常运行的配置文件。

6、yarn运行程序是提示running in uber mode : false。uber mode是Hadoop的小作业模式，数据量小非常节约时间。可以设置 mapreduce.job.ubertask.enable=true生效

7、为了避免出现{WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable}这种错误，尽量应该安装64位的操作系统，否则就需要自己编译hadoop源码进行安装，比较麻烦。

8、在YARN启动mapreduce程序后，会在datanode上生成YarnChild，这个就是Container。

9、ssh输入正确密码还会denied，需要修改.ssh父目录的权限值，chmod 755 /hadoop

10、namenode无法启动（hadoop namenode异常）当查看 hadoop-hadoop-namenode-namenode.log产生报错

错误信息：

2016-09-20 11:48:52,409 WARN org.apache.hadoop.hdfs.server.namenode.FSNamesystem: Encountered exception loading fsimage
java.io.IOException: There appears to be a gap in the edit log. We expected txid 2289, but got txid 2859.
at org.apache.hadoop.hdfs.server.namenode.MetaRecoveryContext.editLogLoaderPrompt(MetaRecoveryContext.java:94)
at org.apache.hadoop.hdfs.server.namenode.FSEditLogLoader.loadEditRecords(FSEditLogLoader.java:215)
at org.apache.hadoop.hdfs.server.namenode.FSEditLogLoader.loadFSEdits(FSEditLogLoader.java:143)

..................

原因是namenode元数据被破坏了，需要修复

输入命令：hadoop namenode -recover

全都选择‘y'或 ‘c’ 即可。修复完毕后需要将各个datanode的current中的VERSION同步。可以备份current文件，然后在namenode上start-dfs.sh。如果不做这一步会导致datanode无法启动。

另外的方法：或许可以修改current下面 seen_txtid中的值？就不用全部删除{

怀疑是 NameNode 对元数据的合并出了问题，删除报错开始的 edits 文件，修改 seen_txid 中的 txid 编号；

启动 NN 成功，主备NN 均启动成功。

}

11、mapred.child.java.opts:当需要处理超大数据（mapper大于10？）最好将值设置成-Xmx1024m或者更高(-Xmx2048m)才能避免出现“核心已转储”这种jvm内存溢出的错误！！

待续...

hadoop运维经验的更多相关文章

JStorm开发经验+运维经验总结
1.开发经验总结 ——12 Sep 2014 · 8 revisions 在jstorm中, spout中nextTuple和ack/fail运行在不同的线程中, 从而鼓励用户在nextTuple里 ...
Elasticsearch运维经验总结
Elasticsearch运维经验总结 2018年12月10日 16:38:41 运小白阅读数 3811 版本说明:5.6.4(要严格注意ES及其插件.第三方工具的版本匹配关系) 系统负载:(日 ...
HBase运维经验
http://www.qconbeijing.com/download/Nicolas.pdf 重点看了下facebook做了哪些改进以及他们的运维经验,比较重要的有以下几点: 改进: 1 加强了行级 ...
一个兼职DBA的数据库运维经验小米科技 xx@xiaomi.com 2011
一个兼职DBA的数据库运维经验小米科技 xx@xiaomi.com 2011 内存扩容 16G->64G ,调大bp后,凌晨说监控物理内存有余量情况下,开吃swap,内存泄露措施1 定时 ...
Hadoop运维记录系列
http://slaytanic.blog.51cto.com/2057708/1038676 Hadoop运维记录系列(一) Hadoop运维记录系列(二) Hadoop运维记录系列(三) Hado ...
ZooKeeper 运维经验
转自:http://www.juvenxu.com/2015/03/20/experiences-on-zookeeper-ops/ ZooKeeper 运维经验 ZooKeeper 是分布式环境下非 ...
Hadoop运维
简单记录几个hdfs的运维命令 //查看hdfs的状态,是否有missing block,corrupt block等,也可以看datanode的状态 hdfs dfsadmin -report // ...
[转载] 多年积累的 mysql 运维经验
原文: http://mp.weixin.qq.com/s?__biz=MzA3MzYwNjQ3NA==&mid=207132223&idx=1&sn=f5d98146f282 ...
Zookeeper运维经验
转自:http://www.juvenxu.com/2015/03/20/experiences-on-zookeeper-ops/ ZooKeeper 是分布式环境下非常重要的一个中间件,可以完成动 ...

随机推荐

javascript中的删除方法
可能呢再开发的过程中呢使用的不是很多,但是碰上呢可以注意下 1.比如: var x = 10; delete x; console.log(x); 结果是多少,是10,不是异常也不是undefined ...
php有效的过滤html标签,js代码,css样式标签
过滤html标签�php中太简单了,我们可以直接使用strip_tags函数来实现了,下面给各位整理了一些关于 strip_tags函数的例子. php过滤html的函数:strip_tags(str ...
解决安装sql server 需要重启问题
解决办法: 一.在SQL服务器的安装盘中找到MSDE这个目录,并且点击setup.exe安装它. 二.安装完毕后,重启系统WINDOWSXP,这下就可以看到SQL服务的图标出现了. 三.再直接安装根目 ...
让dwz 在td里显示图片
让dwz 在td里显示图片 <!@{foreach from = $list item = element}@> <tr target="gid" rel=&qu ...
html 锚点的使用
html 锚点到底是干吗的?通俗简单地说,比如一篇很长的文章,你想按分段精确来看,那就可以用到锚点了. 代码:<a href="#001">跳到001</a&g ...
windows 精简/封装/部署
给一个精简过的Windows7安装net35,提示自己到『打开或关闭Windows功能』里打开,然而发现并没有,只有一个ie9的功能.搜索尝试各种办法,显然都不行.用dism部署功能的工具,挂载一个完 ...
SqlServer 不是主键如何自增
SqlServer 不是主键如何自增:INSERT INTO dbo.表 VALUES('14-19周',0,(select COUNT(1) from dbo.表)+1) (select COUN ...
14交互活动：XHTML表单
表单基本上就是带有一块输入信息区域的网页.当提交表单时,表单中的信息被打成一个数据包发送给web服务器,web应用程序对之经行处理.处理完成后,可以获得另一个相应页面. 使用<form>元 ...
关于Action快捷键和小键盘的问题
在使用全尺寸键盘的时候键盘右边都有一排小键盘但是这个小键盘的数字键值和普通键盘的数字键值是不一样的在ANSI码里标准数字键值是$30..$39, 而小键盘的键值是$60..$69 这样问题就来 ...
css3超过指定宽度文字,显示省略号
text-overflow:ellipsis; overflow:hidden; white-space:nowrap; width:200px;

hadoop运维经验

hadoop运维经验的更多相关文章

随机推荐

热门专题