RHEL6 kernel bug在hadoop上的测试

最近给hadoop集群升级了RHEL6，发现性能比之前的差了不少。发现淘宝内核组发现并解决了这个问题

原文链接：http://blog.donghao.org/2013/03/20/hadoop%E9%9B%86%E7%BE%A4%E4%B8%8A%E6%8D%89%E5%88%B0kernel-bug%E4%B8%80%E4%B8%AA/

于是在测试机器上面跑了一下对比，收货很大：

环境介绍：

测试机型：IBM X3630 M3 48G 12X2TSAS

集群：master 1台，salve3台

测试方式：官方terasort

测试数据：100G （10亿条，每条100字节）

Map个数：736

Reduce个数：30

测试结果：

1. Job用时对比：

	1	2	3	4	5	6	7	平均用时
自带内核用时	7m30s	8m10s	8m7s	8m15s	8m6s	8m3s	8m16s	8m8s
打patch后用时	6m40s	6m45s	6m44s	6m45s	6m49s	6m53s	7m1s	6m48s

七次平均用时对比（去掉最大最小取平均），打patch后用时少了16%。

2. BenchMark数据对比

BenchMark	自带内核	打patch后	对比
ReduceShufferTime	2804003	1950012	下降30%
ReduceSortTime	122149	113363	下降7%
MapNextKeyTime	3503416	3629686	上升4%
ReduceNextKeyTime	56035	57081	上升2%
ReduceUserTime	2319175	1881118	下降19%
MapUserTime	6621552	5504168	下降17%
CPU time spent (ms)	20498470	16503790	下降19%
Total committed heap usage (byte)	595103383552	594591481856	持平
Physical memorg (bytes)	363650875392	353246367744	持平
Virtual memory (bytes)	1561136439296	1560911613952	持平

3. 系统状况

没有使用ganglia等工具，大体数据如下：

	cpu峰值	load峰值	内存使用
自带内核用时	92%	40	8%
打patch后用时	90%	32	10%

4. 结论

从测试数据看，无论是直观的job用时，还是benchmark数据，打patch后性能均有明显的提升。

BenchMark的耗时在shuffle阶段提升最明显，shuffle阶段也正是IO最密集的时候，跟原文对IO的改进基本吻合。

RHEL6 kernel bug在hadoop上的测试的更多相关文章

线上centos6出现软死锁 kernel:BUG: soft lockup
线上centos6出现软死锁 kernel:BUG: soft lockup 今天线上一台centos6机器用xshell一直连接不上,然后在xshell上显示 Message from syslog ...
让python在hadoop上跑起来
duang~好久没有更新博客啦,原因很简单,实习啦-好吧,我过来这边上班表示觉得自己简直弱爆了.第一周,配置环境:第二周,将数据可视化,包括学习了excel2013的一些高大上的技能,例如数据透视表和 ...
在Hadoop上运行基于RMM中文分词算法的MapReduce程序
原文:http://xiaoxia.org/2011/12/18/map-reduce-program-of-rmm-word-count-on-hadoop/ 在Hadoop上运行基于RMM中文分词 ...
I.MX6 Kernel BUG at include/linux/netdevice.h:520!
/*************************************************************************** * I.MX6 Kernel BUG at i ...
在Hadoop上用Python实现WordCount
一.简单说明本例中我们用Python写一个简单的运行在Hadoop上的MapReduce程序,即WordCount(读取文本文件并统计单词的词频).这里我们将要输入的单词文本input.txt和Py ...
【技术博客】Postman接口测试教程 - 环境、附加验证、文件上传测试
Postman接口测试教程 - 环境.附加验证.文件上传测试 v1.0 作者:ZBW 前言继利用Postman和Jmeter进行接口性能测试之后,我们发现Postman作为一款入门容易的工具,其内置 ...
[转帖]上云测试，这些关键点你get 到没有
上云测试,这些关键点你get 到没有 https://www.cnblogs.com/mypm/p/10852656.html?tdsourcetag=s_pcqq_aiomsg sticky 还有s ...
分布式文件系统 - FastDFS 配置 Nginx 模块及上传测试
也不说废话,直接干上一篇分布式文件系统 - FastDFS 在 CentOS 下配置安装部署中安装了 FastDFS 后,并配置启动了 Tracker 和 Storage 服务,已经可以上传文件 ...
微软官方网站线上兼容测试平台-Browser screenshots
前端开发时最不想做的就是在不同浏览器.平台和分辨率测试网页显示效果,通常这会浮现许多问题,尤其浏览器版本就可能让显示成效完全不同,也只好尽力维持让每一种设备都能正常浏览网页.修改到完全没有问题必须投入 ...

随机推荐

取石子游戏 HDU 1527 博弈论威佐夫博弈
取石子游戏 HDU 1527 博弈论威佐夫博弈题意有两堆石子,数量任意,可以不同.游戏开始由两个人轮流取石子.游戏规定,每次有两种不同的取法,一是可以在任意的一堆中取走任意多的石子:二是可以在两 ...
ubuntu14 teamviewer使用
一. 软件安装 1.1. 下载.deb文件下载13版本的,不要下载最新版本的 1.2. 环境配置 <1>. sudo dpkg --add-architecture i386 <2 ...
2019 CSP-S初赛游记
2019-10-19 ——这个注定要被载入史册的日子作为一名初中生,和lpy大佬一同参加提高组的比赛,而今年普及组和提高组的时间竟然不一样,于是——凌晨六点半,来到了pdyz和高中生一起坐车去. 高 ...
【JZOJ 3910】Idiot 的间谍网络
题面: Description 作为一名高级特工,Idiot 苦心经营多年,终于在敌国建立起一张共有n 名特工的庞大间谍网络. 当然,出于保密性的要求,间谍网络中的每名特工最多只会有一名直接领导.现在 ...
剑指offer-树的子结构-python
题目描述输入两棵二叉树A,B,判断B是不是A的子结构.(ps:我们约定空树不是任意一个树的子结构) 思路空树不是任意一个树的子结构,如果 root1 与root2 中有一个为空树的话,返回 ...
SQL性能优化概要
基本概要 1.查询的模糊匹配时,避免使用Like '%开头',使得索引失效 2.索引问题 ◆ 避免对索引字段进行运算操作和使用函数 ◆ 避免在索引字段上使用not,<>,!= ◆ 避免在索 ...
DOM属性和事件
1-22 DOM属性设置与获取 1.获取属性: getAttribute("attribute"): var p = document.getElementById(" ...
mysql分组查询及其测试用例
语法: select 查询列表 from 表 [where 筛选条件] group by 分组的字段 [order by 排序的字段]; 特点: 1.和分组函数一同查询的字段必须是group by后出 ...
可视化缺失值的办法——R语言
在数据分析中,对缺失值的处理是很关键一步,一般用summary()函数 a<-c(,,,NA) B<-c("a","b","c" ...
合肥学院ACM集训队第一届暑假友谊赛 B FYZ的求婚之旅 D 计算机科学家 F 智慧码题解
比赛网址:https://ac.nowcoder.com/acm/contest/994#question B FYZ的求婚之旅思路: 然后用快速幂即可. 细节见代码: #include <i ...

RHEL6 kernel bug在hadoop上的测试

RHEL6 kernel bug在hadoop上的测试的更多相关文章

随机推荐

热门专题