hadoop面试时的一些问题解答
一、 linux部分
- 请阐述swap分区作用,您认为hadoop集群中的linux是否必须有swap分区?
答:在Linux中,如果一个进程的内存空间不足,那么,它会将内存中的部分数据暂时写到磁盘上,当需要时,再将磁盘上的数据动态置换到内存中,通常而言,这种行为会大大降低进程的执行效率。在MapReduce分布式计算环境中,用户完全可以通过控制每个作业处理的数据量和每个任务运行过程中用到的各种缓冲区大小,避免使用swap分区。
具体方法是调整/etc/sysctl.conf文件中的vm.swappiness参数。vm.swappiness有效范围是0~100,值越高表明内核应该更积极将应用程序的数据交换到磁盘,较低的值表示将延迟这种行为,而不是强制丢弃文件系统的缓冲区。
参考链接:http://www.aixchina.net/Question/172307
- 请根据free -g -t,说明内存使用情况,给出剩余内存和可用内存大小。
Total userd free shared buffers cached
Mem: 62 56 6 0 0 45
-/+ buffers/cache: 10 52
Swap: 19 0 19
Total: 82 56 26
答:剩余内存等于userd-buffers-cache,即-buffers/cache的值10
可用内存等于free+buffers+cache,即+buffers/cache的值52
参考链接:http://www.cnblogs.com/pengdonglin137/p/3315124.html
- 请说明ssh-copy-id hadoop@host命令实现的作用
答:ssh-copy-id 将本机的公钥复制到远程机器的authorized_keys文件中
- 写一个脚本,实现批量添加20个用户,用户名为hdfs01-20,密码为用户名后面跟5个随机字符。
#!/bin/bash
for i in seq 1 9
do
pwd=$(cat /dev/urandom | head -1 | md5sum | head -c 5)
username=hdfs0$i
useradd username
echo "${username}$pwd" | passwd --stdin user$i
echo ${username} ${username}$pwd" >> userinfo.txt
done
for i in seq 10 20
do
pwd=$(cat /dev/urandom | head -1 | md5sum | head -c 5)
useradd hdfs$i
echo "hdfs$i$pwd" | passwd --stdin user$i
echo hdfs$i hdfs$i$pwd" >> userinfo.txt
done
- 查看当前系统中每个IP的连接数
netstat -n |awk ‘/^tcp/ {print $5}’|awk -F: ‘{print $1}’|sort|uniq -c|sort -rn
其中uniq -c是求uv,sort -rn 是降序,以数字顺序排序
参考值:http://yuangeqingtian.blog.51cto.com/6994701/1191651
- 写出查找yarn-hdfs-resourcemanager-master01.log包含error(不区分大小写)字符前后各15行的命令
答案:cat yarn-hdfs-resourcemanager-master01|grep -i ‘error’-C 15
- 写出查找当前时间48小时之前的hdfs用户的普通文件并删除的命令。
答:find -mtime +2 -user hdfs -type f -exec rm {} \
参考自:http://www.2cto.com/os/201208/149552.html
- 写出显示/usr/local/nagios/etc/nrpc.cfg文件中出去以#开头和空行的所有内容的命令。
答:cat /usr/local/nagios/etc/nrpc.cfg |grep ‘^#’
cat /usr/local/nagios/etc/nrpc.cfg |grep ‘^$’
- 假设有200台HADOOP主机,slave001到slave200,在开启ssh互信的情况下,编写脚本实现在任意主机上执行批量查看磁盘大小的功能
期望结果:
Slave001:
/dev/sdb1 ext4 548G 224G 297G 43% /data/disk01s
Slave002:
/dev/sdb1 ext4 548G 224G 297G 43% /data/disk01s
Slave003:
...
答:
vim ssh_cmd.sh
#!/bin/bash
cmd=$1
for((i=1;i<=200;i++))
do
a=$((1000+$i))
user=Slave${a:1}
echo ${user}:
ssh ${user}
out=cmd
echo ${out}
done
sh ssh_cmd.sh `df -h /dev/sdb1`
二、HADOOP部分
- Hadoop自身具有严格的权限管理和安全措施保证集群正常运行。(F)
- NameNode负责管理metadata,client端每次读写请求,它都会从磁盘中读取或者写入metadata信息并反馈client端。(F)
- Hadoop2.0以上版本支持热部署,修改fair-scheduler.xml或capacity-scheduler.xml文件,调度策略自动生效。(F)
- HDFS文件支持随机读写。(F)
- Hadoop默认调度器为公平调度,队列内部是FIFO策略。(F)
- 不同版本hadoop集群之间数据迁移如何实现(给出两种实现方法)
答:1.使用distcp命令,例如hadoop distcp hftp://10.4.2.41:50070/user hdfs://nn2:8020/bar/foo
参考自:http://www.tuicool.com/articles/INJZVfY
2.小数据量hadoop -get拷贝到本地,在scp到新集群
- 用什么命令查看hadoop相关进程的详细情况
答:jps
- 如何查看集群中的job的状态,如何杀掉指定用户的所有job(命令行),写出命令。
答:
mapreduce(yarn-core)web界面查看job详细
for i in `hadoop job -list | grep -w username| awk '{print $1}' | grep job_`;
do
hadoop job -kill $i;
done
- 如何给用户限制使用HDFS文件系统的大小,如限制用户hadoop大小为10T,写出命令。
答:
10.如何统计某一HDFS目录下的文件数
答:hadoop fs -ls /tmp |wc -l
11.如何快速定位某个hadoop进程的输出日志。
答:Hadoop 2.x中YARN系统的服务日志包括ResourceManager日志和各个NodeManager日志,他们的日志位置如下:
ResourceManager日志存放位置是Hadoop安装目录下的logs目录下的yarn-*-resourcemanager-*.log
NodeManager日志存放位置是各个NodeManager节点上hadoop安装目录下的logs目录下的yarn-*-nodemanager-*.log
应用程序日志包括jobhistory日志和Container日志,其中,jobhistory日志是应用程序运行日志,包括应用程序启动时间、结束时间,每个任务的启动时间、结束时间,各种counter信息等。
Container日志包含ApplicationMaster日志和普通Task日志,它们均存放在Hadoop安装目录下的userlogs目录中的application_xxx目录下,其中ApplicationMaster日志目录名称为container_xxx_000001,普通task日志目录名称则为container_xxx_000002,container_xxx_000003,….,同Hadoop 1.x一样,每个目录下包含三个日志文件:stdout、stderr和syslog,且具体含义是一样的。
12.列出您使用过的hadoop常用命令和集群管理工具。
13.列出您运维或部署过的Hadoop生态圈相关的组件
14.写出你做过的hadoop集群优化措施以及收到的效果
15.谈谈您对mapreduce和spark的看法
hadoop面试时的一些问题解答的更多相关文章
- hadoop面试时可能遇到的问题
面试hadoop可能被问到的问题,你能回答出几个 ? 1.hadoop运行的原理? 2.mapreduce的原理? 3.HDFS存储的机制? 4.举一个简单的例子说明mapreduce是怎么来运行的 ...
- hadoop面试100道收集(带答案)
1.列出安装Hadoop流程步骤 a) 创建hadoop账号 b) 更改ip c) 安装Java 更改/etc/profile 配置环境变量 d) 修改host文件域名 e) 安装ssh 配置无密码登 ...
- 面试时遇到的SQL
CustomerID DateTime ProductName Price C001 2014-11-20 16:02:59 123 PVC 100 C001 2014-11-19 16:02:59 ...
- (Java后端 Java web)面试时如何展示自己非技术方面的能力(其实就是综合能力)
这篇文章的适用范围其实不仅限于Java后端或Java Web,不过其中有些是拿这方面举例的,在其它方面,大家可以举一反三,应该也能得到些启示. 我们在面试时,会发现有些候选人技术不错,比如在Java ...
- 面试时,当你有权提问时,别客气,这是个逆转的好机会(内容摘自Java Web轻量级开发面试教程)
前些天,我在博客园里写了篇文章,如何在面试中介绍自己的项目经验,收获了2千多个点击,这无疑鼓舞了我继续分享的热情,今天我来分享另外一个面试中的甚至可以帮助大家逆转的技巧,本文来是从 java web轻 ...
- 通过软引用和弱引用提升JVM内存使用性能的方法(面试时找机会说出,一定能提升成功率)
初学者或初级程序员在面试时如果能证明自己具有分析内存用量和内存调优的能力,这相当有利,因为这是针对5年左右相关经验的高级程序员的要求.而对于高级程序员来说,如果能在面试时让面试官感觉你确实做过内存调优 ...
- 面试时怎样回答:你对原生ajax的理解
很多人跟我一样用习惯了jq封装好的$.ajax,但是面试时,原生ajax是很多面试官喜欢问的问题,今天再查资料,打算好好整理一下自己理解的原生ajax. 首先,jq的ajax:一般我常用的参数就是这些 ...
- hadoop启动时,报ssh: Could not resolve hostname xxx: Name or service not known
本文转载自:http://blog.csdn.net/wodewutai17quiet/article/details/76795951 问题:hadoop启动时,报ssh: Could not re ...
- 反省在北京某S2B2C电商小型公司面试时掉链子的问题
昨天,参与北京一家公司面试时,不知道为什么,错了很多题,这些题在该家公司之前已经被问很多次了,当天精神恍惚的没答上来或答错,被问到数据库优化和乐观锁的问题,首先我谈到了存储引擎底层的数据结构 B树/B ...
随机推荐
- c#访问Oracle问题及解决方法
Q:访问oracle 查询条件带汉字结果集为空的问题 A:数据库连接字符串中加入Unicode=true即可. 如 <add key="DbConnectionString" ...
- Python 包的相对导入讲解
[Python 包的相对导入讲解] 参考:http://www.dai3.com/python-import.html
- jQuery数组处理汇总
jQuery数组处理汇总 有段时间没写什么了, 打算把jquery中的比较常用的数组处理方法汇总一下 $.each(array, [callback])遍历,很常用 1 2 3 4 5 6 7 8 ...
- 第2章 C#中的泛型
2.1 理解泛型2.1.1 为什么要有泛型 并不一定要使用字符T作为类型参数的名称,也可以使用其他的字符,但习惯上使用T. 2.1.2 类型参数约束什么是“向下的强制转换(downcast)”?因为O ...
- pip使用
安装指定版本的插件: pip install -v matplotlib==1.5.1 #安装matplotlib version 1.5.1
- Selenium2+python自动化20-Excel数据参数化
前言 问: Python 获取到Excel一列值后怎么用selenium录制的脚本中参数化,比如对登录用户名和密码如何做参数化? 答:可以使用xlrd读取Excel的内容进行参数化.当然为了便于各位小 ...
- 状态机学习(三)解析JSON
来自 从零开始的 JSON 库教程 从零开始教授如何写一个符合标准的 C 语言 JSON 库 作者 Milo Yip https://zhuanlan.zhihu.com/json-tutorial ...
- GDB的Breakpoint, Watchpoint和Catchpoint
Breakpoint : 设置断点比较直接,在某处停止 Watchpoint : 观察点,即某个变量/表达式发生变化时,停止.可扩展为变量被读/被写/被读or写时都停止 Catchpoint : 在发 ...
- <雨季>
忘不了节后漫长的雨季,灰暗阴冷的天气,潮湿的心情,总让我怀念家乡刺眼的阳光,即使在寒冷的冬季,唯有那窗外的紫荆花独自开放.飘落满地,给灰色的世界增添点色彩,合着同学们上早课的笑声,暂时排遣那一份思乡情 ...
- android stuido build 慢的解决办法
Enable Offline Work: Click File -> Settings. Search for "gradle" and click in Offline w ...