自学hadoop(二)
1)NameNode为主 DataNode为从
2)JobTracker为主 TaskTracker为从
3)开启调试模式
export HADOOP_ROOT_LOGGER=DEBUG,console
4)hadoop编译
http://pirate2089.github.io/blog/2013/07/19/hadoop-2-dot-0-5-alphabu-shu/
编译时,libprotoc2.4.1
具体参照
http://www.cnblogs.com/shaobin0604/archive/2011/11/01/2232144.html
编译native的命令
mvn package -Pdist,native -DskipTests -Dtar
5)关于hadoop升级。配置文件中,有些类可能会变换。如果拿旧版本的配置文件应用于新版本。由于类已经变换位置了。所以新的找不到。
6)发觉2.1.0的beta版本,share下面,有mapreduce和yarn两个,在设eclispe插件的时候,要注意,设置错了,会发觉很多类找不到。
7)在eclipse中用maven插件,显示
Missing artifact jdk.tools:jdk.tools:jar:1.6,可以这样来解决
发觉这个问题是有在windows下才有的。我后来转到linux下没有的。
<dependency>
<groupId>jdk.tools</groupId>
<artifactId>jdk.tools</artifactId>
<version>${java.version}</version>
<scope>system</scope>
<systemPath>${JAVA_HOME}/lib/tools.jar</systemPath>
</dependency>
8)Exception in thread "main" java.lang.NullPointerException
at java.lang.ProcessBuilder.start(Unknown Source)
这个问题,只有用2.1.0-beta,且在windows下的人才会碰到的。
如果你用这个版本,然后再windows下搭建开发环境。装了cygwin。调试时,你会发现不断的抛这个错误。
后来细查之下,是hadoop没有发布一个winutils.exe的文件。而这个文件则说明,hadoop打算支持windows。
在org.apache.hadoop.util.shell里面,有很多操作系统的判断。而调用系统命令的时候,有一个拼字符串的地方。看到是windows系统。就在前面加一个winutils
但是发布包里面木有这个。想了一个笨点的解决办法,就是运行程序前。加一句
System.setProperty("os.name", "Linux");前提是要装了cygwin
试了一下,发现不行。主要是后台还是会采用linux系统特有的方法。没法搞。
研究了下源代码。发现其实winutils这个东西实在源代码里面有的。估计发布的版本实在linux下面编译。所以这玩意没有编出来。
后来试着在windows下编译。就是没有编译成功。也不想深究,也就装个ubuntu的虚拟机,做开发环境。
具体编译什么的。可以从下面地址获得。
http://svn.apache.org/repos/asf/hadoop/common/trunk/BUILDING.txt
9)http://www.cnblogs.com/gpcuster/archive/2010/06/04/1751538.html
hadoop常用的命令
自学hadoop(二)的更多相关文章
- 从零自学Hadoop(22):HBase协处理器
阅读目录 序 介绍 Observer操作 示例下载 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,Sour ...
- 从零自学Hadoop(20):HBase数据模型相关操作上
阅读目录 序 介绍 命名空间 表 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 ...
- 从零自学Hadoop(21):HBase数据模型相关操作下
阅读目录 序 变量 数据模型操作 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 ...
- 从零自学Hadoop(19):HBase介绍及安装
阅读目录 序 介绍 安装 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 上一篇, ...
- 从零自学Hadoop(18):Hive的CLI和JDBC
阅读目录 序 Hive CLI(old CLI) Beeline CLI(new CLI) JDBC Demo下载 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出 ...
- 从零自学Hadoop(02):环境准备
阅读目录 起因 虚拟机 Linux 系统安装 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceL ...
- 从零自学Hadoop(03):Linux准备上
阅读目录 序 检查列表 常用Linux命令 搭建环境 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,Sou ...
- 从零自学Hadoop(04):Linux准备下
阅读目录 序 搭建环境 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 我们已经准 ...
- 从零自学Hadoop(05):Ambari
阅读目录 序 引入背景 Ambari介绍 在线安装 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,Sour ...
- 从零自学Hadoop(06):集群搭建
阅读目录 序 集群搭建 监控 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 上一 ...
随机推荐
- 转:linux下Xampp安装与配置
--转载时请保留下面,以供大家加我MSN,增强交流,共同学习.--姜庭华 msn: jaimejth@live.cn--博客:http://blog.csdn.net/jaimejth 软件下载在以 ...
- jquery.post用法
使用ajax在前端验证是否执行某个操作 jquery.post参数为 url,[data],[callback],[type] url:发送请求地址. data:待发送 Key/value 参数. c ...
- Bug:java.lang.IllegalStateException
使用迭代的时候,出现了java.lang.IllegalStateException 代码: for ( TaskInfo info : userTaskInfos ) { if ( info.isC ...
- 通俗易懂的讲解iphone视图控制器的生命周期
IOS 视图控制器的生命周期非常非常重要,所以我有必要写个文章来和大家一起探讨问题. 今天在学习视图控制器的生命周期,也看了一下网上的一些资料,但总觉得不是那么好理解,首先我们来看一张图: 先粗略讲一 ...
- SharePoint的安装配置
安装环境 1. Window server 2008 r2(sp2) OS.2. MS SQL Server 2008 r2.3. Office2010.4. IIS7以上.5. 确认服务器已经加入域 ...
- Spring下载
Spring官网改版后找了好久都没有找到直接下载Jar包的链接,下面汇总些网上提供的方法,亲测可用. 1.直接输入地址,改相应版本即可:http://repo.springsource.org/lib ...
- javascript OOP编辑思想的一个实践参考
<html> <style type="text/css"> .current { background-color: red; } .dv { backg ...
- 06day1
Rabbit Number 枚举 [问题描述] 设 S(N)表示 N 的各位数字之和,如 S(484)=4+8+4=16,S(22)=2+2=4.如果一个正整数 x满足 S(x*x)=S(x)*S(x ...
- POJ 1573 Robot Motion
Robot Motion Time Limit: 1000MS Memory Limit: 10000K Total Submissions: 12978 Accepted: 6290 Des ...
- hdu 2544最短路——最短路的初次总结 UESTC 6th Programming Contest Online
这是一道标准的模板题,所以拿来作为这一段时间学习最短路的总结题目. 题意很简单: 有多组输入数据,每组的第一行为两个整数n, m.表示共有n个节点,m条边. 接下来有m行,每行三个整数a, b, c. ...