我用过的linux命令--安装Hadoop

1. hadoop软件传送给虚拟机

还是利用WinSCP把hadoop软件安装包，放到linux的Downloads文件夹中。

2. 选择安装目录

把hadoop安装包copy到这个安装目录中，这里我们选择CentOS中的/usr/local目录中。

3. 解压缩安装包

看到hadoop安装包的后缀是.tar.gz。所以直接用tar命令解压缩

#tar -zxvf xxx    //解压.tar.gz的文件

解压完之后会产生一个文件夹，名字为hadoop-1.1.2，这个名字太长了，不好用，重命名一下

#mv hadoop-1.1. hadoop

4. hadoop设置环境变量

解压完了之后，hadoop这个目录中肯定有一个目录结构，先不管是什么，肯定有一个bin目录，里面放置了各种的可以执行的命令。所以要把这个bin目录添加到环境变量中去。

#vi /etc/profile

在配置文件中加入:

export HADOOP_HOME=/usr/local/hadoop

export PATH=.:$JAVA_HOME/bin:$HADOOP_HOME/bin:$PATH

使配置文件生效:

#source /etc/profile

5. 修改配置文件

为了适合hadoop的伪分布的安装，这里要修改一些配置文件。hadoop的配置文件的目录是$HADOOP_HOME/conf目录下。要修改的文件是：

hadoop-enc.sh、core-site.xml、hdfs-site.xml、mapred-site.xml

为了方便修改，这里我们不用vi修改文件，而是利用WinSCP直接在Windows下修改。

在WinSCP中找到这个文件，然后编辑这个文件就好了。

（1）hadoop-env.sh文件修改内容：

export JAVA_HOME=/usr/local/jdk

（2）core-site.xml文件修改内容：

<configuration>

    <property>

    <name>fs.default.name</name>

    <value>hdfs://hadoop:9000</value>

    <description>change your own hostname</description>

    </property>

    <property>

    <name>hadoop.tmp.dir</name>

    <value>/usr/local/hadoop/tmp</value>

    </property>

</configuration>

注意：这里的fs.default.name的值说明了NameNode的所在主机的IP地址和NameNode使用的端口号码，一般都是选用9000。

hadoop.tmp.dir说明了Namenode存放临时fsimage和edits的文件路径。

（3）hdfs-site.xml文件修改内容：

<configuration>

    <property>

        <name>dfs.replication</name>

        <value>1</value>

    </property>

    <property>

        <name>dfs.data.dir</name>

        <value>/usr/local/hadoop/data</value>

    </property>

    <property>

        <name>dfs.permissions</name>

        <value>false</value>

    </property>

</configuration>

注意：dfs.replication的值说明了数据的备份数目，这个备份数目跟dataNode的数目相同。

dfs.data.dir的值说明了dataNode存储数据的目录。

（4）mapred-site.xml文件修改内容：

<configuration>

    <property>

        <name>mapred.job.tracker</name>

        <value>hdfs://hadoop:9001</value>

        <description>change your own hostname</description>

    </property>

</configuration>

注意：这里的mapred.job.tracker的值说明了JobTracker的所在主机的IP地址和JobTracker使用的端口号码，一般都是选用9001。

6. 对Hadoop进行格式化

对HDFS文件系统重新整理

#hadoop namenode -format    //格式化hadoop的HDFS文件系统

7. 启动Hadoop

启动命令脚本在$HADOOP_HOME/bin目录中，所以可以直接运行

#start-all.sh

前面说过hadoop运行的都是一些java的进程，所以启动完hadoop能看到相应的java进程，查看方式：

#jps    //查看当前运行的java进程

这个命令不是操作系统的，是位于jdk中的，专门用来查看java进程的

8. 通过浏览器查看hadoop

在Linux的浏览器中输入hadoop：50070可以看到namenode，说明NameNode进程是活着的，同时还说明NameNode本身是一个web server。

在Linux的浏览器中输入hadoop：50030可以看到JobTracker，说明JobTracker进程是活着的，同时还说明JobTracker本身是一个web server。

同样在Windows宿主机器中通过ip地址：50070、ip地址：50030也能看到相同的内容。如果想通过主机名hadoop访问，要把IP地址和hadoop的主机名绑定：

在Windows的C:\Windows\System32\drivers\etc\hosts这个文件中添加：

192.168.80.100 hadoop

然后就能在Windows下通过主机名：端口号的方式访问hadoop了。

注意：这个能访问，首先要能互相ping通。

9. 问题纠错

<1>NameNode进程没有启动成功？

（1）没有格式化

（2）配置文件只copy，没有修改主机名

（3）hostname与ip地址没有绑定

（4）ssh免密码登陆没有配置成功

<2>多次格式化hadoop也是错误的？

解决方法：删除/usr/local/hadoop/tmp文件夹，重新格式化就能解决。

我用过的linux命令--安装Hadoop的更多相关文章

在Linux上安装Hadoop
先决条件: Hadoop是用JAVA写的,所以首先要安装Java.在Ubuntu上安装JDK见:http://blog.csdn.net/microfhu/article/details/766739 ...
Linux 命令安装bin文件
Linux 命令安装bin文件安装命令: //1,增加文件的可执行权限 chmod a+x jdk-6u30-linux-x64.bin //2,程序即安装在执行命令的文件夹下 ./jdk-6u30 ...
Linux上安装Hadoop集群(CentOS7+hadoop-2.8.0)--------hadoop环境的搭建
Linux上安装Hadoop集群(CentOS7+hadoop-2.8.0)------https://blog.csdn.net/pucao_cug/article/details/71698903 ...
【大数据】Linux下安装Hadoop(2.7.1)详解及WordCount运行
一.引言在完成了Storm的环境配置之后,想着鼓捣一下Hadoop的安装,网上面的教程好多,但是没有一个特别切合的,所以在安装的过程中还是遇到了很多的麻烦,并且最后不断的查阅资料,终于解决了问题,感 ...
Linux上安装Hadoop集群(CentOS7+hadoop-2.8.0)
1下载hadoop 2安装3个虚拟机并实现ssh免密码登录 2.1安装3个机器 2.2检查机器名称 2.3修改/etc/hosts文件 2.4 给3个机器生成秘钥文件 2.5 在hserver1上创建 ...
Linux上安装Hadoop集群(CentOS7+hadoop-2.8.3)
https://blog.csdn.net/pucao_cug/article/details/71698903 1下载hadoop 2安装3个虚拟机并实现ssh免密码登录 2.1安装3个机器 2.2 ...
自己常用的Linux命令和Hadoop命令
记录自己常用的Linux命令: ss的启动命令:ssserver -c /etc/shadowsocks.json jupyter notebook的启动命令:jupyter notebook --a ...
Linux下安装Hadoop完全分布式（Ubuntu12.10）
Hadoop的安装非常简单,可以在官网上下载到最近的几个版本,最好使用稳定版.本例在3台机器集群安装.hadoop版本如下: 工具/原料 hadoop-0.20.2.tar.gz Ubuntu12.1 ...
linux进程管理（linux命令安装、进程生命周期、进程状态）
1 linux下如何杀掉进程 1)找到包名所占用的端口: ps aux | grep cbs_portal-1.0.1.jar(包名) 2)杀掉进程: kill 10942(端口号) PS: //-- ...

随机推荐

STL 源代码剖析算法 stl_algo.h -- merge sort
本文为senlie原创.转载请保留此地址:http://blog.csdn.net/zhengsenlie merge sort ----------------------------------- ...
JDBC Connection Reset问题分析
2014年7月13日半年前開始.项目组測试MM在验证功能时.常常报怨讲測试环境上的应用在启动时非常慢,偶尔会报失败,遇到类似问题多数情况下又一次启动一次就能够启动成功,但少数时候也有重复启动不成功的 ...
【iOS】Plist-XML-JSON数据解析
网络上数据传输通用的有XML.JSON等,iOS中也能够用Plist. 要进行传输数据.就要首先进行序列化: 1.序列化. 对象转换成二进制流.(这个一句话即可) .反序列化. 二进制流转换为对象等 ...
初识Maven
今天开始学习怎样使用maven,听起来挺神奇的东西,我们来一步一步的加以剖析. Maven的一些具体的论文的东西,网上很多博客介绍,这里我就不逐一介绍,下面我们从安装maven开始讲解: (1)Mav ...
XX cannot be resolved to a type
http://www.cnblogs.com/xuxm2007/archive/2011/10/20/2219104.html 我是project->clean...即可原理:将工程中的.cl ...
win7(32 bit) + IE8 环境，IE8无法弹窗（错误提示：“此网页上的错误可能会使它无法正确运行”），有关的系统注册信息损坏——解决方法
错误截图如下: IE有关的系统注册信息损坏,导致IE无法正常弹窗. 解决办法:重新注册与IE有关的DLL文件,具体如下: 1.以管理员身份运行附件脚本(新建txt文件,将下面代码复制到txt文 ...
Android 创建目录
//android 内部存储自定义目录写入文件 try{ File testDir = new File(this.getFilesDir().getAbsolutePath() + File.sep ...
使用分析函数实现Oracle 10G提供的CONNECT_BY_ISLEAF和CONNECT_BY_ROOT的功能（转载）
文章转载至:http://blog.csdn.net/wzy0623/article/details/1644049 如果,有侵犯您权益的地方,烦请及时的告知我,我会即刻停止侵权行为 Oracle 1 ...
LeetCode 1. twoSums
C++: vector<int> twoSum(vector<int>& nums, int target) { unordered_map<int, int&g ...
leetcode Integer to Roman python
class Solution(object): def intToRoman(self, num): """ :type num: int :rtype: str &qu ...

我用过的linux命令--安装Hadoop

我用过的linux命令--安装Hadoop的更多相关文章

随机推荐

热门专题