版本：虚拟机下安装的ubuntu14.04（64位）,hadoop-2.6.0

下面是hadoop2.6.0的官方英文教程：

http://hadoop.apache.org/docs/r2.6.0/hadoop-project-dist/hadoop-common/SingleCluster.html#Pseudo-Distributed_Operation

hadoop下载地址：

http://mirror.bit.edu.cn/apache/hadoop/common/

选择hadoop-2.6.0.tar.gz这个二进制文件

安装之前首先考虑的是hadoop的版本问题，hadoop-1x和hadoop-2x其实完全是两个东西,生产环境下多采用hadoop1.2.1-这是一个稳定的版本。而hadoop-2x版本更适合做实验。

其次hadoop2.6.0本地库文件是64位的，而hadoop2.4.0本地库是32位的。如果跟系统版本不匹配，运行hadoop例子时会出现:

WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform… using builtin-java classes where applicable（这个错误也可能是其他原因导致的，我遇到的是其他原因，后面会说解决办法）

最后是hadoop的三种模式：单机、伪分布、全分布。其中全分布模式至少需要三个节点。

1.安装前准备

一、添加hadoop用户组和hadoop用户

创建hadoop用户组：sudo addgroup hadoop
创建hadoop用户：  sudo adduser -ingroup hadoop hadoop



添加结果如下（其中通过系统设置设置hadoop账户类型为管理员）：

进入hadoop用户的账号

二、安装ssh
安装命令：sudo apt-get install openssh-server 
启动服务：sudo /etc/init.d/ssh start
查看服务是否启动：ps -e | grep ssh

设置免密码登录，生成私钥和公钥：ssh-keygen -t rsa -P ""



默认会在／home／hadoop/.ssh下生成两个文件：id_rsa和id_rsa.pub，前者为私钥，后者为公钥。（.ssh文件是隐藏文件，CTRL+H 显示隐藏文件）



将公钥追加到authorized_keys中：cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

然后用ssh连接自己：ssh localhost。如果还是需要密码，则没有成功。



三、安装java jdk和配置环境变量
　　
　　安装openjdk命令：sudo apt-get install openjdk-7-jdk
　　然而openjdk东西比较少，可以安装oraclejdk:（推荐安装Java-7-oracle）

sudo add-apt-repository ppa:webupd8team/java

sudo apt-get update

sudo apt-get install oracle-java7-installer

　　　最后通过：java -version查看是否安装成功，并显示java版本。

　　查看JAVA_HOME位置：sudo update-alternatives --config java

　　我的结果是/usr/lib/jvm/java-7-oracle/bin/jre/java。配置环境变量只写到java-7-oracle。

　　 配置环境变量：

　　命令：sudo gedit ~/.bashrc (配置.bashrc文件，或者.profile文件)

　　在文件末尾加入（第二行JAVA_HOME和第三行HADOOP_INSTALL安装路径改成自己的）#HADOOP VARIABLES START

export JAVA_HOME=/usr/lib/jvm/java-7-oracle

export HADOOP_INSTALL=/usr/local/hadoop

export PATH=$PATH:$HADOOP_INSTALL/bin

export PATH=$PATH:$HADOOP_INSTALL/sbin

export HADOOP_MAPRED_HOME=$HADOOP_INSTALL

export HADOOP_COMMON_HOME=$HADOOP_INSTALL

export HADOOP_HDFS_HOME=$HADOOP_INSTALL

export YARN_HOME=$HADOOP_INSTALL

export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_INSTALL/lib/native

export HADOOP_OPTS="-Djava.library.path=$HADOOP_INSTALL/lib"

#HADOOP VARIABLES END

　　使环境变量设置立即生效(重新注销或者重启都行)：source ~/.bashrc

2.hadoop配置

　　　　我的hadoop安装路径/usr/local/hadoop，下载的文件解压缩后的文件名改成了hadoop。给hadoop文件夹及其文件夹所有文件提高权限！

　　　hadoop配置文件放在{HADOOP安装路径}/etc/hadoop文件夹下：需要修改hadoop-env.sh,core-site.xml,hdfs-site.xml,mapred-site.xml,yarn-site.xml五个文件。

　　　1.hadoop-env.sh文件，在末尾添加（第一行JAVA_HOME和第二行HADOOP_PREFIX（hadoop安装路径）改成自己的）

export JAVA_HOME=/usr/lib/jvm/java-7-oracle

export HADOOP_PREFIX=/usr/local/hadoop

export HADOOP_OPTS="-Djava.library.path=$HADOOP_PREFIX/lib:$HADOOP_PREFIX/lib/native"

　　　　注意第三行的HADOOP_OPTS,如果没有这一项运行会有：WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform… using builtin-java classes where applicable的错误提示。如果你是32位的系统，运行hadoop2.6.0还需要重新编译本地库。本地库路径为：{hadoop安装路径}/lib/natives。

　　查看本地库版本命令：file /usr/loacl/hadoop/lib/native/libhadoop.so.1.0.0

　　(32位)libhadoop.so.1.0.0: ELF 32-bit LSB shared object, Intel 80386, version 1 (SYSV), dynamically linked, not stripped

　　(64位)libhadoop.so.1.0.0: ELF 64-bit LSB shared object, x86-64, version 1 (SYSV), dynamically linked, not stripped

　　查看系统位数：uname -a，如果有x86_64就是64位的，没有就是32位的。

　　2.core-site.xml文件，在末尾<configuration></configuration>中间添加内容，最后：

<configuration>

    <property>

        <name>hadoop.tmp.dir</name>

        <value>/usr/local/hadoop/tmp</value>

        <description>Abase for other temporary directories.

</description>

    </property>

    <property>

        <name>fs.defaultFS</name>

        <value>hdfs://localhost:9000</value>

    </property>

</configuration>

其中前一部分的hadoop.tmp.dir参数官方教程里没有，如果没有配置临时文件会默认生成在：根目录/tmp/hadoop-hadoop中，但是重启系统后内容会重新删掉，会有意想不到的问题出现！！注意修改路径.

　　3.mapred-site.xml是没有的，有一个mapred-site.xml.template文件将其改名为mapred-site.xml就好。同样在末尾<configuration></configuration>中间添加内容，最后：

<configuration>

 <property>

        <name>mapreduce.framework.name</name>

        <value>yarn</value>

    </property>

</configuration>

4.yarn-site.xml文件，在末尾<configuration></configuration>添加内容，最后：

<configuration>

<!-- Site specific YARN configuration properties -->

    <property>

        <name>yarn.nodemanager.aux-services</name>

        <value>mapreduce_shuffle</value>

    </property>

</configuration>

　　5.hdfs-site.xml文件，在末尾<configuration></configuration>中间添加内容，最后：

<configuration>

<property>

        <name>dfs.replication</name>

        <value>1</value>

    </property>

    <property>

        <name>dfs.namenode.name.dir</name>

        <value>file:/usr/local/hadoop/dfs/name</value>

    </property>

    <property>

        <name>dfs.datanode.data.dir</name>

        <value>file:/usr/local/hadoop/dfs/data</value>

    </property>

</configuration>

　　后面两个dfs.name.dir,dfs.datanode.data.dir参数官网教程没有(注意修改路径),新建dfs和tmp文件夹并不必须，hadoop启动后会自动生成。

3.hadoop运行

格式化hdfs:/usr/local/hadoop$ bin/hdfs namenode -format

/usr/local/hadoop$ bin/hdfs namenode -format

当出现：INFO common.Storage: Storage directory /home/hadoop/tmp/dfs/name has been successfully formatted.表示成功。只需要格式化一次。

hadoop启动，执行:/usr/local/hadoop$ sbin/start-all.sh

输入命令检测：jps。如果成功启动的话会有：jps,NameNode,DataNode,SecondaryNameNode,ResourceManager，NodeManager六个进程。

并且查看NameNode-http://localhost:50070/

ResourceManager-http://localhost:8088/

4.WordCount验证

　　/usr/local/hadoop$ bin/hadoop fs -mkdir -p input

运行例子:

(1)复制一些文件到HDFS目录/usr/<usrname>下:/usr/local/hadoop$ hadoop fs -copyFromLocal README.txt input

(2)运行：/usr/local/hadoop$ hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.4.0-sources.jar org.apache.hadoop.examples.WordCount input output

(3)运行完毕后，查看单词统计结果 /usr/local/hadoop$ hadoop fs -cat output/*

关闭hadoop:/usr/local/hadoop$ bin/stop-all.sh

/usr/local/hadoop$ bin/stop-all.sh

至此搭建完成。

ubuntu14.04安装hadoop2.6.0（伪分布模式）的更多相关文章

ubuntu14.04搭建Hadoop2.9.0伪分布式环境
本文主要参考给力星的博文——Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04 一些准备工作的基本步骤和步骤具体说明本文不再列出,文章中提到的“见参考”均指以上 ...
ubuntu14.04 安装 hadoop2.4.0
转载:ubuntu搭建hadoop-Ver2.6.0完全分布式环境笔记自己在搭建hadoop平台时,碰到一些困难,按照该博文解决了问题,转载一下,作为记录. 2 先决条件确保在你集群中的每个节点上 ...
ubuntu14.04搭建Hadoop2.9.0集群(分布式)环境
本文进行操作的虚拟机是在伪分布式配置的基础上进行的,具体配置本文不再赘述,请参考本人博文:ubuntu14.04搭建Hadoop2.9.0伪分布式环境本文主要参考给力星的博文——Hadoop集群安 ...
hadoop2.2.0伪分布模式64位安装
hadoop2.2.0伪分布模式64位安装用到的软件:jdk-6u45-linux-x64.bin,hadoop-2.2.0.x86_64.tar.gz 修改主机名vim /etc/sysconfig ...
Ubuntu14.04 安装配置Opencv3.0和Python2.7
http://blog.csdn.NET/u010381648/article/details/49452023 Install OpenCV 3.0 and Python 2.7+ on Ubunt ...
Ubuntu14.04下hadoop-2.6.0单机配置和伪分布式配置
需要重新编译的教程:http://blog.csdn.net/ggz631047367/article/details/42460589 在Ubuntu下创建hadoop用户组和用户 hadoop的管 ...
spark 1.6.0 安装与配置（spark1.6.0、Ubuntu14.04、hadoop2.6.0、scala2.10.6、jdk1.7）
前几天刚着实研究spark,spark安装与配置是入门的关键,本人也是根据网上各位大神的教程,尝试配置,发现版本对应最为关键.现将自己的安装与配置过程介绍如下,如有兴趣的同学可以尝试安装.所谓工欲善其 ...
安装hadoop2.6.0伪分布式环境
集群环境搭建请见:http://blog.csdn.net/jediael_lu/article/details/45145767 一.环境准备 1.安装linux.jdk 2.下载hadoop2.6 ...
安装hadoop2.6.0伪分布式环境分类： A1_HADOOP 2015-04-27 18:59 409人阅读评论(0) 收藏
集群环境搭建请见:http://blog.csdn.net/jediael_lu/article/details/45145767 一.环境准备 1.安装linux.jdk 2.下载hadoop2.6 ...

随机推荐

2D游戏中的碰撞检测：圆形与矩形碰撞检测（Javascrip版）
一,原理介绍这回有点复杂,不过看懂了还是很好理解的.当然,我不敢保证这种算法在任何情况下都会起效果,如果有同学测试时,发现出现错误,请及时联系我. 我们首先来建立一个以圆心为原点的坐标系: 然后要检 ...
linux 目录与文件命令
目录与文件常用命令 1.cd命令 cd [相对路径或绝对路径或特殊符号] 功用:变换目录 ps: 不加参数时,默认切换到用户主目录,即环境变量HOME指定的目录,如root用户的HOME变量为/roo ...
genymotion——VT-x is not available (VERR_VMX_NO_VMX) 的解决方案
进入虚拟机设置页面
（转）spring mvc forward与redirect
forward 转发,如return "forward:/hello"; 浏览器的地址栏不会变,但是有视图返回来 redirect 重定向,如return "redire ...
移动端打印输出内容以及网络请求-vconsole.js
今天,无意间从别人那里得知一个很好的js插件--vconsole.min.js,可以实现在移动端打印输出内容以及查看网络请求.下面记录使用方式. 1.下载vconsole.min.js插件以下复制了 ...
mysql update 多表（复制）
定我们有两张表,一张表为Product表存放产品信息,其中有产品价格列Price:另外一张表是ProductPrice表,我们要将ProductPrice表中的价格字段Price更新为Price表中价 ...
Mac OS X 10.10 Yosemite下配置 apache＋php
自从系统从OS X Mavericks 10.9升级到OS X Yosemite 10.10 后之前配置apache和php均不能正常使用了, 重新设置配置如下: 首先,查看当前系统的apache版本 ...
dubbo-admin 部署
上一章主要是谈到zookeeper的安装和部署因为zookeeper只是一个黑框,我们无法看到是否存在了什么提供者或消费者,这时就要借助Dubbo-Admin管理平台来实时的查看,也可以通过这个平台 ...
微信公众平台Java版极速SDK
JEEWX-API 是第一个微信公众平台Java版极速SDK,基于 jeewx-api 开发可以立即拥有简单易用的API,让开发更加轻松自如,节省更多时间 http://www.jeewx.com/
Shape-inside css新属性几何图形的实现
https://www.w3cplus.com/css3/css-shapes-101.html