Ubuntu 14.10 下安装伪分布式hdoop 2.5.0

折腾了一天，其间配置SSH时候出现了问题，误删了ssh-keygen相关文件，导致配置SSH彻底萎了，又重装了系统。。。。

采用伪分布式模式，即hadoop将所有进程运行于同一台主机上，但此时Hadoop将使用分布式文件系统，而且各jobs也是由JobTracker服务管理的独立进程。同时，由于伪分布式的Hadoop集群只有一个节点，因此HDFS的块复制将限制为单个副本，其secondary-master和 slave也都将运行于本地主机。此种模式除了并非真正意义的分布式之外，其程序执行逻辑完全类似于完全分布式，因此，常用于开发人员测试程序执行。

安装步骤

1 下载hadoop源码包，自己编译。参考前面文章http://www.cnblogs.com/liuchangchun/p/4087231.html

2 JDK安装

　　（1）jdk下载
　　　　链接: http://pan.baidu.com/s/1jGr41SU 密码: rawv
　　（2）jdk解压到合适目录

　　（3）配置环境变量

export JAVA_HOME=/usr/dev/jdk1..0_51

export HADOOP_HOME=/home/lcc/software/hadoop/hadoop-2.5.

export HBASE_HOME=/home/lcc/software/hadoop/hbase-0.99.

export LD_LIBRARY_PATH=/home/lcc/software/dev/protobuf-2.5.

export ANT_HOME=/usr/dev/apache-ant-1.9.

export PATH=$PATH:$ANT_HOME/bin:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HBASE_HOME/bin

export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib

3 配置hadoop

　　3.1 解压hadoop到合适位置

　　3.2 配置hadoop环境变量，参考上面

　　3.3 进入hadoop文件家，配置etc/hadoop中的文件

　　　　3.3.1 配置hadoop-env.sh

export JAVA_HOME="/usr/dev/jdk1.7.0_51"

　　　　3.3.2 配置core-site.xml

<configuration>

    <property>

            <name>fs.default.name</name>

            <value>hdfs://localhost:</value>

    </property>


    <property>
            <name>hadoop.tmp.dir</name>
            <value>/home/lcc/software/hadoop/hadoop-2.5./tmp</value>
    </property>

</configuration>

　　　　3.3.3 配置hdfs-site.xml，做如下配置（系统默认文件保存3份，因伪分布模式，故改为1份）

<configuration>

    <property>

            <name>dfs.replication</name>

            <value></value>

    </property>

    <property>

            <name> dfs.namenode.name.dir</name>

            <value>/home/lcc/software/hadoop/hadoop-2.5./dfs/name</value>

    </property>

    <property>

            <name>dfs.datanode.data.dir</name>

            <value>/home/lcc/software/hadoop/hadoop-2.5./dfs/data</value>

    </property>

</configuration>

　　　　3.3.4 配置mapred-site.xml.template

<configuration>

     <property>
            <name>mapred.job.tracker</name>
            <value>localhost:9001</value>
     </property>

</configuration>

　　　　3.3.5 配置yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->

    <property>

            <name>mapreduce.framework.name</name>

            <value>yarn</value>

      </property>

    <property>

            <name>yarn.nodemanager.aux-services</name>

            <value>mapreduce_shuffle</value>

      </property>

</configuration>

　　3.4 设置ssh免密码登录，注意实在root目录下

ssh-keygen -t rsa -P ""
cat /root/.ssh/id_rsa.pub >> /root/.ssh/authorized_key

　　　　输入ssh localhost 看看能否登录

　　3.5 格式化节点信息

hadoop namenode –format

　　3.6 进度hadoop目录，启动hadoop

sbin/start-all.sh

　　3.7 用命令jps查看是否启动成功，如果出现大概如下信息说明成功了

 NodeManager

 DataNode

 SecondaryNameNode

 ResourceManager

 NameNode

 Jps

　　3.8 进度hadoop目录，停止hadoop

sbin/stop-all.sh

　　3.9 http://localhost:50070 这是hdfs的页面

　　3.10 http://localhost:8088 hadoop进程管理页面

　　3.11 禁用IPV6

　　　　3.11.1 编辑grup文件

sudo nano /etc/default/grub

　　　　3.11.2 将文件中的 GRUB_CMDLINE_LINUX_DEFAULT="quiet spalsh" 修改为

GRUB_CMDLINE_LINUX_DEFAULT="ipv6.disable=1 quiet splash"

　　　　3.11.3 保存后运行sudo update-grub更新
　　　　3.11.4 重启网络服务

/etc/init.d/network-manager restart

　　　　3.11.5. 可以使用 ip a | grep inet6 查看关闭情况，若没有结果则说明禁用IPv6成功

Ubuntu 14.10 下安装伪分布式hdoop 2.5.0的更多相关文章

Ubuntu 14.10 下安装伪分布式hbase 0.99.0
HBase 安装分为:单击模式,伪分布式,完全分布式,在单机模式中,HBase使用本地文件系统而不是HDFS ,所有的服务和zooKeeper都运作在一个JVM中.本文是安装的伪分布式. 安装步骤如下 ...
Ubuntu 14.10 下安装伪分布式hive-0.14.0
本地独立模式,MySQL作为元数据库 1 安装环境准备 1.1 安装JDK,在安装hadoop时候已经安装了,参考http://www.cnblogs.com/liuchangchun/p/40972 ...
Ubuntu 14.10 下安装Ganglia监控集群
关于 Ganglia 软件,Ganglia是一个跨平台可扩展的,高性能计算系统下的分布式监控系统,如集群和网格.它是基于分层设计,它使用广泛的技术,如XML数据代表,便携数据传输,RRDtool用于数 ...
Ubuntu 14.10 下安装java反编译工具 jd-gui
系统环境,Ubuntu 14.10 ,64位 1 下载JD-GUI,网址http://221.3.153.126/1Q2W3E4R5T6Y7U8I9O0P1Z2X3C4V5B/jd.benow.ca/ ...
Ubuntu 14.10 下安装navicat
1 下载navicat,网址http://www.navicat.com.cn/download,我下载的是navicat111_premium_cs.tar.gz 2 解压到合适的位置 3 进入解压 ...
Ubuntu 14.10下安装深度音乐客户端
很多刚从windows系统投靠到ubuntu的机油,在听音乐时不是很舒心.毕竟ubuntu软件中心的很多影音软件都是国外的朋友编写的,所以很多时候国内的朋友用着很不舒服.今天给大家推荐的是国内开发者针 ...
Ubuntu 14.10 下安装rabbitvcs-版本控制
在Windows下用惯了TortoiseSVN这只小乌龟,到了Ubuntu下很不习惯命令行的SVN,于是经过一番寻找安装了RabbitVCS这款SVN图形化前端工具(官方网站:http://rabbi ...
Ubuntu 14.10 下安装Synergy，不同电脑之间公用一套键盘鼠标
因为工作时候有多台电脑放在一起,如果每个用一套键盘鼠标很是不方便,所以希望能够不用电脑之间公用一套键盘鼠标. Synergy可以实现不同电脑之间公用一套键盘鼠标,并且支持简单的复制粘贴.很好用. 它还 ...
Ubuntu 14.10 下安装Sublime Text 3，注册码，中文输入法
1 下载Sublime Text 3,网址http://www.sublimetext.com/3 2 双击deb安装 3 因为需要需要付费,输入下面的注册码,下面的注册码,来自百度,亲测可行 Sub ...

随机推荐

ACM-ICPC 2018 焦作赛区网络预赛- L：Poor God Water（BM模板/矩阵快速幂）
God Water likes to eat meat, fish and chocolate very much, but unfortunately, the doctor tells him t ...
神坑，使用gcc对opencv重编译
工具 cmake-3.9.1 opencv-3.3.0 gcc-6.3.0 前几天为了装eclipse的CDT,把minggw里的make改了,今天突然想学opencv,可是只找到了vc版本,千辛万 ...
CentOS7源码安装qbittorrent最新版本
CentOS的软件 yum 里 yum search qbittorrent yum info qbittorrent 找到的是3.37版本官网最新的是4.12版本.但需要源码安装: 官网下载最新版 ...
（7）MySQL的事务
什么是事物: 作用:一个事务(transaction)中的所有操作,要么全部完成,要么全部不完成,不会结束在中间某个环节.事务在执行过程中发生错误,会被回滚(Rollback)到事务开始前的状态,就像 ...
【java编程】加载Resources配置文件的方法
一.加载配置实现k-v //FILTER_PROPERTY_NAME=META-INF/abc.properties private void loadFilterConfig(Properties ...
Python——psutil的使用（获取系统性能信息）
>>> import psutil #导入psutil >>> a=psutil.virtual_memory() >>> a.total #总虚 ...
Centos6.7 64位安装配置kvm虚拟化
首先,需要我们的cpu支持虚拟化,有的机器支持但是并未在bios开启,这个需要事先开启. 1. Dell R710安装centos6.7 64位 ,Dell R710在开机后按F2进入BIOS,Pro ...
模拟实现memcpy 与 memmove
模拟实现memcpy 与 memmove 1.str系列的函数只能处理字符串——>必须带有'\0'2.memcpy内存处理函数:不涉及'\0',需要包含头文件 string.h3.source的 ...
BinaryReader 自己写序列化
听说过BinaryReader和BinaryWriter吗? 序列化无非就是网络通信时所使用的传输数据的方式,而BinaryWriter可以将数据以二进制的方式写入到流当中.比如Int32型的1用Bi ...
sql server 附加只有mdf的数据库文件
有时候SQL Server意外断电会导致SQL Server的ldf日志文件丢失或者损坏,这个时候你如果直接附加mdf文件到SQL Server会失败,这里提供一个方法可以还原只有mdf的数据库文件, ...

Ubuntu 14.10 下安装伪分布式hdoop 2.5.0

Ubuntu 14.10 下安装伪分布式hdoop 2.5.0的更多相关文章

随机推荐

热门专题