前言

本文介绍如何在Ubuntu Kylin操作系统上搭建Hadoop平台。

配置

1. 操作系统: Ubuntu Kylin 14.04

2. 编程语言: JDK 1.8

3. 通信协议: SSH

4. 云计算项目版本: Hadoop 1.2.1

第一步:安装最新版本的JDK (若已经安装过请忽略这一步)

1. 去官网下载JDK1.8并解压 (当前安装包为:jdk-8u25-linux-x64.gz)

2. 将解压后的安装包复制到 /usr/lib/jvm 目录下 (jvm目录需要自行创建)

3. 以管理员方式打开 /etc/profile 文件并在文件底部添加以下代码:

 #set Java Environment
export JAVA_HOME=/usr/lib/jvm/jdk1..0_25
export CLASSPATH=".:$JAVA_HOME/lib:$CLASSPATH"
export PATH="$JAVA_HOME/bin:$PATH"

4. 执行以下命令使配置文件立即生效:

 source /etc/profile

5. 执行以下命令验证JDK是否安装成功:

 java -version

若显示以下信息表示安装完成:

第二步:配置SSH免密码登陆

1. 执行以下命令安装SSH:

 sudo app-get install ssh

2. 检查用户目录下是不是有个名为.ssh的隐藏文件夹,没有的话就自己创建一个。

3. 执行以下命令配置SSH无密码登陆 (这几行代码的功能请参考SSH使用文档):

 ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

4. 执行以下命令验证SSH是否安装配置成功:

 ssh localhost

出现提示输入yes,若终端显示以下信息,表示SSH配置成功:

  

第三步:安装并运行Hadoop

  说明:Hadoop有三种运行方式 - 单机模式,伪分布式和完全分布式。

其中,前两者主要用于程序的测试和调试,这里要讲的是伪分布式的配置,配置完全分布式的方法将在以后讲解。

1. 下载并解压最新版本的Hadoop到当前目录下 (当前安装包为:hadoop-1.2.1.tar.gz)

2. 进入conf子目录中,修改如下配置文件:

a. hadoop-env.sh (设置JAVA路径)

在末尾添加:

 export JAVA_HOME=/usr/lib/jvm/jdk1..0_25

b. core-site.xml (配置HDFS地址及端口号)

配置为:

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <!-- Put site-specific property overrides in this file. --> <configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>

c. hdfs-site.xml (修改备份方式,单机版本需要将其改为1)

配置为:

 <?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <!-- Put site-specific property overrides in this file. --> <configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>

d. mapred-site.xml (设置JobTracker地址及端口)

配置为:

 <?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <!-- Put site-specific property overrides in this file. --> <configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>

3. 进入Hadoop文件夹执行以下命令以格式化Hadoop文件系统HDFS:

 bin/hadoop namenode -format

4. 执行以下命令以启动所有Hadoop进程:

 bin/start-all.sh

5. 验证Hadoop是否安装成功

a. 打开浏览器,输入网址 http://localhost:50030 以查看MapReduce的Web页面:

b. 打开浏览器,输入网址 http://localhost:50070 以查看HDFS的Web页面:

如果显示正常,那么Hadoop环境便搭建好了。

小结

1. 伪分布式的架构,机制和真实分布式其实是一样的,不过伪分布式中,Master和Slave都是一台机器。

2. 关于真实分布式环境的搭建,将在以后介绍。到时会在虚拟机上组建一个虚拟网络,跑真·分布式程序。

第二篇:Hadoop 在Ubuntu Kylin系统上的搭建[图解]的更多相关文章

  1. Hadoop 在ubuntu系统上的搭建[图解]

    前言 本文介绍如何在Ubuntu Kylin操作系统上搭建Hadoop平台. 配置 1. 操作系统: Ubuntu Kylin 14.04 2. 编程语言: JDK 1.8 3. 通信协议: SSH ...

  2. [证书服务器 第二篇] 基于OpenSSL 在 CentOS6 系统上 搭建自签证书服务,并应用于Web容器

    第一部分:概述 .. 第二部分:环境准备 1 操作系统 CentOS 6.x 2 安装openssl yum install -y openssl 3 安装jdk 从官网下载JDK http://ww ...

  3. 孤荷凌寒自学python第六十一天在Fedora28版的linux系统上找搭建本地Mongodb数据服务

    孤荷凌寒自学python第六十一天在Fedora28版的linux系统上找搭建本地Mongodb数据服务 (完整学习过程屏幕记录视频地址在文末) 今天是学习mongoDB数据库的第七天.成功在本地搭建 ...

  4. Ubuntu/CentOS 系统上安装与配置Nginx

    一.在线安装: Ubuntu:sudo apt-get install nginx CentOS: sudo yum install nginx 二.安装后的位置: 1.服务地址:/etc/init. ...

  5. Ubuntu/Centos 系统上安装与配置Apache

    一.在线安装: Ubuntu:sudo apt-get install apache2 Centos: sudo yum install apache2 二.安装后的位置: 1.服务地址:/etc/i ...

  6. Ubuntu kylin系统改中文系统文件名为英文

    刚装好系统,将使用语言改成了中文,结果重启后,提示是否将文件系统的名字改为新的,我一不注意,点了是...这样,在以后使用终端的时候,会有中文来干扰,所以需要改回英文. 方法如下: 输入两个命令即可: ...

  7. 在Ubuntu系统上搭建Hadoop 2.x(2.6.2)

    官方的中文版的Hadoop快速入门教程已经是很老的版本了,新版的Hadoop目录结构发生了变化,因此一些配置文件的位置也略微调整了,例如新版的hadoop中找不到快速入门中提到的conf目录,另外,网 ...

  8. Ubuntu kylin 有可能成为未来中国的主流系统吗?

    编前语: 无意间开始研究起linux,因为目前互联网很多人,包括我都隐约感觉到,windows系统在中国乃至世界在今后的流行度会逐步降低,不为什么,其中最主要的是安全问题,Microsoft 微软公司 ...

  9. Ubuntu下用hadoop2.4搭建集群(伪分布式)

    要真正的学习hadoop,就必需要使用集群,可是对于普通开发人员来说,没有大规模的集群用来測试,所以仅仅能使用伪分布式了.以下介绍怎样搭建一个伪分布式集群. 为了节省时间和篇幅,前面一些步骤不再叙述. ...

随机推荐

  1. Python 内置方法new

    class Dog(object): def __new__(self): print("i am new .") def __init__(self): print(" ...

  2. mock数据和代码生成

    git clone https://gitee.com/fleam/CodeGeneration.git

  3. 如何配置propagation

    配置spring事务代理时的事务属性. <prop key=“get*”>PROPAGATION_REQUIRED,readOnly</prop> 表示类方法名称是以get开头 ...

  4. 年中总结大会--总结学习笔记, 技术部IT部门年中总结报告该怎么写

    组织年中总结大会该如何组织 1. 通知每一位员工, 总结自己的半年工作(提前多少天, 截至日期) 2. 会场布置 3. 部门领导总结 4. 中场休息, 或节目表演, 合影等 5. 表彰 6. 交流(提 ...

  5. 解密QQ——队列

    一.问题引入 小明和小丽同在一个自习室上自习,小明感觉小丽是一个很不错的女孩,于是他鼓足勇气向小丽要QQ号,然而小丽也是个矜持的女孩,当然不会直接告诉他,所以小丽给了小明一串加密过的数字,同时她也告诉 ...

  6. PHP做Web开发的MVC框架(Smarty使用说明 )

    PHP做Web开发的MVC框架(Smarty使用说明 ) 一.Smarty简明教程 1.安装演示 下载最新版本的Smarty-3.1.12,然后解压下载的文件.接下来演示Smarty自带的demo例子 ...

  7. C# EF Code First Migrations数据库迁移

    1.EF Code First创建数据库 新建控制台应用程序Portal,通过程序包管理器控制台添加EntityFramework. 在程序包管理器控制台中执行以下语句,安装EntityFramewo ...

  8. bind带autocomplete时,最好是从新的tr复制

    (function($) { //自动关联ItemNo $.fn.extend({ productitemlist: function(options) { return this.each(func ...

  9. 通过tarball形式安装HBASE Cluster(CDH5.0.2)——集群安装总览

    1,手动下载压缩包.tar(下载地址),采用tarball形式手工安装集群. 2,共启用13台虚拟机,CentOS6.5 64bit,nn1,nn2,rm1,rm2,dn1,dn2,dn3,dn4,d ...

  10. SSM是什么框架?

    SSM框架,是Spring + Spring MVC + MyBatis的缩写,这个是继SSH之后,目前比较主流的Java EE企业级框架,适用于搭建各种大型的企业级应用系统. 1.Spring简介 ...