Hadoop 在ubuntu系统上的搭建[图解]

前言

　　本文介绍如何在Ubuntu Kylin操作系统上搭建Hadoop平台。

配置

　　1. 操作系统: Ubuntu Kylin 14.04

　　2. 编程语言: JDK 1.8

　　3. 通信协议: SSH

　　2. 云计算项目版本: Hadoop 1.2.1

第一步：安装最新版本的JDK (若已经安装过请忽略这一步)

　　1. 去官网下载JDK1.8并解压 (当前安装包为:jdk-8u25-linux-x64.gz)

　　2. 将解压后的安装包复制到 /usr/lib/jvm 目录下 (jvm目录需要自行创建)

　　3. 以管理员方式打开 /etc/profile 文件并在文件底部添加以下代码：

 #set Java Environment
 export JAVA_HOME=/usr/lib/jvm/jdk1..0_25
 export CLASSPATH=".:$JAVA_HOME/lib:$CLASSPATH"
 export PATH="$JAVA_HOME/bin:$PATH"

　　4. 执行以下命令使配置文件立即生效：

 source /etc/profile

　　5. 执行以下命令验证JDK是否安装成功：

1 java -version

　　若显示以下信息表示安装完成：

第二步：配置SSH免密码登陆

　　1. 执行以下命令安装SSH：

1 sudo app-get install ssh

　　2. 检查用户目录下是不是有个名为.ssh的隐藏文件夹，没有的话就自己创建一个。

　　3. 执行以下命令配置SSH无密码登陆 (这几行代码的功能请参考SSH使用文档):

 ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
 cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

　　4. 执行以下命令验证SSH是否安装配置成功：

 ssh localhost

　　出现提示输入yes，若终端显示以下信息，表示SSH配置成功：

第三步：安装并运行Hadoop

　　说明：Hadoop有三种运行方式 - 单机模式，伪分布式和完全分布式。其中，前两者主要用于程序的测试和调试，这里要讲的是伪分布式的配置，配置完全分布式的方法将在以后讲解。

　　1. 下载并解压最新版本的Hadoop到当前目录下 (当前安装包为:hadoop-1.2.1.tar.gz)

　　2. 进入conf子目录中，修改如下配置文件：

　　　　a. hadoop-env.sh (设置JAVA路径)

　　　　在末尾添加：

 export JAVA_HOME=/usr/lib/jvm/jdk1..0_25

　　　　b. core-site.xml (配置HDFS地址及端口号)

　　　　配置为:

 <?xml version="1.0"?>
 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

 <!-- Put site-specific property overrides in this file. -->

 <configuration>
         <property>
                 <name>fs.default.name</name>
                 <value>hdfs://localhost:9000</value>
         </property>
 </configuration>

　　　　c. hdfs-site.xml (修改备份方式，单机版本需要将其改为1)

　　　　配置为:

 <?xml version="1.0"?>
 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

 <!-- Put site-specific property overrides in this file. -->

 <configuration>
         <property>
                 <name>dfs.replication</name>
                 <value></value>
         </property>
 </configuration>

　　　　d. mapred-site.xml (设置JobTracker地址及端口)

　　　　配置为:

 <?xml version="1.0"?>
 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

 <!-- Put site-specific property overrides in this file. -->

 <configuration>
         <property>
                 <name>mapred.job.tracker</name>
                 <value>localhost:</value>
         </property>
 </configuration>

　　3. 进入Hadoop文件夹执行以下命令以格式化Hadoop文件系统HDFS：

 bin/hadoop namenode -format

　　4. 执行以下命令以启动所有Hadoop进程：

 bin/start-all.sh

　　5. 验证Hadoop是否安装成功

　　　　a. 打开浏览器，输入网址 http://localhost:50030 以查看MapReduce的Web页面：

　　　　b. 打开浏览器，输入网址 http://localhost:50070 以查看HDFS的Web页面：

　　　　如果显示正常，那么Hadoop环境便搭建好了。

小结

　　1. 伪分布式的架构，机制和真实分布式其实是一样的，不过伪分布式中，Master和Slave都是一台机器。

　　2. 关于真实分布式环境的搭建，将在以后介绍。到时会在虚拟机上组建一个虚拟网络，跑真·分布式程序。

Hadoop 在ubuntu系统上的搭建[图解]的更多相关文章

[Hadoop] 在Ubuntu系统上一步步搭建Hadoop（单机模式）
1 Hadoop的三种创建模式单机模式操作是Hadoop的默认操作模式,当首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,会保守地选择最小配置,即单机模式.该模式主要用于开发调试M ...
第二篇：Hadoop 在Ubuntu Kylin系统上的搭建[图解]
前言本文介绍如何在Ubuntu Kylin操作系统上搭建Hadoop平台. 配置 1. 操作系统: Ubuntu Kylin 14.04 2. 编程语言: JDK 1.8 3. 通信协议: SSH ...
在Ubuntu系统上搭建Hadoop 2.x(2.6.2)
官方的中文版的Hadoop快速入门教程已经是很老的版本了,新版的Hadoop目录结构发生了变化,因此一些配置文件的位置也略微调整了,例如新版的hadoop中找不到快速入门中提到的conf目录,另外,网 ...
如何在一个ubuntu系统上搭建SVN版本控制工具
有话说,由于公司项目部署需要,将Windows工程迁移到Linux,通过调查确定使用Ubuntu的Linux操作系统.那么如何快速搭建和Windows一样快捷方便的开发环境就很重要了.本文讲述如何在一 ...
64位的Ubuntu系统上使用汇编nasm和C语言
64位的Ubuntu系统上使用汇编nasm和C语言 $ nasm -f elf foo.asm -o foo.o$ gcc -c bar.c -o bar.o$ ld -s foo.o bar.o ...
在64位Ubuntu系统上安装32位程序包
在64位Ubuntu系统上安装32位的程序包 $sudo apt-get install package_name:i386 例如: $sudo apt-get install openjdk-7-j ...
孤荷凌寒自学python第六十一天在Fedora28版的linux系统上找搭建本地Mongodb数据服务
孤荷凌寒自学python第六十一天在Fedora28版的linux系统上找搭建本地Mongodb数据服务 (完整学习过程屏幕记录视频地址在文末) 今天是学习mongoDB数据库的第七天.成功在本地搭建 ...
Nginx: ubuntu系统上查找nginx.conf配置文件的路径
问题描述:在ubuntu系统上,找到nginx.conf文件的位置. 解决方法:在终端窗口中,输入命令:nginx -t 回显中就可以看到nginx.conf文件的路径了. 参考:https://bl ...
Nginx: ubuntu系统上如何判断是否安装了Nginx？
问题描述:ubuntu系统上,如何查看是否安装了Nginx? 解决方法:输入命令行:ps -ef | grep nginx master process后面就是Nginx的安装目录. 延伸:1. 如何 ...

随机推荐

如何给一个网卡配置多个虚拟ip
1.执行命令 ifconfig etho: 192.168.1.101 netmask 255.255.255.0 up 2.要想永久保存,则将刚刚那行代码写入/etc/rc.local (开机都会 ...
C# 检测网络链接
;//Local system uses a modem to connect to the Internet. ; //Local system uses a local area network ...
GUID
前言全局唯一标识符,简称GUID(发音为 /ˈɡuːɪd/或/ˈɡwɪd/),是一种由算法生成的唯一标识,通常表示成32个16进制数字(0-9,A-F)组成的字符串,如:{21EC2020-3AEA ...
sql删除语句
TRUNCATE TABLE Moisture_test 删除表里所有的数据,就连主键的自增也被删除delete Moisture_test 删除表里数据但是就连主键的自增没有被删除
localStorage
length:唯一的属性,只读,用来获取storage内的键值对数量. key:根据index获取storage的键名 getItem:根据key获取storage内的对应value setItem: ...
Mongoose 是什么?
Mongoose 参考手册标签(空格分隔): MongoDB 一般我们不直接用MongoDB的函数来操作MongoDB数据库 Mongose就是一套操作MongoDB数据库的接口. Schema 一 ...
cmd打开控制面板及其他命令
如果你在权限较小的域用户的机器上,要做一些管理操作,就不可避免的要使用cmd打开一些以前只能在图形界面里打开的程序.下面是我收集的一些常用操作. 以某个身份启动程序:runas /user:it\n1 ...
长理ACM 13-围圈报数(谌海军)
题目标题:围圈报数(谌海军) 题目描述:有n(n<=100)围成一圈,顺序排号(从1排到n).从第一个人开始报数(从1报到m(m<=9)),凡报到m的人退出圈子,问最后留下的是原来第几号的 ...
企业需要k2来解放孤岛危机
当我谈孤岛危机时,我谈些什么?你以为我要说的是一款风靡的游戏?那恐怕要让你失望了,今天要谈的是“企业管理体系孤岛”,但更多人甚至都没意识到这是危机. 下面的场景,也许你会觉得似曾相识. 场景一某制鞋 ...
DropMaster
DropMaster 是4个原生 VCL 控件的集合,在 Delphi 和 C++Builder 中使用.虽然包含在 Delphi 和 C++Builder 中的 VCL 组件允许同一程序内窗口之间的 ...

Hadoop 在ubuntu系统上的搭建[图解]

Hadoop 在ubuntu系统上的搭建[图解]的更多相关文章

随机推荐

热门专题