Linux下的Hadoop安装（本地模式）

系统为CentOS 6.9，Hadoop版本2.8.3，虚拟机VMware Workstation

主要介绍Linux虚拟机安装、环境配置和Hadoop本地模式的安装。伪分布式和Windows下的安装将另作补充。

网络上关于Hadoop安装的教程非常多，这里主要是归纳出安装过程的简要步骤和可能碰到的问题。

Linux环境安装
NAT
Linux
设置网络
HOST
其他环境设置
Java环境配置
Hadoop本地模式安装

Linux环境安装

NAT
Linux
设置网络
HOST
其他环境设置

NAT

取消DHCP服务；
设置子网网段，例如我自己用的是默认的192.168.126网段，之后各虚拟机IP就设为该网段；
在NAT设置中修改DNS地址，指定为自己所处网络的DNS，网关地址默认为当前网段的.2地址。

Linux

在VMware上安装Linux并不困难，所以跳过虚拟机设置，直接列出安装过程中可能碰到的几个问题。

我所安装的CentOS 6.9在安装开始时会出现media test界面。可能因为用的不是光盘，所以选择OK会出错；
期间会碰到两次关于存储空间，可以直接选择全部忽略和全部占用；
最后一步，Desktop

设置网络

由于之前关闭了DHCP自动分配IP的功能，所以需要自己进行网络参数的设置。

右键网络，修改IPV4设置，地址只要是126就行；
修改完成后，点击网络的eth0，就能成功连接了，这时可以ping它一ping。

HOST

修改hostname以便识别，打开/etc/sysconfig/network，添加hostname（要先加NETWORKING=yes）；
打开/etc/hosts，添加IP地址和新设置的hostname。

其他环境设置

由于是为了学习，其实可以直接把Linux的防火墙和selinux关掉。

防火墙：chkconfig iptables off
selinux：/etc/sysconfig/selinux，disabled一下

Java环境配置

CentOS一般自带OpenJDK，最好还是用Oracle的JDK，OpenJDK卸掉卸掉（这个或许我会多写一篇）；
安装：

官网下载想要的版本（确认可与所用的Hadoop向配），然后选个目录解压（操作系统课自行学习）
设置环境变量：

很多教程会写到要添加classpath，但经我个人测试是不需要的，而且翻了Oracle的说明也没讲到Linux要配置这个。

不过，有看到一些人说没添加会在一些情况下出错，所以。。等出错了就知道了。但windows下的确是不需要的。

具体步骤为：修改配置文件/etc/profile，加上

export JAVA _ HOME="JDK地址"

export PATH=$JAVA_HOME/bin:$PATH

然后执行source /etc/profile

Hadoop本地模式安装

下载hadoop无需任何设置，默认就为本地模式。

下载所需版本的hadoop，解压；
确认JAVA_HOME环境变量配置正确：echo；
可以试着运行一个测试文件：

#test.input

hadoop mapreduce hive

hbase spark storm

sqoop hadoop hive

spark hadoop

然后输入

bin中hadoop的目录 jar share/hadoop/mapreduce/hadoop-mapreduce-examples-x.x.x.jar wordcount 输入文件目录 输出文件名

在job ID中看到local字样即为本地模式

在输出文件中看到SUCCESS字样即为运行成功

以上只是本地模式的安装，因而相当简略，伪分布式、完全分布和HA安装要麻烦得多，许多细节会在之后再详细描述。

Linux下的Hadoop安装（本地模式）的更多相关文章

Linux Hadoop2.7.3 安装(单机模式) 一
Linux Hadoop2.7.3 安装(单机模式) 一 Linux Hadoop2.7.3 安装(单机模式) 二 java环境安装 http://www.cnblogs.com/zeze/p/590 ...
Linux Hadoop2.7.3 安装(单机模式) 二
Linux Hadoop2.7.3 安装(单机模式) 一 Linux Hadoop2.7.3 安装(单机模式) 二 YARN是Hadoop 2.0中的资源管理系统,它的基本设计思想是将MRv1中的Jo ...
Linux下命令行安装weblogic10.3.6
Linux下命令行安装weblogic10.3.6 一.安装前准备工作: 1.创建用户useradd weblogic;创建用户成功linux系统会自动创建一个和用户名相同的分组,并将该用户分到改组中 ...
Linux下MongoDB服务安装
Linux下MongoDB服务安装 MongoDB是一个基于分布式文件存储的数据库.由C++语言编写.旨在为WEB应用提供可扩展的高性能数据存储解决方案.MongoDB是一个介于关系数据库和非关系数据 ...
细说Linux下软件包的安装与管理
一源码安装方式由于linux操作系统开放源代码,因而在其上安装的软件大部分也都是开源软件,例如apache.tomcat.php等软件.开源软件基本都提供源码下载,源码安装的方式:源码安 ...
Linux下Jdk的安装和jdk环境变量的设置
我们在Linux下安装系统软件的时候,经常遇到一些系统环境变量配置的问题.什么是环境变量?如何定制环境变量?我将在下面做一些介绍.一.什么是环境变量?Linux是一个多用户的操作系统.多用户意味着每个 ...
linux下chromedriver的安装
很多时候,发现phantomjs被一些网站屏蔽导致我们无法达到想要的结果,一方面phantomjs也停止维护,这时候们可以使用chromedriver(谷歌)或者firefoxdriver(火狐)来代 ...
Linux下zoopkeeper的安装和启动
Linux下zoopkeeper的安装和启动 1.什么是zookeeper ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoo ...
Linux下nginx编译安装教程和编译参数详解
这篇文章主要介绍了Linux下nginx编译安装教程和编译参数详解,需要的朋友可以参考下一.必要软件准备1.安装pcre 为了支持rewrite功能,我们需要安装pcre 复制代码代码如下: # y ...

随机推荐

使用pm2离线部署nodejs项目
1.下载https://npm.taobao.org/mirrors/node/v8.11.1/node-v8.11.1-linux-x64.tar.xz 比如安装到/opt目录 xz -d node ...
给artDialog插件增加动画效果
领导想给弹窗增加几种动画效果,以前用过layer弹窗,效果不错,它的动画是用的样式,实现很简单,所以把动画拷贝了过来,打包到现在的artDialog.js里... 使用方式:新增配置参数{anim:4 ...
【sqli-labs】Less18~Less22
Less18: User-Agent注入,有错误回显感叹一句,越来越难了.现在只能先看代码再分析怎么注入了..... 通过代码,发现username和password均做了校验.但是会有一个插入us ...
Linux 系统根目录下各个文件夹的作用
原文: https://blog.csdn.net/qq_26941173/article/details/78376760 /bin 系统由很多放置可执行文件的目录,但是bin目录比较特殊.因为bi ...
java Swing组件和事件处理
1.常见的容器 JComponent是 Container 的子类,中间容器必须添加到底层容器中才能够发挥作用, JPanel 面板 :使用jPanel 创建一个面板,再通过添加组件到该面板上面,JP ...
CF1065D
如果不喜欢过长代码的看官,请移步其他题解... 这题其实思想极其简单: 棋盘问题常见的算法都比较暴力,常用的有搜索和状压dp 而这道题显然没啥能状压的,所以我们考虑搜索但是仅仅搜索是不够的,因为有极 ...
mysql入门练习
2.详细解释列mysql执行语句的每个参数与参数值的含义 mysql -hlocalhost -P3306 -uroot -proot 连接数据库,端口号为3306, 用户名root, 密码roo ...
Python 读写excel类
#-*- coding: utf8 -*- import xlrd import xlwt from Public import GlobalClass def openexcel(path): tr ...
python DLL接口测试
#coding=utf-8 import clr import sys import threading from itertools import permutations sys.path.app ...
C#异常断电后重新启动项目出现配置未初始化错误
转到如截图中所示路径,将其下的数据删掉,就可以启动了.