Hadoop 搭建集群的步骤
1、安装jdk,配置环境变量
root@localhost java]# vi /etc/profile
在profile中添加如下内容:
#set java environment
export JAVA_HOME=/usr/java/jdk1.7.0_79
export JRE_HOME=$JAVA_HOME/jre
export CLASS_PATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib
export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin
export JAVA_HOME JRE_HOME CLASS_PATH PATH
搭建步骤指南:
http://blog.csdn.net/ab198604/article/details/8250461
http://www.powerxing.com/install-hadoop/
https://www.cnblogs.com/DreamDriver/p/6597020.html
2、新建hadoop 用户,赋给管理员权限
$sudo useradd -m hadoop -s /bin/bash
sudo passwd hadoop
sudo adduser hadoop sudo
3、配置单机hadoop环境
- 进入hadoop 安装目录,输入在本地机器(192.168.211.128)上使用ssh-keygen产生公钥私钥对
$ ssh-keygen -t rsa
- 用ssh-copy-id将公钥复制到远程机器中
ssh-copy-id hadoop@192.168.211.129 ( 复制到远程服务器 salve1 ) ## 输入远程服务器的密码,最后一次输入密码,复制成功之后,就再不用输入密码了
4、手动下载hadoop安装包,本人下载的是 hadoop-2.6.5.tar.gz 包,解压包
hadoop@ubuntu-virtual-machine:~$ ls
hadoop-2.6.5 hadoop-2.6.5.tar.gz
hadoop@ubuntu-virtual-machine:~$ tar zxvf hadoop-2.6.5.tar.gz
5、修改hadoop中的配置文件:
- hadoop 目录 etc文件夹下的 hadoop-env.sh,增加 export JAVA_HOME=/usr/java/jdk1.8.0_152)
- etc文件夹下的core-site.xml文件用文本编辑器打开,添加如下语句<property><name>fs.default.name</name><value>hdfs://localhost:9000</value></property>
这是hadoop核心的配置文件,这里配置的是HDFS的地址和端口号。
- etc文件夹下的hdfs-site.xml文件用文本编辑器打开,添加如下语句<property><name>dfs.replication</name><value>1</value></property>
这是Hadoop中的HDFS的配置,配置的备份方式默认为3,在单机版的Hadoop中,需要将其改为1.
- etc文件夹下的mapred-site.xml文件用文本编辑器打开,添加如下语句
<property>
<name>mapred.job.tracker</name><value>localhost:9001</value></property>
这是Hadoop中MapReduce的配置文件,配置的是JobTracker的地址和端口。 - 在 sbin目录下打开 hadoop-env.sh yarn-env.sh中添加 export JAVA_HOME=/usr/java/jdk1.8.0_152
6、在初次安装和使用Hadoop之前,需要格式化分布式文件系统HDFS。使用如下命令:
# bin/hadoop namenode -format
7、启动Hadoop守护进程,命令如下
Hadoop 搭建集群的步骤的更多相关文章
- redis 一二事 - 搭建集群缓存服务器
在如今并发的环境下,对大数据量的查询采用缓存是最好不过的了,本文使用redis搭建集群 (个人喜欢redis,对memcache不感冒) redis是3.0后增加的集群功能,非常强大 集群中应该至少有 ...
- 基于Hadoop分布式集群YARN模式下的TensorFlowOnSpark平台搭建
1. 介绍 在过去几年中,神经网络已经有了很壮观的进展,现在他们几乎已经是图像识别和自动翻译领域中最强者[1].为了从海量数据中获得洞察力,需要部署分布式深度学习.现有的DL框架通常需要为深度学习设置 ...
- Hadoop分布式集群搭建hadoop2.6+Ubuntu16.04
前段时间搭建Hadoop分布式集群,踩了不少坑,网上很多资料都写得不够详细,对于新手来说搭建起来会遇到很多问题.以下是自己根据搭建Hadoop分布式集群的经验希望给新手一些帮助.当然,建议先把HDFS ...
- Hadoop分布式集群搭建
layout: "post" title: "Hadoop分布式集群搭建" date: "2017-08-17 10:23" catalog ...
- hadoop分布式集群的搭建
电脑如果是8G内存或者以下建议搭建3节点集群,如果是搭建5节点集群就要增加内存条了.当然实际开发中不会用虚拟机做,一些小公司刚刚起步的时候会采用云服务,因为开始数据量不大. 但随着数据量的增大才会考虑 ...
- hadoop+spark集群搭建入门
忽略元数据末尾 回到原数据开始处 Hadoop+spark集群搭建 说明: 本文档主要讲述hadoop+spark的集群搭建,linux环境是centos,本文档集群搭建使用两个节点作为集群环境:一个 ...
- hadoop ha集群搭建
集群配置: jdk1.8.0_161 hadoop-2.6.1 zookeeper-3.4.8 linux系统环境:Centos6.5 3台主机:master.slave01.slave02 Hado ...
- 使用docker搭建hadoop分布式集群
使用docker搭建部署hadoop分布式集群 在网上找了非常长时间都没有找到使用docker搭建hadoop分布式集群的文档,没办法,仅仅能自己写一个了. 一:环境准备: 1:首先要有一个Cento ...
- hadoop+zookeeper集群高可用搭建
hadoop+zookeeper集群高可用搭建 Senerity 发布于 2 ...
随机推荐
- JavaScript中全局变量和局部变量的不同
今天看到大神写得一片文章,自己对全局变量和局部变量的理解还是不够深刻,因此写到这篇文章,做个总结. 大神代码截图+理解文字如下: 解析:上面代码中,变量i是var命令声明的,在全局范围内都有效,所以全 ...
- 瀑布流布局(等宽不等高jQuery)
在百度上看见的好多都是引用Masonry插件 ,之后我自己尝试了一个没有使用插件的 <body> <div id="main"> <div cla ...
- JUC原子类--01
JUC原子操作类分为四种类型 1. 基本类型: AtomicInteger, AtomicLong, AtomicBoolean ;2. 数组类型: AtomicIntegerArray, Atomi ...
- react - next.js 设置body style
因为next.js可以用pages文件夹中的js文件进行route,所以不需要public文件夹和html,因此没有body tag. body自带8px的maigin,我想要给整个页面设置背景颜色, ...
- spring(IOC)动态代理
姓名:黄于霞 班级:软件151 1.引入Spring IOC的核心jar包,创建IOC的配置文件beans.xml,内容如下: 1 <?xml version="1.0&qu ...
- WPF listbox实现多列显示数据
一.每行显示固定列数 <ListBox ItemsSource="{Binding DataList}" Style="{DynamicResource ListB ...
- 数据类型、运算符及Scanner类练习
数字加密.要求输入一个四位的正整数,每位数字加5再除以10取余,并替换该数字,再千位数与个位数互换,十位数与百位数互换. import java.util.Scanner;/** * 加密数字问题 * ...
- 10ci
- THUWC2019游记
Day -INF 听说自己苟进了THUWC,然而我还什么都不会啊,这样去了不得被吊打. 随便列了几个WC前的计划,然而到最后一个都没有完成,感觉学习效率好低啊,周围一众神仙天天吊打我. Day 0 坐 ...
- maven安装与基本配置
maven安装与基本配置 依赖:java环境,JDK安装 一. maven安装 (一)下载maven (二)安装与环境变量设置 (三)maven setting.xml配置 二. 创建maven项目 ...