hadoop2.5.2学习及实践笔记（一）—— 伪分布式学习环境搭建

软件

　　工具：vmware 10

　　系统：centOS 6.5 64位

　　Apache Hadoop: 2.5.2 64位

　　Jdk: 1.7.0_75 64位

安装规划

　　/opt/softwares/ ************* 软件包路径

　　 /modules/　　　************* 软件安装路径

安装准备

　　1. 安装并配置jdk

# cd /opt/softwares/ --进入到软件包目录

# tar -zxvf jdk-7u75-linux-x64.tar.gz --解压jdk tar包

# mv jdk1.7.0_75/ /opt/modules/ --复制到软件安装目录

# vi /etc/profile --配置环境变量，在文件最后添加如下配置

export JAVA_HOME=/opt/modules/jdk1.7.0_75
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin

# source /etc/profile --使环境变量立即生效

# java -version --检查配置

　　2. 创建用户账号

# groupadd hadoop --添加hadoop用户组

# useradd -g hadoop hadoop --添加hadoop用户并添加到hadoop组中

# passwd hadoop --为hadoop用户设置密码

安装hadoop

　　1. 解压hadoop

# tar -zxvf hadoop-2.5.2.tar.gz --解压tar包

# mv hadoop-2.5.2 /opt/modules/ --复制到安装目录

# cd /opt/modules/

# chown -R hadoop:hadoop hadoop-2.5.2 --修改用户和组

　　2. 配置环境变量

# vi /etc/profile  

export HADOOP_HOME=/opt/modules/hadoop-2.5.

export PATH=$PATH:$HADOOP_HOME/bin

# source /etc/profile

# hadoop version  --检查配置

Hadoop 2.5.

Subversion https://git-wip-us.apache.org/repos/asf/hadoop.git -r cc72e9b000545b86b75a61f4835eb86d57bfafc0

Compiled by jenkins on --14T23:45Z

Compiled with protoc 2.5.

From source with checksum df7537a4faa4658983d397abf4514320

This command was run using /opt/modules/hadoop-2.5./share/hadoop/common/hadoop-common-2.5..jar

# hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5..jar pi   --解压后无需配置即可运行于独立模式下，例：计算π值

　　3. 配置SSH免密码登陆　　

　　hadoop用户下执行

$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

$ chmod 644 authorized_keys --权限修改为rw-r-r

　　4. 配置hdfs

　　a. 修改hadoop-2.5.2/etc/hadoop目录下配置文件

　　> hadoop-env.sh

# vi hadoop-env.sh

export JAVA_HOME=/usr/java/jdk1.7.0_75 --显式配置JAVA_HOME，而非使用JAVA_HOME=${JAVA_HOME}

　　>core-site.xml

# vi core-site.xml

<property> --指定文件系统及主机、端口

<name>fs.defaultFS</name>

<value>hdfs://localhost:9000</value>

</property>

</configuration>

　　>hdfs-site.xml

# vi hdfs-site.xml

<property> --配置副本数量，默认为3，伪分布式下若不配置，则会提示副本数不足

<name>dfs.replication</name>

</property>

</configuration>

　　b. 格式化文件系统

$ mkdir -p /opt/data/hadoop/hdfs/name --创建namenode文件存储目录

$ mkdir -p /opt/data/hadoop/hdfs/data --创建datanode数据存储目录

$ vi hdfs-site.xml

<property>   --默认存储在/tmp/hadoop-hadoop/dfs/name目录下，清空缓存时，集群数据丢失，且无法重建，后果非常严重
        <name>dfs.namenode.name.dir</name>
        <value>/opt/data/hadoop/hdfs/name</value>
</property>
<property>
        <name>dfs.datanode.data.dir</name>
        <value>/opt/data/hadoop/hdfs/data</value>
</property>

$ hdfs namenode –format

　　c. 启动namenode和datanode守护进程

$ ./sbin/start-dfs.sh --启动hdfs

$ jps --进程查看

SecondaryNameNode
Jps
DataNode
NameNode

　　通过访问localhost:50070访问namenode web页面

　　5. 启动yarn

　　a. 修改hadoop-2.5.2/etc/hadoop目录下配置文件

　　> mapred-site.xml

$ cp mapred-site.xml.template mapred-site.xml --复制模板文件，并命名为mapred-sit.xml

$ vi mapred-site.xml

<property> --local:本地作业运行器 classic:经典mapreduce框架 yarn:新框架

<name>mapreduce.framework.name</name>

</property>

　　>yarn-site.xml

$ vi yarn-site.xml

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

　　b. 启动yarn

$ ./sbin/start-yarn.sh

$ jps

SecondaryNameNode
Jps
DataNode
NameNode
ResourceManager
NodeManager

　　通过localhost:8088访问ResourceManager web页面

hadoop2.5.2学习及实践笔记（一）—— 伪分布式学习环境搭建的更多相关文章

Hadoop2.0伪分布式平台环境搭建
一.搭建环境的前提条件环境:ubuntu-16.04 hadoop-2.6.0 jdk1.8.0_161.这里的环境不一定需要和我一样,基本版本差不多都ok的,所需安装包和压缩包自行下载即可. 因 ...
hadoop2.5.2学习及实践笔记（二）—— 编译源代码及导入源码至eclipse
生产环境中hadoop一般会选择64位版本,官方下载的hadoop安装包中的native库是32位的,因此运行64位版本时,需要自己编译64位的native库,并替换掉自带native库. 源码包下的 ...
hadoop2.5.2学习及实践笔记（四）—— namenode启动过程源码概览
对namenode启动时的相关操作及相关类有一个大体了解,后续深入研究时,再对本文进行补充 >实现类 HDFS启动脚本为$HADOOP_HOME/sbin/start-dfs.sh,查看star ...
Java web与web gis学习笔记（一）——Tomcat环境搭建
系列链接: Java web与web gis学习笔记(一)--Tomcat环境搭建 Java web与web gis学习笔记(二)--百度地图API调用 JavaWeb和WebGIS学习笔记(三)-- ...
ASP.NET Core on K8S学习初探（1）K8S单节点环境搭建
当近期的一个App上线后,发现目前的docker实例(应用服务BFF+中台服务+工具服务)已经很多了,而我司目前没有专业的运维人员,发现运维的成本逐渐开始上来,所以容器编排也就需要提上议程.因此我决定 ...
【零基础学习FreeRTOS嵌入式系统】之一：FreeRTOS环境搭建
[零基础学习FreeRTOS嵌入式系统]之一:FreeRTOS环境搭建一:FreeRTOS系统下载在官网上https://www.freertos.org/,找到下载入口. 或直接进入下载地址ht ...
Hadoop2.6.0实践：001 伪分布式环境搭建
##################### Centos6.4VM_01_os.rar ################################################准备工作/opt ...
Scala学习笔记（一）：环境搭建
计算机领域的编程语言种类繁多,如C.C++.Java.C#等,我们知道的一般都是较为流行的编程语言,然有更多的是没听说过的,于是也就说不上关注或者使用了一次在网上查资料时,无意间看到了“函数式编程” ...
Hadoop学习笔记（一）：ubuntu虚拟机下的hadoop伪分布式集群搭建
hadoop百度百科:https://baike.baidu.com/item/Hadoop/3526507?fr=aladdin hadoop官网:http://hadoop.apache.org/ ...

随机推荐

Sass 语法格式及编译
一.sass语法格式这里说的 Sass 语法是 Sass 的最初语法格式,他是通过 tab 键控制缩进的一种语法规则,而且这种缩进要求非常严格.另外其不带有任何的分号和大括号.常常把这种格式称为 S ...
关于package.json学习
1.如果要下载npm包,必须有package.json文件,不然会报错,如果缺少必要字符报错,参考报错信息 2.license,指定用户权限,可以不写,不会报错 3.devDependencies,依 ...
如何使用MongoDB+Springboot实现分布式ID?
转载请标明出处: http://blog.csdn.net/forezp/article/details/69056017 本文出自方志朋的博客一.背景如何实现分布式id,搜索相关的资料,一般会给 ...
java 打印流递归复制子文件子文件夹不同编码文件复制到同一文件中序列化流反序列化流
package com.swift.jinjie; import java.io.BufferedInputStream; import java.io.File; import java.io.Fi ...
谈谈两种标准库类型---string和vector
两种最重要的标准库---string和vector string和vector是两种最重要的标准库类型,string表示可变长的字符序列,vector存放的是某种给定类型对象的可变长序列. 一.标准库 ...
LeetCode979. 在二叉树中分配硬币
问题:979. 在二叉树中分配硬币给定一个有 N 个结点的二叉树的根结点 root,树中的每个结点上都对应有 node.val 枚硬币,并且总共有 N 枚硬币. 在一次移动中,我们可以选择两个相邻的 ...
JAVA / MySql 编程——第八章 DAO 模式
1. 数据持久化:将程序中的数据在瞬时状态和持久状态间转换的机制即为数据持久化: 2. 持久化的实现方式:数据库.普通文件.XML文件: 3. JDBC封装: ...
Sublime Text3的快捷键和插件
今天重装了一下Sublime Text3,发现了一个不错的网站,关于Sublime Text3的插件安装介绍的很详细,还有右键增强菜单和浏览器打开快捷键的创建.奉上链接 http://www.cnbl ...
oauth2.0协议接口-第一篇-api逻辑
开放平台是支持OAuth2.0和RESTful协议的资源分享平台,经过授权的合作伙伴可以读取和写入资讯.用户.文件.数据库等资源. 1.创建数据库表结构 CMSSyncClient(数据同步客户端) ...
C6748的GPIO口配置使用
2018年1月17日更新: 这几天用了创龙的C6748的库,对于GPIO配置十分不爽,我移植了RK6748的库,用起来十分酸爽,把下面的文件加入到工程中,然后include头文件后就可以使用.非常好使 ...

hadoop2.5.2学习及实践笔记（一）—— 伪分布式学习环境搭建

hadoop2.5.2学习及实践笔记（一）—— 伪分布式学习环境搭建的更多相关文章

随机推荐

热门专题