hadoop2.5.2学习及实践笔记(一)—— 伪分布式学习环境搭建
软件
工具:vmware 10
系统:centOS 6.5 64位
Apache Hadoop: 2.5.2 64位
Jdk: 1.7.0_75 64位
安装规划
/opt/softwares/ ************* 软件包路径
/modules/ ************* 软件安装路径
安装准备
1. 安装并配置jdk
|
# cd /opt/softwares/ --进入到软件包目录 # tar -zxvf jdk-7u75-linux-x64.tar.gz --解压jdk tar包 # mv jdk1.7.0_75/ /opt/modules/ --复制到软件安装目录 # vi /etc/profile --配置环境变量,在文件最后添加如下配置 export JAVA_HOME=/opt/modules/jdk1.7.0_75 # source /etc/profile --使环境变量立即生效 # java -version --检查配置 |
2. 创建用户账号
|
# groupadd hadoop --添加hadoop用户组 # useradd -g hadoop hadoop --添加hadoop用户并添加到hadoop组中 # passwd hadoop --为hadoop用户设置密码 |
安装hadoop
1. 解压hadoop
|
# tar -zxvf hadoop-2.5.2.tar.gz --解压tar包 # mv hadoop-2.5.2 /opt/modules/ --复制到安装目录 # cd /opt/modules/ # chown -R hadoop:hadoop hadoop-2.5.2 --修改用户和组 |
2. 配置环境变量
# vi /etc/profile export HADOOP_HOME=/opt/modules/hadoop-2.5.
export PATH=$PATH:$HADOOP_HOME/bin # source /etc/profile
# hadoop version --检查配置
Hadoop 2.5.
Subversion https://git-wip-us.apache.org/repos/asf/hadoop.git -r cc72e9b000545b86b75a61f4835eb86d57bfafc0
Compiled by jenkins on --14T23:45Z
Compiled with protoc 2.5.
From source with checksum df7537a4faa4658983d397abf4514320
This command was run using /opt/modules/hadoop-2.5./share/hadoop/common/hadoop-common-2.5..jar # hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5..jar pi --解压后无需配置即可运行于独立模式下,例:计算π值
3. 配置SSH免密码登陆
hadoop用户下执行
| $ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys $ chmod 644 authorized_keys --权限修改为rw-r-r |
4. 配置hdfs
a. 修改hadoop-2.5.2/etc/hadoop目录下配置文件
> hadoop-env.sh
|
# vi hadoop-env.sh export JAVA_HOME=/usr/java/jdk1.7.0_75 --显式配置JAVA_HOME,而非使用JAVA_HOME=${JAVA_HOME} |
>core-site.xml
|
# vi core-site.xml <configuration> <property> --指定文件系统及主机、端口 <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration> |
>hdfs-site.xml
|
# vi hdfs-site.xml <configuration> <property> --配置副本数量,默认为3,伪分布式下若不配置,则会提示副本数不足 <name>dfs.replication</name> <value>1</value> </property> </configuration> |
b. 格式化文件系统
|
$ mkdir -p /opt/data/hadoop/hdfs/name --创建namenode文件存储目录 $ mkdir -p /opt/data/hadoop/hdfs/data --创建datanode数据存储目录 $ vi hdfs-site.xml <property> --默认存储在/tmp/hadoop-hadoop/dfs/name目录下,清空缓存时,集群数据丢失,且无法重建,后果非常严重 $ hdfs namenode –format |
c. 启动namenode和datanode守护进程
|
$ ./sbin/start-dfs.sh --启动hdfs $ jps --进程查看 SecondaryNameNode |
通过访问localhost:50070访问namenode web页面

5. 启动yarn
a. 修改hadoop-2.5.2/etc/hadoop目录下配置文件
> mapred-site.xml
|
$ cp mapred-site.xml.template mapred-site.xml --复制模板文件,并命名为mapred-sit.xml $ vi mapred-site.xml <property> --local:本地作业运行器 classic:经典mapreduce框架 yarn:新框架 <name>mapreduce.framework.name</name> <value>yarn</value> </property> |
>yarn-site.xml
|
$ vi yarn-site.xml <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> |
b. 启动yarn
|
$ ./sbin/start-yarn.sh $ jps SecondaryNameNode |
通过localhost:8088访问ResourceManager web页面

hadoop2.5.2学习及实践笔记(一)—— 伪分布式学习环境搭建的更多相关文章
- Hadoop2.0伪分布式平台环境搭建
一.搭建环境的前提条件 环境:ubuntu-16.04 hadoop-2.6.0 jdk1.8.0_161.这里的环境不一定需要和我一样,基本版本差不多都ok的,所需安装包和压缩包自行下载即可. 因 ...
- hadoop2.5.2学习及实践笔记(二)—— 编译源代码及导入源码至eclipse
生产环境中hadoop一般会选择64位版本,官方下载的hadoop安装包中的native库是32位的,因此运行64位版本时,需要自己编译64位的native库,并替换掉自带native库. 源码包下的 ...
- hadoop2.5.2学习及实践笔记(四)—— namenode启动过程源码概览
对namenode启动时的相关操作及相关类有一个大体了解,后续深入研究时,再对本文进行补充 >实现类 HDFS启动脚本为$HADOOP_HOME/sbin/start-dfs.sh,查看star ...
- Java web与web gis学习笔记(一)——Tomcat环境搭建
系列链接: Java web与web gis学习笔记(一)--Tomcat环境搭建 Java web与web gis学习笔记(二)--百度地图API调用 JavaWeb和WebGIS学习笔记(三)-- ...
- ASP.NET Core on K8S学习初探(1)K8S单节点环境搭建
当近期的一个App上线后,发现目前的docker实例(应用服务BFF+中台服务+工具服务)已经很多了,而我司目前没有专业的运维人员,发现运维的成本逐渐开始上来,所以容器编排也就需要提上议程.因此我决定 ...
- 【零基础学习FreeRTOS嵌入式系统】之一:FreeRTOS环境搭建
[零基础学习FreeRTOS嵌入式系统]之一:FreeRTOS环境搭建 一:FreeRTOS系统下载 在官网上https://www.freertos.org/,找到下载入口. 或直接进入下载地址ht ...
- Hadoop2.6.0实践:001 伪分布式环境搭建
##################### Centos6.4VM_01_os.rar ################################################准备工作/opt ...
- Scala学习笔记(一):环境搭建
计算机领域的编程语言种类繁多,如C.C++.Java.C#等,我们知道的一般都是较为流行的编程语言,然有更多的是没听说过的,于是也就说不上关注或者使用了 一次在网上查资料时,无意间看到了“函数式编程” ...
- Hadoop学习笔记(一):ubuntu虚拟机下的hadoop伪分布式集群搭建
hadoop百度百科:https://baike.baidu.com/item/Hadoop/3526507?fr=aladdin hadoop官网:http://hadoop.apache.org/ ...
随机推荐
- Python——并发编程
开始说并发编程之前,最好有一定的底层知识积累,这里我把需要的知识总结了一下,如果看下面的有不理解的可以看一下:https://www.cnblogs.com/kuxingseng95/p/941820 ...
- 14、SpringBoot------定制错误返回内容json格式
开发工具:STS 前言: 在前后端分离的项目中,当前端向后端请求资源失败时,想知道具体的错误原因,给用户予以提示. 但是,在springboot中返回内容是固定的.并不适合我们前端进行分析. 所以,就 ...
- Go标准库学习之OS常用函数
1.OS基础操作 //获取主机名 os.Hostname() //获取当前目录 os.Getwd() //获取用户ID os.Getuid() //获取有效用户ID os.Geteuid() //获取 ...
- iOS面试题总结(持续更新)
过段时间打算跳槽,找了一些面试题来做,在这里做个总结方便review,希望能对要面试的童鞋有帮助. 以下为面试题: 运行以下代码会有什么结果 NSString *str1 = @"str1& ...
- vue的生命周期和路由守卫
组件相关钩子函数: beforeCreate.created.beforeMount.mounted.beforeUpdate.updated.beforeDestroy.destoryed 还有 ...
- 本地预览的vue项目,在githubpage静态展示
本地项目github静态展示 前提 在本地npm run dev后能够在本地端口正常显示 githubpage为自己的静态页面 上线 config/index.js中设置assetsPublicPat ...
- Spring框架基础2
Spring框架基础2 测试Spring的AOP思想和注解的使用 导包(在前面的基础上添加) SpringAOP名词解释 AOP编程思想:横向重复代码,纵向抽取:就是说多个地方重复的代码可以抽取出来公 ...
- django+xadmin在线教育平台(十)
剩余app model注册 courses注册 新建courses/adminx.py: # encoding: utf-8 __author__ = 'mtianyan' __date__ = '2 ...
- 为什么 redis 单线程却能支撑高并发
redis 和 memcached 有什么区别?redis 的线程模型是什么?为什么 redis 单线程却能支撑高并发? 这个是问 redis 的时候,最基本的问题吧,redis 最基本的一个内部原理 ...
- 快速排序算法Java实现
1) 通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行 示例: package ...