Linux中伪分布的搭建

一伪分布模式

特点：在单机上，模拟一个分布式的环境，具备Hadoop的所有功能

HDFS：NameNode + DataNode + SecondaryNameNode

Yarn：ResourceManager + NodeManager

（*）hadoop-env.sh JAVA_HOME /root/training/jdk1.8.0_144

1：进入Hadoop目录下

cd ~/training/hadoop-2.7.3/etc/hadoop

进入之后如下只有有个

二：需要配置的文件目录如下：

首先进行配置（*）hdfs-site.xml

<name>dfs.replication</name>

</property>

<!--

<name>dfs.permissions</name>

<value>false</value>

</property>

-->

（1）将如上代码放入到 hdfs-site.xml中的

进行命令进入到hdfs-site.xml文件中 vi hdfs-site.xml

并将上面的配置信息放入<configuration> </configuration>中，保存并退出。如下：

（2）进行配置（*）core-site.xml

<name>fs.defaultFS</name>

<value>hdfs://bigdata111:9000</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/root/training/hadoop-2.7.3/tmp</value>

</property>

首先创建一个tmp目录在 /root/training/hadoop-2.7.3 下。

（因为 HDFS数据块和元信息保存在操作系统的目录位置。。-默认是Linux的tmp目录,一定要修改。默认的tmp目录特点是一开机这里面的所有文件都会被删除了的）

返回到cd ../etc/hadoop/。进行命令 vi core-site.xml。然后将以上的配置信息加入到配置文件中的<configuration> </configuration>中，保存并退出

如下：

（3）进行配置（*）mapred-site.xml（默认没有这个文件）

而默认是mapred-site.xml.template。

<name>mapreduce.framework.name</name>

</property>

*********************************************************************8

这里我们将这个文件改为mapred-site.xml

命令： mv mapred-site.xml.template mapred-site.xml

vi mapred-site.xml

将以上配置信息写入该配置文件中。保存并退出

（4）进行配置（*）yarn-site.xml

<name>yarn.resourcemanager.hostname</name>

<value>bigdata111</value>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

进入该配置文件。

vi yarn-site.xml

并将如上的配置信息放入到里面。保存并退出

（5）将如上配置信息配置完成后并没结束。还要对HDFS的NameNode进行格式化 -----> 目录：/root/training/hadoop-2.7.3/tmp

举例：软盘，需要格式化

命令：hdfs namenode -format

日志：Storage directory /root/training/hadoop-2.7.3/tmp/dfs/name has been successfully formatted. 如果出现该日志则表明格式化成功

三：欧克，以上伪分布就已经完全部署上了。看看我们的成果吧！！

首先来启动一下。直接启动所有 start-all.sh

（*）启动：

HDFS：start-dfs.sh

Yarn: start-yarn.sh

统一的：start-all.sh

这里由于没有设置免密码。启动的时候要输入4次密码。。哦！对了，在启动的过程中会提示是否继续。记得按yes哦！！！

输入jps查看进程：

如果出现入下信息则表示启动成功！！

还可以进行网页端查看。在浏览器中输入http://192.168.40.111:8088/cluster/apps hdfs端口

http://192.168.40.111:50070/dfshealth.html#tab-datanode yarn端口

进行查看

Web Console访问：hdfs: 端口: 50070

yarn: 端口：8088

Linux中伪分布的搭建的更多相关文章

通过win下的eclipse连接虚拟机中伪分布的hadoop进行调试
VMware虚拟机配置Ubuntu桥接方式(Bridged)使虚拟机和宿主机能互相ping通, 通过win下的eclipse连接虚拟机中伪分布的hadoop进行调试 1.设置Bridged上网方式 V ...
Hadoop.2.x_伪分布环境搭建
一. 基本环境搭建 1. 设置主机名.静态IP/DNS.主机映射.windows主机映射(方便ssh访问与IP修改)等设置主机名: vi /etc/sysconfig/network # 重启系统生 ...
Hadoop之伪分布环境搭建
搭建伪分布环境上传hadoop2.7.0编译后的包并解压到/zzy目录下 mkdir /zzy 解压 tar -zxvf hadoop.2.7.0.tar.gz -C /zzy 配置hado ...
Hadoop2.6.0伪分布环境搭建
用到的软件: 一.安装jdk: 1.要安装的jdk,我把它拷在了共享文件夹里面. (用优盘拷也可以) 2.我把jdk拷在了用户文件夹下面. (其他地方也可以,不过路径要相应改变) 3.执行复制安装 ...
Linux中samba服务器的搭建
使用的vmware12虚拟机安装的centos6.8和物理机上的windows10,实现在windows10 上访问CentOs上的samba服务. 一.先查看系统中是否安装有samba服务相关的软件 ...
Linux 中NFS服务器的搭建
serve端IP:192.168.2.128 客户端IP:192.168.2.131 server端配置: 1.安装nfs,rpcbind,可以参考Linux 中yum的配置来安装: yum inst ...
hadoop-2.7.1伪分布环境搭建
1.准备Linux环境 1.0 点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet i ...
hbase 单机+伪分布环境搭建学习-1
1.单机模式: (1)编辑hbase-env.sh user@EBJ1023.local:/usr/local/flume_kafka_stom/hbase_1.1.2> vim conf/hb ...
Linux中Zabbix4.0的搭建
Zabbix简介 Zabbix是一个高度集成的企业级开源网络监控解决方案,与Cacti.nagios类似,提供分布式监控以及集中的web管理界面.zabbix具备常见商业监控软件所具备的功能,例如主机 ...

随机推荐

UVA - 11427 Expect the Expected (概率dp）
Some mathematical background. This problem asks you to compute the expected value of a random variab ...
Apache 解析.htaccess
解决.htaccess不解析输入a2enmod rewrite 修改/etc/apache.conf 此处改为ALL
python正则表达式Re模块备忘录
title: python正则表达式Re模块备忘录 date: 2019/1/31 18:17:08 toc: true --- python正则表达式Re模块备忘录备忘录 python中的数量词为 ...
从线性模型（linear model）衍生出的机器学习分类器（classifier）
1. 线性模型简介 0x1:线性模型的现实意义在一个理想的连续世界中,任何非线性的东西都可以被线性的东西来拟合(参考Taylor Expansion公式),所以理论上线性模型可以模拟物理世界中的绝大 ...
Consul1-window安装consul
转自 https://blog.csdn.net/j903829182/article/details/80960802 consul下载地址: https://www.consul.io/down ...
JavaScript之深入理解【函数】
一参考文献 <JavaScript忍者秘籍> 二函数特征总结 1. 函数是[第一型对象(first-class object)]:可以像这门语言的其它对象一样使用函数可以共处,可 ...
mysql Using filesort 索引不可用问题
今天上班发现线上机器CPU告警,看了一下发现是mysqld一直占用CPU处于满负荷状态,show processlist;一下,发现很多查询在排序状态,随便拿了一条sql explain看了一 ...
BufferedReader类里面mark(int readAheadLimit)中readAheadLimit到底代表什么
昨天用到了BufferedReader类里面mark(int readAheadLimit)方法,对于文档里面readAheadLimit的解释有些没弄懂,就翻开源码研究.具体的源码分析可以参见htt ...
git 解决每次更新代码都要输入用户名密码的解决方案
使用git pull或者git push每次都需要输入用户名和密码很繁琐,耽误时间,现在教大家一条命令实现保存用户名和密码不用再输入 git config --global credential.he ...
django QuerySet
Django对数据库的封装1——QuerySet 发布时间:2018-02-28 来源:网络上传者:用户关键字: manager 数据库记录影响发表文章摘要: Django对数据库的操 ...

Linux中伪分布的搭建

Linux中伪分布的搭建的更多相关文章

随机推荐

热门专题