hadoop完全分布式部署
1.我们先看看一台节点的hdfs的信息:(已经安装了hadoop的虚拟机:安装hadoophttps://www.cnblogs.com/lyx666/p/12335360.html)
start-dfs 打开hdfs需要启动的服务
然后再浏览器输入http://虚拟机ip地址:50070
问下滑: 可以看到以下相关信息
可以看到集群总容量大概为10G,而该集群只有一台机器,所以集群容量=该机器容量,可以看看这台虚拟机的硬盘是不是10G.
df -h / #确实是10G
2.接下来就要扩容该集群的容量,将这台虚拟机克隆(克隆步骤省略)
3.克隆机需要先配置以下
把克隆的dfs文件夹清空
将该文件夹下的数据清空:rm -rf *
网络ip:
BOOTPROTO=static 原本为DHCP
ONBOOT=yes 原本为no
IPADDR=192.168.43.62 ip地址 在网段里就行
NETMASK=255.255.255.0 子网掩码
GATEWAY=192.168.43.1 网关 需要查看主机的ipv4地址配置
DNS1=8.8.8.8 谷歌的dns解析
改完后重启网络:systemctl restart network
修改主机名
我这里是已经修改好了的,你们原本应该是localhost的主机名,我修改成lyx-62
修改后记得重启这台虚拟机:reboot
配置ip和主机名映射 还需要加上被克隆的虚拟机的ip和主机映射 【注意:这里两台都要添加修改】
修改后记得重启这两台虚拟机:reboot
配置ssh免密通信
(lyx-62)ssh-keygen #创建密钥对#
(lyx-62)ssh-copy-id lyx-62 #将公钥复制到lyx-62 也就是本机
注意这里另一台也需要(lyx-61):ssh-copy-id lyx-62 这样两台就能免密通信
修改hdfs-site.xfs配置文件 副本数修改为3【注意两台机器都需要修改】
<configuration>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
</configuration>
将克隆机主机名添加到slaves配置文件中 也就是加入到集群中 这里修改的是【被克隆的】slaves.xml文件
3.只启动被克隆的hdfs需要的服务
start-dfs.sh #可以看到lyx-62启动了datanode服务,说明它已经加入到这个集群了 所以它的硬盘也被加入到集群了
接下来我们在回过头来看看集群信息 可以发现硬盘容量增加了,说明lyx-62这台也被加入到集群了。
hadoop完全分布式部署的更多相关文章
- ubuntu下hadoop完全分布式部署
三台机器分别命名为: hadoop-master ip:192.168.0.25 hadoop-slave1 ip:192.168.0.26 hadoop-slave2 ip:192.168.0.27 ...
- Hadoop 完全分布式部署
完全分布式部署Hadoop 分析: 1)准备3台客户机(关闭防火墙.静态ip.主机名称) 2)安装jdk 3)配置环境变量 4)安装hadoop 5)配置环境变量 6)安装ssh 7)集群时间同步 7 ...
- Hadoop 完全分布式部署(三节点)
用来测试,我在VMware下用Centos7搭起一个三节点的Hadoop完全分布式集群.其中NameNode和DataNode在同一台机器上,如果有条件建议大家把NameNode单独放在一台机器上,因 ...
- Hadoop伪分布式部署
一.Hadoop组件依赖关系: 步骤 1)关闭防火墙和禁用SELinux 切换到root用户 关闭防火墙:service iptables stop Linux下开启/关闭防火墙的两种方法 1.永久性 ...
- ubuntu hadoop伪分布式部署
环境 ubuntu hadoop2.8.1 java1.8 1.配置java1.8 2.配置ssh免密登录 3.hadoop配置 环境变量 配置hadoop环境文件hadoop-env.sh core ...
- Hadoop+HBase分布式部署
test 版本选择
- Hadoop伪分布式模式部署
Hadoop的安装有三种执行模式: 单机模式(Local (Standalone) Mode):Hadoop的默认模式,0配置.Hadoop执行在一个Java进程中.使用本地文件系统.不使用HDFS, ...
- Hadoop 2.6.0分布式部署參考手冊
Hadoop 2.6.0分布式部署參考手冊 关于本參考手冊的word文档.能够到例如以下地址下载:http://download.csdn.net/detail/u012875880/8291493 ...
- Apache Hadoop 2.9.2 完全分布式部署
Apache Hadoop 2.9.2 完全分布式部署(HDFS) 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.环境准备 1>.操作平台 [root@node101.y ...
随机推荐
- 做.net的成为 微软mvp 是一个目标吧。
mvp 的评比 需要好多好多 绩效考核 比如博客排名,比如发表的文章数.
- lind 语 api 数据的安全性 第四弹
web api的安全性怎么保证呢. 一般公司会自己封装一套请求的规范. 下面来看看lind语里的webapi安全规范 step one 先看下 diagram: 学而思: 从上面的图分析一下: 如果我 ...
- c/python 的区别
c python ...
- react FileReader读取TXT文件并保存 split切割字符串 map()分别渲染切割后的数组内的所有字符串
//class my_fileReader( e ) { console.log(e.target.files[0]); const reader = new File ...
- Vue系列教程(一)基础介绍
什么是Vue.js Vue.js 是目前最火的一个前端框架,React是最流行的一个前端框架(React除了开发网站,还可以开发手机App,Vue语法也可以进行手机App的开发,需要借助Weex) V ...
- demon病毒样本分析
1. 简介 该样本是前几周爆发的THINKPHP漏洞中,被批量上传的一个病毒样本.如图所示. 2. 分析 该样本未经混淆,加壳,所以直接拖到IDA中即可分析. 首先从main函数开始.做一些初始化的函 ...
- Dubbox 环境搭建
第一章:Dubbox简介 Dubbox是一个开源的RPC(Remote ProcedureCall Protocol)远程调用框架,是由dangdang对阿里的Dubbo的升级,可以被视为Dubbo的 ...
- C++零食:WTL中使用双缓冲避免闪烁
双缓冲的原理可以这样形象的理解:把电脑屏幕看作一块黑板.首先我们在内存环境中建立一个"虚拟"的黑板,然后在这块黑板上绘制复杂的图形,等图形全部绘制完毕的时候,再一次性的把内存中绘制 ...
- golang学习笔记(二):流程控制
欢迎访问我的博客和github! 今天咱们把烦人的事情丢一丢,继续来学习go的基础知识. 这篇文章记录go语言的流程控制和更多类型. 流程控制 for Go 只有一种循环结构:for 循环. 基本的 ...
- Druid 0.17 入门(2)—— 安装与部署
在Druid快速入门其实已经简单的介绍过最简化配置的单节点部署,本文我们将详细描述Druid的多种部署方式,对于测试开发环境可以选用轻量的单机部署方式,而生产环境我们最好选用集群部署的方式,确保系统的 ...