第一步:配置网络(静态IP)

vi /etc/sysconfig/network-scripts/ifcfg-ens33(网卡名称可能不同)
1. 修改:
将该配置文件中的ONBOOT=no修改为yes(网络开机自启)
将BOOTPROTO=dhcp修改为static(将ip设置为静态ip)
 
2. 为了能够通过外部访问到虚拟机,增加:
IPADDR=192.168.154.110(110是自己设置的,154是VMnet8的NAT网段)
NETMASK=255.255.255.0(子网掩码都为这个)
GATEWAY=192.168.154.2(网关跟VMnet8的NAT的网关一样)
DNS1=192.168.154.2(还可以设置成8.8.8.8,114.114.114.114)
3. 重新启动网络:
service network restart
systemctl network restart
 
注:如果不用xshell则跳过这一步,但IP地址还是要查到
ifconfig
若没有这命令:
sudo yum  install net-tools
若查不到就老老实实配静态IP
 
 

第二步:配置主机名和ip地址的映射关系

  1. 设置主机名:vi /etc/sysconfig/network
NETWORKING=yes
HOSTNAME= (自定义一个主机名)例如:hadoop
保存退出
 
2. 将主机名ip地址进行映射 vi /etc/hosts
例如:
192.168.154.110 hadoop
保存退出,执行下面命令刷新,配置即可生效。
hostname hadoop
 
 

第三步:配置ssh免密登录

1. 进入用户的家目录下的.ssh隐藏目录:
cd .ssh/
 
2. 在该目录下,输入:
ssh-keygen -t rsa  
一直回车即可。此时会生成一个RSA 2048文件,生成了一对公钥,一对私钥。
输入ls 查看生成的私钥和公钥。如果想要查看生成的一对秘钥,可以使用 more 秘钥名即可
查看公钥: more id_rsa.pub
查看私钥: more id_rsa
 
3. 进入到hadoop的根目录,执行以下命令:把公钥拷贝到使用ssh的当前机器上
ssh-cp-id localhost(是你的主机名)
ssh-copy-id localhost(是你的主机名)
输入一次密码(登录linux系统的密码),待拷贝完成。
验证是否免密成功:
ssh 主机名
若不用输入密码即可登陆就成功了
 
 

第四步:关闭防火墙状态

在linux centos7版本中,使用的防火墙不是iptables(linux centos6中使用的防火墙),而是firewall,所有以下操作中要使用firewall的相关指令。
 
1.查看防火墙状态:
systemctl status firewalld
若显示Active: active (running),则表示防火墙已开启。
另外一种查看方式:
firewall-cmd  --state
若结果为running,表示防火墙已开启。
 
2. 关闭防火墙:
systemctl stop firewalld.service
 
3. 再次查看防火墙状态:
systemctl status firewalld
若显示Active: active (dead),则表示防火墙已关闭。
另外一种查看方式:
firewall-cmd  --state
若结果为not running,表示防火墙已关闭。
 
4. 禁止防火墙开机自启:
systemctl disable firewalld.service
 
想要开启防火墙,输入:
systemctl start firewalld
 
 

第五步:配置环境变量

vi /etc/profile
在该文件中加入:
export JAVA_HOME= (即jdk的安装目录)
export PATH=$PATH:$JAVA_HOME/bin
 

第六步:配置Hadoop

需要配置其中五个配置文件,进入到hadoop下etc下的hadoop目录,并查看该目录下的所有配置文件,并配置其中五个。
 
1. 配置hadoop-env.sh文件,该配置文件用于指定hadoop运行时jdk的路径:
vi hadoop-env.sh
export JAVA_HOME=自己的jdk安装目录
 
2. 配置core-site.xml文件,该文件是用户自定义文件。用于配置hadoop的文件系统:
vi core-site.xml
<!--配置hdfs的namenode的地址,使用的是hdfs协议:-->
<property>
<name>fs.defaultFS</name>
<value>hdfs://主机名:9000</value>
</property>
 
<!--配置hadoop运行时产生数据的存储目录,不是临时目录。-->
<property>
<name>hadoop.tmp.dir</name>
<value>/home/sun/app/hadoop-3.1.2/tmp</value>
</property>
 
3. 配置 hdsf-site.xml文件,配置在hdfs中,一份文件存几份,默认是3份,一台机器只能存一份:
vi hdfs-site.xml
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
 
4. 配置mapred-site.xml文件,map-reduce是hadoop中的一种计算模型,运行在yarn(资源调度系统)中:
mapred-site.xml
<property> <!--指定mapreduce运行在yarn上-->
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
 
5.配置yarn-site.xml文件,指定yarn的老大resourcemanager的地址(该地址是resourcemanager的主机地址,即主机名或该主机的ip地址):
vi yarn-site.xml
<property>
<name>yarn.resourcemanager.hostname</name>
<value>主机名</value>
</property>
 
<!--指定mapreduce执行shuffle时获取数据的方式-->
<property>
<name>yarn.nodemanager.aus-services</name>
<value>mapreduce_shuffle</value>
</property>
 
 

第七步:初始化并启动hadoop

该初始化不是启动hadoop的hdfs,而是对hdfs做格式化,需要到hadoop的bin目录中进行相关命令的操作
1. 进入到hadoop的bin目录,进行初始化;
./hdfs namenode -format
 
2. 进入到hadoop的sbin目录,启动hadoop:
start-all.sh  如果这命令不行就前面加 sh
 
最后在宿主机的浏览器中访问hadoop的hdfs,如访问成功,则说明伪分布式环境已搭建成功:
Hadoop2.X的版本中,访问hdfs的端口号是50070,访问mapreduce的端口号是8080
192.168.154.100:50070
192.168.154.100:8080
 
Hadoop3.X的版本中,访问hdfs的端口号由50070修改成了9870,访问mapreduce的端口号是8088
192.168.154.100:9870
192.168.154.100:8088
 
注:如果不能访问就检查防火墙是否关闭以及其他原因,端口号前面的IP地址是自己设置的静态IP

在centos7上进行hadoop-3.1.2的伪分布搭建的更多相关文章

  1. 2.hadoop基本配置,本地模式,伪分布式搭建

    2. Hadoop三种集群方式 1. 三种集群方式 本地模式 hdfs dfs -ls / 不需要启动任何进程 伪分布式 所有进程跑在一个机器上 完全分布式 每个机器运行不同的进程 2. 服务器基本配 ...

  2. hadoop: hbase1.0.1.1 伪分布安装

    环境:hadoop 2.6.0 + hbase 1.0.1.1 + mac OS X yosemite 10.10.3 安装步骤: 一.下载解压 到官网 http://hbase.apache.org ...

  3. hadoop学习;hadoop伪分布搭建

    先前已经做了准备工作安装jdk什么的,以下開始ssh免password登陆.这里我们用的是PieTTY工具,当然你也能够直接在linux下直接操作 ssh(secure shell),运行命令 ssh ...

  4. 在centos7上安装hadoop

    1.使用hadoop是需要jdk环境的,因为hadoop里面有java程序,而运行java程序需要jdk. 2.从宿主机上传文件到虚拟机有很多方法,我选择的是在虚拟机安装lrzsz,安装lrzsz命令 ...

  5. CentOS7上安装Hadoop

    设置sshssh-keygen -t rsa -P ''cat id_rsa.pub >> authorized_keys 查看slaves节点的id_rsa.pub文件,将文件内容复制到 ...

  6. Hadoop伪分布搭建

    一.伪分布式的搭建 1.准备Linux环境 1.0点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改 ...

  7. hadoop full cluster 改为伪分布

    https://hadoop.apache.org/docs/r2.7.6/hadoop-project-dist/hadoop-common/SingleCluster.html#Pseudo-Di ...

  8. 初试 Centos7 上 Ceph 存储集群搭建

    转载自:https://cloud.tencent.com/developer/article/1010539 1.Ceph 介绍 Ceph 是一个开源的分布式存储系统,包括对象存储.块设备.文件系统 ...

  9. Hadoop 安装(本地、伪分布、分布式模式)

    本地模式 环境介绍 一共三台测试机 master   192.168.4.91 slave1   192.168.4.45 slave2   192.168.4.96 操作系统配置 1.Centos7 ...

随机推荐

  1. WebSocket原理及技术简介

    摘要: WebSocket用于在Web浏览器和服务器之间进行任意的双向数据传输的一种技术.WebSocket协议基于TCP协议实现,包含初始的握手过程,以及后续的多次数据帧双向传输过程.其目的是在We ...

  2. ubuntu 制作本地yum仓库

    ubuntu 制作本地yum仓库 笔者: 张首富 W X: y18163201(请备注) qq群:895291458 时间:2019-01-31晚 今天到某银行进行软件部署的时候,碰到所有电脑都不允许 ...

  3. Java 给Word指定字符串添加批注

    本文将介绍在Java程序中如何给Word文档中的指定字符串添加批注.前文中,主要介绍的是针对某个段落来添加批注,以及回复.编辑.删除批注的方法,如果需要针对特定关键词或指定字符串来设置批注,可以参考本 ...

  4. vue学习之深入响应式原理

    vue的响应式原理 当你把一个普通的 JavaScript 对象传入 Vue 实例作为 data 选项,Vue 将遍历此对象所有的属性,并使用 Object.defineProperty 把这些属性全 ...

  5. Java 导出数据库表信息生成Word文档

    一.前言 最近看见朋友写了一个导出数据库生成word文档的业务,感觉很有意思,研究了一下,这里也拿出来与大家分享一波~ 先来看看生成的word文档效果吧 下面我们也来一起简单的实现吧 二.Java 导 ...

  6. kettle计划任务

    在kettle中固定抽取数据,需要用到kichen命令,编好批处理脚本:bat C: cd C:\soft\kettle\data-integration kitchen /file C:\soft\ ...

  7. 史上最全 Java 中各种锁的介绍

    更多精彩原创内容请关注:JavaInterview,欢迎 star,支持鼓励以下作者,万分感谢. 锁的分类介绍 乐观锁与悲观锁 锁的一种宏观分类是乐观锁与悲观锁.乐观锁与悲观锁并不是特定的指哪个锁(J ...

  8. 微信小程序如何解析html内容

    最近项目上遇到在微信小程序里需要显示新闻内容,新闻内容是通过接口读取的服务器中的富文本内容,是html格式的,小程序默认是不支持html格式的内容显示的,那我们需要显示html内容的时候,就可以通过w ...

  9. UiPath之DataTable转换为List和Array

    今天给大家分享一下,如何将DataTable转为List和Array,为此小U也花了不少时间研究,最后发现没有那么复杂. 先来说说List和Array的区别: List:就像一个链条,存储数据的空间可 ...

  10. 8.5 NOIP 模拟测试 13

    今天的考试说实话T1很简单没A,我是傻X.T2T3难得一批,但是暴力的分还是拿了! 总结一下就是:骗分过样例,暴力出奇迹!只要瞎搞就行了! 话说现在终于不像之前那么傻了,终于知道打暴力了,因为之前暴力 ...