大数据学习——搭建第一台Hadoop主机
类型:学习笔记
参考:尚硅谷大数据系列教程
工具准备
1、VMware
2、CentOS 7 最小安装版
3、远程工具推荐使用 FinalShell
安装系统
1、打开VMware,根据自己的情况配置好虚拟机,选择系统镜像就可以安装了,可自行百度“VMware如何安装CentOS”
2、打开虚拟机后,选中Test this media & install CentOS 7,回车进行安装

3、语言设置为中文:简体中文
4、时间日期:根据实际情况设置即可
5、配置磁盘,使用默认配置也行

选中我要配置分区,点击完成,进入手动分区

/boot:1Gswap:4G/:剩下全部
6、学习用机,可以关闭KDUMP
7、设置完成后,可以点击开始安装,安装过程中记得设置root用户密码
配置网络
我们需要配置3处
1、配置VMware
右上角编辑->虚拟机网络编辑器,进入更改设置后,选中VMnet8进行设置

- 子网IP:
192.168.10.0 - 子网掩码:
255.255.255.0 - 在NAT设置中将网关设置为:
192.168.10.2
2、配置Windows网卡
我们打开网络连接界面:按“Win+R”,打开【运行】;输入“ncpa.cpl”,回车。
找到VMnet8,右键属性,找到“Internet 协议版本 4(TCP/IPv4)”,双击进入属性设置

根据步骤一,填入对应位置
3、配置CentOS 7
我们以root用户登录
vi /etc/sysconfig/network-scripts/ifcfg-ens33
将BOOTPROTO="dynamic"更改为BOOTPROTO="static"
在最后添加下面几句,注意不要拼写错误
IPADDR=192.168.10.100
GATEWAY=192.168.10.2
DNS1=192.168.10.2
修改hostname,改为hadoop100(随意啦,你自己记得就行)
vi /etc/hostname
添加主机名和IP的映射关系(方便用主机名代替IP)
vi /etc/hosts
#我就象征性写了几个,后面用到再添加也可以
192.168.10.100 hadoop100
192.168.10.101 hadoop101
192.168.10.102 hadoop102
192.168.10.103 hadoop103
192.168.10.104 hadoop104
重启
reboot
4、测试网络
重启进入系统后,测试网络是否畅通
ping www.baidu.com
如果网络不可达,注意检查拼写错误。网络畅通是必须的,解决完再进行下一步哦。
配置环境
1、最小系统需要安装下面的工具
net-tool工具包
yum install -y net-tools
vim编辑器
yum install -y vim
epel-release软件仓库
yum install -y epel-release
rsync:数据同步工具
yum install -y rsync
2、关闭防火墙,禁用开机自启(学习用途)
systemctl stop firewalld
systemctl disable firewalld.service
3、创建用户,并修改密码
useradd swcode
passwd swcode
4、配置用户的root权限,否则sudo无法执行
vim /etc/sudoers
# 在 %wheel 下面添加,NOPASSWD无需密码
swcode ALL=(ALL) NOPASSWD:ALL
:wq!强制保存即可
5、在/opt目录下创建文件夹,并修改所属主和所属组(root下执行)
mkdir /opt/module
mkdir /opt/software
chown swcode:swcode /opt/module
chown swcode:swcode /opt/software
下面是成功的样子
drwxr-xr-x. 2 swcode swcode 6 11月 14 11:34 module
drwxr-xr-x. 2 swcode swcode 6 11月 14 11:34 software
6、卸载虚拟机自带JDK(最小版是没有的,可以忽略这一步)
rpm -qa | grep -i java | xargs -n1 rpm -e --nodeps
rpm -qa:查询所安装的所用rpm软件包grep -i:忽略大小写xargs -n1:每次只传递一个参数rpm -e --nodeps:强制卸载软件
7、重启虚拟机
reboot
大数据学习——搭建第一台Hadoop主机的更多相关文章
- 大数据学习笔记之初识Hadoop
1.Hadoop概述 1.1 Hadoop名字的由来 Hadoop项目作者的孩子给一个棕黄色的大象样子的填充玩具的命名 Hadoop的官网:http://hadoop.apache.org . 1.2 ...
- 大数据学习之路之Hadoop
Hadoop介绍 一.简介 Hadoop是一个开源的分布式计算平台,用于存储大数据,并使用MapReduce来处理.Hadoop擅长于存储各种格式的庞大的数据,任意的格式甚至非结构化的处理.两个核心: ...
- 大数据学习(1)Hadoop安装
集群架构 Hadoop的安装其实就是HDFS和YARN集群的配置,从下面的架构图可以看出,HDFS的每一个DataNode都需要配置NameNode的位置.同理YARN中的每一个NodeManager ...
- 大数据学习(7)Hadoop高可用
HDFS高可用 通过主从切换实现单NameNode高可用.通过Federation:水平扩展来联合多NameNode个: NameNode高可用 把edits日志从原来的nameNode中分离出来,存 ...
- 大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建 图文详解
引言 在之前的大数据学习系列中,搭建了Hadoop+Spark+HBase+Hive 环境以及一些测试.其实要说的话,我开始学习大数据的时候,搭建的就是集群,并不是单机模式和伪分布式.至于为什么先写单 ...
- 大数据学习系列之四 ----- Hadoop+Hive环境搭建图文详解(单机)
引言 在大数据学习系列之一 ----- Hadoop环境搭建(单机) 成功的搭建了Hadoop的环境,在大数据学习系列之二 ----- HBase环境搭建(单机)成功搭建了HBase的环境以及相关使用 ...
- 大数据学习系列之六 ----- Hadoop+Spark环境搭建
引言 在上一篇中 大数据学习系列之五 ----- Hive整合HBase图文详解 : http://www.panchengming.com/2017/12/18/pancm62/ 中使用Hive整合 ...
- 大数据学习(16)—— HBase环境搭建和基本操作
部署规划 HBase全称叫Hadoop Database,它的数据存储在HDFS上.我们的实验环境依然基于上个主题Hive的配置,参考大数据学习(11)-- Hive元数据服务模式搭建. 在此基础上, ...
- 大数据系列(3)——Hadoop集群完全分布式坏境搭建
前言 上一篇我们讲解了Hadoop单节点的安装,并且已经通过VMware安装了一台CentOS 6.8的Linux系统,咱们本篇的目标就是要配置一个真正的完全分布式的Hadoop集群,闲言少叙,进入本 ...
随机推荐
- CF891E-Lust【EGF】
正题 题目链接:https://www.luogu.com.cn/problem/CF891E 题目大意 \(n\)个数字的一个序列\(a_i\),每次随机选择一个让它减去一.然后贡献加上所有其他\( ...
- Winfrom 中完美设置webbrowser控件内核版本
前言 .NET 版本更新了一代又一代,winform中的webbrowser控件的IE内核版本却始终用的IE7,好多网站都对IE7已经不支持.webbrowser这个控件就显得有些鸡肋,经过查找大佬门 ...
- Javascript设计模式之原型模式、发布订阅模式
原型模式 原型模式用于在创建对象时,通过共享某个对象原型的属性和方法,从而达到提高性能.降低内存占用.代码复用的效果. 示例一 function Person(name) { this.name = ...
- 踩坑系列《十一》完美解决阿里云vod视频点播无法播放音频和视频点播控制台里的媒资库里面的视频无法播放
刚开始项目部署的时候,音频还是正常播放,后面直接报了 获取m3u8文件失败(manifestLoadError) 的错误,原因是 我的域名 xxx.com 这个域名没有解析到点播提供的CNAME上,所 ...
- 十一、Abp vNext 基础篇丨测试
前言 祝大家国庆快乐,本来想国庆之前更新完的,结果没写完,今天把剩下的代码补了一下总算ok了. 本章节也是我们后端日常开发中最重要的一步就是测试,我们经常听到的单元测试.集成测试.UI测试.系统测试, ...
- 如何通过 Serverless 技术降低微服务应用资源成本?
前言 在大型分布式 IT 架构领域,微服务是一项必不可少的技术.从本质上来讲,微服务是一种架构风格,将一个大型的系统拆分为多个拥有独立生命周期的应用,应用之间采用轻量级的通信机制进行通信.这些应用都是 ...
- perl合并文件
使用Perl合并文件 有时需要将整个目录下的小文件合并到一个文件中,以便查阅检索 特性 整个目录完全遍历,自动存入单个文件顺序遍历文件 待合并的目录 合并后的文件内容 syscfg/test1 sys ...
- 【UE4 C++】 UnrealPak 与 Pak 的制作、挂载、加载
简介 通过 UnrealPak,可以将资源打包成 Pak 文件 Pak文件是UE4游戏生成的数据包文件. Pak 之前一般先有 Cooked 步骤,将资源烘焙为对应平台支持的资源 一般打包后的项目使用 ...
- BOOST内存管理-intrusive_ptr
参考链接https://blog.csdn.net/harbinzju/article/details/6754646 intrusive_ptr 是shared_ptr的插入式版本.与shared_ ...
- Allegro如何测量距离,测距工具的使用
http://www.allegro-skill.com/thread-2480-1-1.html