Ubuntu中搭建Hadoop集群(简记)
stp1:在Vmware虚拟机上创建Ubantu.2环境
步骤:文件—>新建虚拟机—>典型(下一步)—>下一步——>位置(不建议放c盘,文件地址一定要全英文)—>下一步—>磁盘大小(20G搭建环境够用)—>自定义硬件(内存最好设置2G,不然慢得受不了)—>完成!(漫长得等待。。。)
step2:修改主机名
临时修改主机名:
步骤:打开终端(右键,CTRL+ALT+T)—>输入 hostname (返回主机名,即@符号后得)—>输入 su 获得root权限—>密码—>hostname newname(根据需要自己定)(临时修改主机名);
永久修改主机名:
方法1:步骤:打开终端(右键,CTRL+ALT+T)—>输入 su —>密码—>apt install vim(下载安装文件编辑工具,很快)—>sudo vim /etc/hosts —> 点击键盘 i (插入符)—>修改主机名—>点击ESC退出编辑,输入 :wq 保存—>重启即可;
方法2:步骤:打开终端(右键,CTRL+ALT+T)—>输入 su —>密码—>apt install vim(下载安装文件编辑工具,很快)—>sudo vim /etc/hostname —> 修改主机名—>重启即可;
详细步骤及常见错误可见:https://www.cnblogs.com/zhibei/p/9930744.html
https://www.cnblogs.com/zhibei/p/9930839.html
step3:查看ip地址:Ubuntu使用得是:ifconfig -a
步骤:打开终端(右键,CTRL+ALT+T)—>输入 su —>密码—>apt install net-tools—>输入 ifconfig -a (注意返回2段结果,IP在第一段类似于192.163.。。)
step4:下载安装ssh
这个主要是为了远程连接和免密登录
步骤:打开终端—>输入 su —>密码—>apt install openssh—>输入sshd(不报错即成功);
远程连接:
在windows端下载Putty端口连接工具
步骤:打开putty—>Hostname(填写IP),Port(默认22)—>Connection type:(SSH)—>Saved Sessions(任然填入IP)—>点击 Save—>选择保存得IP,点击Load—>open(得到连接控制台)—>login as:(输入用户名)—>密码验证—>接下来就可以进行自己想要得操作啦!
免密登录:(未完。。。)
这一步很重要(只要在hadoop部署之前完成就可以啦)
这里得权限问题我还没搞清楚,不太清楚什么时候要在用户,什么时候要在root下:
步骤:输入:ssh-keygen -t rsa -P (获得公私匙对,一直回车即可)
—>输入:cat /root/.ssh/id_rsa.pub >> /root/.ssh/authorized_keys(将密匙写入ssh中)
—>输入:/etc/init.d/ssh reload;
step5:安装JDK
步骤:打开终端—>输入 su —>密码—>输入javac,回车—>根据提示选择想要得版本号直接安装(遇到询问写y)—>输入javac,返回相关信息表示安装成功—>vim /etc/profile (配置环境变量 ,如下)保存,退出编辑—>输入:source /etc/profile使配置生效(这样可以在任何目录下找到java)。
配置java环境变量:export JAVA_HOME= /usr/lib/jvm/java-8-openjdk-amd64(这个地址要根据你的安装路径进行更改)
export JRE_HOME= $JAVA_HOME/jre
export CLASSPATH=$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH
export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH
step6:安装Hadoop
尝试了直接使用连接安装,结果都失败,在这里建议大家按如下步骤,少走弯路
下载hadoop安装包:https://archive.apache.org/dist/hadoop/common/hadoop-3.1.0/(有各种版本可以自己选)
下载完成后,将安装包移动到 /home 路径下
在终端输入:tar -xvf hadoop-2.9.1.tar.gz 解压
文件配置:
cd /etc/hadoop
vim hadoop-env.sh 配置 export JAVA_HOME= /usr/lib/jvm/java-8-openjdk-amd64 保存并退出。
vim core-site.xml ,请自行建立/tmp/name,/tmp/data子文件,当然你可以自行指定存放目录
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property> <property>
<name>dfs.name.dir</name>
<value>/home/apache/hadoop-2.9.1/tmp/name</value>
</property> <property>
<name>hadoop.tmp.dir</name>
<value>/home/apache/hadoop-2.9.1/tmp/data</value>
</property>
接着,vim hafs_site.xml,请建立data文件夹
<property>
<name>dfs.data.dir</name>
<value>/home/apache/hadoop-2.9.1/data</value>
</property>
然后vim yarn-site.xml,
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
最后:cp mapred-site.xml.plate mapred-site.xml,
vim mapred-site.xml,
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
配置Hadoop得环境变量
vim /etc/profile
#hadoop
HADOOP_HOME=/home/apache/hadoop-2.9.1
PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:
export HADOOP_HOME PATH
配置生效
source /etc/profile
查看hadoop版本输入hadoop version;
节点初始化:
hadoop namenode -format
启动hadoop
cd /hadoop-2.9.1/sbin/
./start-dfs.sh
./start-yarn.sh
./mr-jobhistory-daemon.sh start historyserver
查看服务启动情况输入jps命令出现下面内容启动成功
2499 NameNode
3460 NodeManager
2694 DataNode
2934 SecondaryNameNode
3705 Jps
3626 JobHistoryServer
3103 ResourceManager
可以浏览器输入http://localhost:50070 查看hadoop详情。
Ubuntu中搭建Hadoop集群(简记)的更多相关文章
- ubuntu中安装hadoop集群
hadoop是由java 语言编写的主从结构分布式计算存储架构 准备工作: 操作系统: Ubuntu16.04 软件安装包:jdk-8u171-linux-x64.tar.gz : hadoop-2. ...
- 实验室中搭建Spark集群和PyCUDA开发环境
1.安装CUDA 1.1安装前工作 1.1.1选取实验器材 实验中的每台计算机均装有双系统.选择其中一台计算机作为master节点,配置有GeForce GTX 650显卡,拥有384个CUDA核心. ...
- Linux下搭建Hadoop集群
本文地址: 1.前言 本文描述的是如何使用3台Hadoop节点搭建一个集群.本文中,使用的是三个Ubuntu虚拟机,并没有使用三台物理机.在使用物理机搭建Hadoop集群的时候,也可以参考本文.首先这 ...
- 虚拟机搭建Hadoop集群
安装包准备 操作系统:ubuntu-16.04.3-desktop-amd64.iso 软件包:VirtualBox 安装包:hadoop-3.0.0.tar.gz,jdk-8u161-linux-x ...
- 在搭建Hadoop集群环境时遇到的一些问题
最近在学习搭建hadoop集群环境,在搭建的过程中遇到很多问题,在这里做一些记录.1. SSH相关的问题 问题一: ssh: connect to host localhost port 22: Co ...
- 使用Windows Azure的VM安装和配置CDH搭建Hadoop集群
本文主要内容是使用Windows Azure的VIRTUAL MACHINES和NETWORKS服务安装CDH (Cloudera Distribution Including Apache Hado ...
- virtualbox 虚拟3台虚拟机搭建hadoop集群
用了这么久的hadoop,只会使用streaming接口跑任务,各种调优还不熟练,自定义inputformat , outputformat, partitioner 还不会写,于是干脆从头开始,自己 ...
- 搭建Hadoop集群 (三)
通过 搭建Hadoop集群 (二), 我们已经可以顺利运行自带的wordcount程序. 下面学习如何创建自己的Java应用, 放到Hadoop集群上运行, 并且可以通过debug来调试. 有多少种D ...
- 搭建Hadoop集群 (一)
上面讲了如何搭建Hadoop的Standalone和Pseudo-Distributed Mode(搭建单节点Hadoop应用环境), 现在我们来搭建一个Fully-Distributed Mode的 ...
随机推荐
- RF脚本中的坑2: pip下载python库时报certificate verify failed
用pip命令下载第三方library时,报错certificate verify failed,截图如下: 在网上找了各种教程,包括修改了pip下载源地址也无效果,最后祭出了杀手锏——FQ,FQ成功后 ...
- 浏览器下出现net::ERR_BLOCKED_BY_CLIENT的解决办法
转发网址:https://www.cnblogs.com/wenzheshen/p/7724065.html 当我们在做开发时,调试页面图片会出现部分图片无法正常显示,并且确认图片的地址正确: 按F1 ...
- Codeforces 385C 线性筛素数
题意:给定一个数组,求[l,r] 区间,区间里的素数,数组中,能被这个素数整除的个数,再求和. 分析:区间很大,10^9了,找去区间内的素数是不可能的,但是,数组的数很小,而且要能整除区间内的素数,所 ...
- euclidean loss
个人感觉相当于L2范式开平方,也相当于针对两个向量的欧氏距离开平方 说的更直白点就是两个向量对应位置相减得到每个位置的差,然后把每个位置的差开平方再相加 前向传播cpp代码: template < ...
- miniMobile(手机)
官网:http://www.web2014.cn/
- springmvc时间(date)无法转入后台(@DateTimeFormat+@JsonFormat(GMT+8))
spring时间(date)无法转入后台 Type Status Report Description The server cannot or will not process the reques ...
- 打开eclipse出现an error has occurred.see the loh file
解决方案: 1,打开eclipse安装目录下的eclipse.ini文件:2,打开的文本文件最后添加一行--add-modules=ALL-SYSTEM3,保存重新打开Eclipse. 测试过已经ok
- Block代替delegate,尽量使用block,对于有大量的delegate方法才考虑使用protocol实现.
Block代替delegate,尽量使用block,对于有大量的delegate方法才考虑使用protocol实现. 1.Block语法总结及示例如下: //1.普通代码块方式bloc ...
- 揭开redux,react-redux的神秘面纱
16年开始使用react-redux,迄今也已两年多.这时候再来阅读和读懂redux/react-redux源码,虽已没有当初的新鲜感,但依然觉得略有收获.把要点简单写下来,一方面供感兴趣的读者参考, ...
- leetcode笔记(八)263. Ugly Number
题目描述 Write a program to check whether a given number is an ugly number. Ugly numbers are positive nu ...