启动hadoop集群

1.配置core-site.xml（每个节点上都要配置）
　　路径：
　　　　/usr/local/hadoop-2.7.3/etc/hadoop/core-site.xml
　　配置项1：
　　　　name: fs.defaultFS
　　　　value: hdfs://master的地址:端口
　　作用：
　　　　告诉所有机器master的相关信息
　　例如：
　　　　<property>
　　　　　　<name>fs.defaultFS</name>
　　　　　　<value>hdfs://192.168.0.104:9000</value>
　　　　</property>
　　配置项2：
　　　　name：　　hadoop.tmp.dir
　　　　value：　　tmp目录地址
　　作用：
　　　　hadoop默认把计算结果以及中间数据存储在/tmp，而linux会在不定期的删除/tmp目录下的文件
　　例如：
　　　　<property>
　　　　　　<name>hadoop.tmp.dir</name>
　　　　　　<value>/var/hadoop</value>
　　　　</property>

2.配置hosts文件（每个节点上都要配置）
　　路径：
　　　　/etc/hosts
　　作用：
　　　　告诉集群中每个节点彼此的名字和ip地址
　　配置项：
　　　　ip hostname
　　例如：
　　　　192.168.0.104 master
　　　　192.168.0.105 slave1
　　　　192.168.0.107 slave2
　　如果不配置在启动node的时候会报类似于：java.net.UnknownHostException: master: master: unknown error
3.在master上启动namenode
　　格式化namenode
　　　　命令：hdfs namenode -format
　　　　地址：/tmp/hadoop-root/dfs/name
　　启动namenode
　　　　命令：hadoop-daemon.sh start namenode
　　　　日志记录在：/usr/local/hadoop-2.7.3/logs/hadoop-root-namenode-master.out
　　验证：jps
4.在所有slave上启动datanode
　　命令：hadoop-daemon.sh start datanode
　　验证：jps
5.查看集群
　　在master上执行netstat -tnpl
　　tcp 0 0 192.168.0.104:9000 0.0.0.0:* LISTEN 2853/java
　　tcp 0 0 0.0.0.0:50070 0.0.0.0:* LISTEN 2853/java
　　会发现，hadoop启动后，会监听9000端口和50070端口
　　9000端口是namenode和datanode通信的端口
　　50070端口是提供的web监控界面端口（需要关闭防火墙，否则无法访问）
　　web界面地址：http://192.168.0.104:50070/dfshealth.html#tab-overview
6.关闭集群
　　hadoop-daemon.sh stop namenode
　　hadoop-daemon.sh stop datanode
7.一键式启动
　　配置/usr/local/hadoop-2.7.3/etc/hadoop/slaves
　　　　[root@master hadoop]# cat slaves
　　　　slave1
　　　　slave2
　　　　这里需要关闭slave1和slave2的防火墙，否则不成功
　　　　slave1和slave2也是通过hosts里去找的
　　　　如果没有设置ssh登录，这里需要输入密码，建议设置ssh登录
　　　　start-dfs.sh也需要登录自己，如果做ssh登录也需要给自己的authorized_keys添加自己的id_rsa.pub
　　启动脚本：
　　　　master上执行：start-dfs.sh
8.一键式停止
　　master上执行：stop-dfs.sh

启动hadoop集群的更多相关文章

[hadoop] 集群启动和内存调优
1.启动Hadoop集群 #首先查看下zoo.cfg里面配置的server.id和集群主机的id是否一致 #如果不一致会造成yarn控制不了从节点的启动 cat /home/hadoop/zookee ...
hadoop 集群 master datanode 没有启动
2018-02-07 02:47:50,377 WARN org.apache.hadoop.hdfs.server.common.Storage: java.io.IOException: Inco ...
Hadoop集群启动
1.初始化集群要启动Hadoop集群,需要启动HDFS和YARN两个集群注意:首次启动HDFS时,必须对其进行格式化操作.本质上是一些清理和准备工作, 因为此时的HDFS在物理上还是不存在的命令 ...
启动原生Hadoop集群或伪分布环境
一:启动Hadoop 集群或伪分布安装成功之后,通过执行./sbin/start-all.sh启动Hadoop环境通过jps命令查看当前启动进程是否正确~ [root@neusoft-master ...
解决hadoop 集群启动常见错误办法
hadoop 集群常见错误解决办法 hadoop 集群常见错误解决办法: (一)启动Hadoop集群时易出现的错误: 1. 错误现象:Java.NET.NoRouteToHostException ...
hadoop集群之Datenode无法启动解决办法
hadoop集群之Datenode无法启动解决办法我们在启动hadoop集群的时候,通过jps查看进程,发现namenode RM和Secondary NameNode都有,但datanode没有启 ...
docker搭建Hadoop集群
一个分布式系统基础架构,由Apache基金会所开发. 用户可以在不了解分布式底层细节的情况下,开发分布式程序.充分利用集群的威力高速运算和存储. 首先搭建Docker环境,Docker版本大于1.3. ...
大数据系列（3）——Hadoop集群完全分布式坏境搭建
前言上一篇我们讲解了Hadoop单节点的安装,并且已经通过VMware安装了一台CentOS 6.8的Linux系统,咱们本篇的目标就是要配置一个真正的完全分布式的Hadoop集群,闲言少叙,进入本 ...
大数据系列（2）——Hadoop集群坏境CentOS安装
前言前面我们主要分析了搭建Hadoop集群所需要准备的内容和一些提前规划好的项,本篇我们主要来分析如何安装CentOS操作系统,以及一些基础的设置,闲言少叙,我们进入本篇的正题. 技术准备 VMwa ...

随机推荐

集成ueditor工具
摘要: 摘要: 版权声明:本文为博主原创文章,未经博主允许不得转载. UEditor 是百度的一套开源的在线HTML编辑器. 第一步:去官网看官网文档,了解这个工具如何使用以及下载,本人下载的是1.4 ...
Android startActivities()的使用
startActivities()和startActivity类似,也是界面跳转: Intent[] intents = new Intent[2]; intents[0] = new Intent( ...
Cocos2d-x 3.x版2048游戏开发
Cocos2d-x 3.x版2048游戏开发本篇博客给大家介绍怎样高速开发2048这样一款休闲游戏,理解整个2048游戏的开发流程.从本篇博客你将能够学习到下面内容: 这里注明一下,本教程来自极客学 ...
cadence原理图和PCB互联显示成功但是不能高亮和database
问题现象:cadence原理图和PCB互联显示成功但是不能高亮我的问题解决:尝试修复数据库试试,Tools->Database check 提醒:有一个封装非法命名,在原理图中修改后再次保存 ...
NPM的天坑：解决ERR! code UNABLE_TO_VERIFY_LEAF_SIGNATURE
各种下载失败,并不是镜像源的问题,哪怕切换淘宝源也无法下载.总之就像断网一般无法下载.无关网络. 解决方案: http://stackoverflow.com/questions/20747817/e ...
[na]整一下博客面貌--cnblog css定制
前言之前觉得cnblog排版乱. 而csdn对word兼容性较好一些.所以就转到csdn了. 后来看到别人的cnblog排版挺好,如等效果. 参考资料 http://www.cnblogs.com ...
Html打印需要内容块(Js实现)
首先在head里面加入下面一段js代码: function preview(oper) { ) { bdhtml = window.document.body.innerHTML; //获取当前页的h ...
IOS开发之ZBarReaderView的使用
IOS开发之ZBarReaderView的使用 HOMEABOUTGUESTBOOKCATEGORIESTAGSLINKSSUBSCRIBE 当开发IOS程序中需要用到二维码识别功能的时候,zbar这 ...
GitBlit （1）-- 在linux 安装 GitBlit 并运行
Git是一款注重速度.数据完整性.分布式支持和非线性工作流的分布式版本控制工具.Git最初由Linus Torvalds在2005年为Linux内核开发而设计,如今已经成为被广泛接受的版本控制系统. ...
datagrid返回记录为0时显示“没有记录”
datagrid返回记录为0时显示“没有记录”,此问题的 <script>var myview = $.extend({},$.fn.datagrid.defaults.view,{ on ...

启动hadoop集群

启动hadoop集群的更多相关文章

随机推荐

热门专题