一.准备教程

  1.jdk:版本在1.7.x以上就可以(因为hadoop2.x以上只支持1.7.x以上的jdk,我的是1.8的)

  2.Hadoop:2.7.3

二.ssh的配置以及验证

  配置ssh:

  1.确认mac的远程登录是否开启

    系统偏好设置->共享->勾选远程登录.

  当远程登录状态为打开且为绿灯时,成功开启,ok,进行下一步.

  2.打开你的terminal,在终端执行如下命令:   

ssh-keyagent -t

  然后一直回车。当执行完这条指令之后你可以在前往到~/.ssh目录下发现如下两个文件

  当出现这两个文件之后,再在终端执行如下代码(该代码用于ssh免登录设置):

cat ~/.ssh/id_rsa.pub > ~/.ssh/authorized_keys

  ok,ssh免登录配置完成。

  验证ssh

  配置完ssh之后现在来验证ssh是否配置成功

  在终端输入如下命令:

ssh localhost

  如果出现如下信息,则免密码登录ssh配置成功。

  

三.安装jdk

  安装jdk,在这里就不用多啰嗦了.提醒一下的是,务必要安装1.7以上的jdk。

  JDK1.8下载地址: http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

四.安装Hadoop

  当jdk安装完毕以及ssh配置都成功之后我们现在可以来着手进行Hadoop的安装了。

  Hadoop下载地址: https://archive.apache.org/dist/hadoop/common/hadoop-2.7.3/

  下载如下图片标记的文件即可:

  

  将该文件解压到你喜欢的地方。如果怕找不到解压后的文件的路径,那么就将该文件标记一下颜色,下次输入该文件的所在路径的话,直接选择你标记的颜色,找到该文件,然后拖到终端就能显示该文件的绝对路径了。ok,Hadoop安装完成.

五.修改Hadoop的配置文件

  所需要修改的配置文件都在hadoop-2.7.3/etc/hadoop目录下。

  hadoop-env.sh 

  加入以下代码: 

export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_111.jdk/Contents/Home

  core-site.xml

  该配置文件用于指明namenode的主机名和端口,hadoop临时目录

<configuration>

    <!-- 指定HDFS老大(namenode)的通信地址 -->
<property>
<name>fs.defaultFS</name>
<value>hdfs://0.0.0.0:9000</value>
</property>
<!-- 指定hadoop运行时产生文件的存储路径 -->
<property>
<name>hadoop.tmp.dir</name>
<value>/Library/hadoop-2.7.3/temp</value>
</property> </configuration>

  hadfs-site.xml

  默认副本数3,修改为1,dfs.namenode.name.dir指明fsimage存放目录,多个目录用逗号隔开。dfs.datanode.data.dir指定块文件存放目录,多个目录逗号隔开

<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
   <property>
<name>dfs.namenode.name.dir</name>
<value>file:/Library/hadoop-2.7.3/tmp/hdfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/Library/hadoop-2.7.3/tmp/hdfs/data</value>
</property>
<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>
<property>
<name>dfs.http.address</name>
<value>0.0.0.0:50070</value>
</property>
</configuration>

  mapred-site.xml

<configuration>

    <property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property> </configuration>

  yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value> </configuration>

六.配置Hadoop环境变量

  当你完成第五步之后那么你离hadoop的使用就不远啦。加下来我们要做的就是配置hadoop环境变量。

  打开你的终端,执行以下命令。(如果有对sudo,vim命令不熟悉的同志们,建议你们先熟悉一下这些命令,了解一下如何编辑如何退出,如何使文件生效就可以了)

  

//在etc目录下创建profile并进入编辑模式
sudo vim /etc/profile
//=后面接的是你的hadoo目录所在的路径,不知道路径的同学可以直接将文件拖到终端就可以显示该目录的绝对路径了
export HADOOP_HOME=/Users/eleme/Documents/ProgramFiles/apache-software-foundation/hadoop-2.7.3/hadoop
//然后退出编辑模式,这个操作自己去了解一下
//执行刚才写的profile,使profile生效
source /etc/profile

七.运行Hadoop    

  打开终端,跟着以下命令一步一步走就可以了。

//进入hadoop安装目录
cd $HADOOP_HOME
//初始化namenode
hdfs namenode -format
//启动hdfs
sbin/start-dfs.sh
//启动yarn
sbin/start-yarn.sh

  当启动完hdfs以及yarn可以打开浏览器,输入以下地址看是否能进入对应的页面

  启动完hdfs访问: http://localhost:50070

  对应的页面:

  

  启动完yarn访问: http://localhost:8088

  对应的页面:

  

  如果你能进入这两个页面,ok,那么你的hadoop以安装成功!

八.运行Hadoop实例

  同第七个步骤一样,打开终端跟着以下命令一步一步执行。

  

//1.进入你的hadoop安装目录
cd $HADOOP_HOME
//2.在hdfs上创建你的用户目录,其中中间那个需要你自己填啊别直接粘贴运行啊
hdfs dfs -mkdir -p /user/(你本机用户名)/input
//3.这个时候你可以执行以下命令来查看目录是否在hdfs上创建成功
hadoop fs -ls /user/(你本机用户名)/input

  如果成功的话,那么就会有如下图的显示:

  

  

//4.然后将需要统计的文件上传到hdfs上,其中($HADOOP_HOME/etc/hadoop/*.xml)是要上传的文件的路径 后面有个空格 然后接你要上传的目录路径(也就是你刚刚所创建的目录)
hdfs dfs -put $HADOOP_HOME/etc/hadoop/*.xml /user/(你本机用户名)/input
//同样也可以用第3步的命令来查看文件是否上传成功
//5.运行测试jar
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar grep input output ‘dfs[a-z.]+’
//6.然后查看运行之后的产生的output文件夹下的信息
hdfs dfs -cat output/part-r-00000

  最后在终端显示的output文件夹下的信息的结果如下图:

  

  如果跟上图一致,那么,恭喜你,你迈出了hadoop的一小步,继续加油!

  

  

手把手教你安装mac版hadoop2.7.3教程的更多相关文章

  1. 手把手教你安装Eclipse最新版本的详细教程 - 大佬的鸡肋,菜鸟的盛宴(非常详细,非常实用)

    简介 首先声明此篇文章主要是针对测试菜鸟或者刚刚入门的小伙们或者童鞋们,大佬就没有必要往下看了. 写这篇文章的由来是因为后边要用这个工具,但是由于某些原因有部分小伙伴和童鞋们可能不会安装此工具,为了方 ...

  2. 手把手教你修改iOS版QQ的运动步数

    手把手教你修改iOS版QQ的运动步数 现在很多软件都加上了运动模块,比如QQ和微信,而且还有排行榜,可以和好友比较谁的运动步数多,任何东西只要添加了比较功能,就变得不一样了.今天教大家用代码去修改QQ ...

  3. **手把手教你安装 Anaconda + Tensor flow+Pycharm**

    手把手教你安装 Anaconda + Tensor flow+Pycharm 这篇博文主要讲一下自己安装Anaconda + Tensor flow + Pycharm 的一个过程. 1. ANACO ...

  4. 【转】手把手教你读取Android版微信和手Q的聊天记录(仅作技术研究学习)

    1.引言 特别说明:本文内容仅用于即时通讯技术研究和学习之用,请勿用于非法用途.如本文内容有不妥之处,请联系JackJiang进行处理!   我司有关部门为了获取黑产群的动态,有同事潜伏在大量的黑产群 ...

  5. 周一干货~手把手教你安装 Visual Studio 安卓模拟器

    干货~手把手教你安装 Visual Studio 安卓模拟器 转 http://mini.eastday.com/mobile/171107134734194.html# 今天软妹为大家带来一篇来自M ...

  6. 手把手教你读取Android版微信和手Q的聊天记录(仅作技术研究学习)

    1.引言 特别说明:本文内容仅用于即时通讯技术研究和学习之用,请勿用于非法用途.如本文内容有不妥之处,请联系JackJiang进行处理!   我司有关部门为了获取黑产群的动态,有同事潜伏在大量的黑产群 ...

  7. 数据分析师入门|Python安装MAC版

    最近在学数据分析师入门课,看了大纲,感觉终于不再慌乱踩坑了,开始存档最粗暴版学习笔记,遇到停止的地方按照下文红字直接输入就OK,方便和我一样的小伙伴参考呀,老师讲的很适合我这种初学者,PUSH了很多资 ...

  8. 手把手教你安装 FastAdmin 到虚拟主机 (phpStudy)

    手把手教你安装 FastAdmin 到虚拟主机 (phpStudy)原文: https://forum.fastadmin.net/thread/2524 下载 FastAdmin下载 FastAdm ...

  9. 手把手教你搭建Pytest+Allure2.X环境详细教程,生成让你一见钟情的测试报告(非常详细,非常实用)

    简介 宏哥之前在做接口自动化的时候,用的测试报告是HTMLTestRunner,虽说自定义模板后能满足基本诉求,但是仍显得不够档次,高端,大气,遂想用其他优秀的report框架替换之.一次偶然的机会, ...

随机推荐

  1. 【转】Eclipse 乱码 解决方案总结(UTF8 -- GBK)

    转载自: http://www.cnblogs.com/bluestorm/archive/2012/09/20/2695567.html UTF8 --> GBK;   GBK --> ...

  2. 【规范】前端编码规范——jquery 规范

    使用单引号 不推荐 $("div").html("<img src='1.jpg'>"); 推荐 $('div').html('<img sr ...

  3. Java源码阅读的真实体会(一种学习思路)

    Java源码阅读的真实体会(一种学习思路) 刚才在论坛不经意间,看到有关源码阅读的帖子.回想自己前几年,阅读源码那种兴奋和成就感(1),不禁又有一种激动. 源码阅读,我觉得最核心有三点:技术基础+强烈 ...

  4. 解决mybatis generator无法覆盖XML

    今天发现mybatis generator maven plugin在重复生成的时候xml文件只会merge,不会覆盖. 明明在pom.xml中配置了如下: <configuration> ...

  5. 更改Nginx网站根目录以及导致的403 forbidden问题解决

    版权声明:本文为博主原创文章,未经博主允许不得转载. 一.更改根目录 Nginx默认网站根目录为/usr/local/nginx/html,要将它改成/home/fuxiao/www   更改方法: ...

  6. VS F5不编译 F5总是重新编译

    遇到奇怪的现象,F5不编译了 右键解决方案-配置管理器-确保项目的生成被勾选 另外一个情况,即使不修改任何代码,每次点击“生成”或者F5,都会重新编译(Debug模式没问题,Release有这个问题, ...

  7. [原]Jenkins(十七) jenkins再出发之配置SVN

    创建一个demo project 配置SVN: 配置build project

  8. 通俗讲解:PoW共识机制与以太坊的关系、Ghost协议 及 PoS共识机制的变种---Casper

    作者:林冠宏 / 指尖下的幽灵 掘金:https://juejin.im/user/587f0dfe128fe100570ce2d8 博客:http://www.cnblogs.com/linguan ...

  9. lis最长上升子序列

    因为是最长上升的,可以用一个数组储存上升的序列,如果后一个数字比数组的最大数字还大,就加到末尾去,如果不大于,那么就可以把这个数组中比他大的数字替换掉,因为如果数字更小,后面上升序列更长的可能性更大, ...

  10. JBPM工作流(七)——详解流程图

    概念: 流程图的组成: a. 活动 Activity / 节点 Node b. 流转 Transition / 连线(单向箭头) c. 事件 1.流转(Transition) a) 一般情况一个活动中 ...