mac 配置hadoop 2.6(单机和伪分布式)

一、准备工作：

安装jdk >= 1.7： http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
- java -version
下载hadoop2.6：http://hadoop.apache.org/releases.html
设置ssh信任关系：ssh-keygen -t rsa ---> cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
- 登陆测试：ssh localhost

二、配置环境变量：

JAVA:
- vim ~/.bash_profile:
  - export JAVA_HOME="/Library/Java/JavaVirtualMachines/jdk1.8.0_77.jdk/Contents/Home" (jdk安装路径)
  - export PATH=${JAVA_HOME}/bin:$PATH　　 (有则不用加)
HADOOP:
- vim ~/.bash_profile:
  - export HADOOP_HOME=/XXX/hadoop-2.6.4　　　　(hadoop的解压缩路径)
    
    export YARN_HOME=/XXX/Code/hadoop-2.6.4
    
    export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
    
    export YARN_CONF_DIR=$YARN_HOME/etc/hadoop
  - 使之生效：source ~/.bash_profile

三、编辑hadoop配置文件：(cd $HASOOP_HOME/etc/hadoop)

hadoop-env.sh

export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_77.jdk/Contents/Home

export YARN_HOME=/XXX/Code/hadoop-2.6.4

export PATH=$PATH:/XXX/hadoop-2.6.4/bin
使之生效：source hadoop-env.sh

到此为止即可进行单机测试：
- cd $HASOOP_HOME
- mkdir in
- cp file1 in (拷点东西进去)
- hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.4.jar wordcount in out　　(out 是自动创建的，不能提前创建)
继续进行为分布式配置
core-site.xml

<property>

<name>fs.default.name</name>

<value>hdfs://localhost:9000</value>

<description>The name of the default file system. A URI whose

sceme and authority determine the FileSystem implementation.

</description>

</property>

yarn-site.xml

<property>

<name>yarn.noCHdemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

mapred-site.xml (创建一个，或者把mapred-site.xml.template 复制一份为mapred-site.xml)

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

hdfs-site.xml
- 指定主机上作为namenode和datanode的目录：
  - $HADOOP_PATH/hdfs/name
  - $HADOOP_PATH/hdfs/data
- <property>
  
  <name>dfs.replication</name>
  
  <value>1</value>
  
  </property>
  
  <property>
  
  <name>dfs.namenode.name.dir</name>
  
  <value>file:/$HADOOP_PATH/hdfs/name</value>　　(HADOOP_PATH替换为hadoop的解压缩路径)
  
  </property>
  
  <property>
  
  <name>dfs.datanode.data.dir</name>
  
  <value>file:/$HADOOP_PATH/hdfs/data</value>
  
  </property>

四、启动：

格式化hdfs：hdfs namenode -format
启动hadoop
- cd $HADOOP_PATH/sbin
- ./start-dfs.sh
- ./start-yarn.sh
- http://localhost:50070/ ---hdfs管理页面 http://localhost:8088/ ---hadoop进程管理页面
jsp 会看到有五个进程在运行
测试

hadooop fs -mkdir /user/zhangsan/in
hadooop fs -copyFromLocal ... /user/zhangsan/in (拷贝一些东西到hdfs中)
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.4.jar wordcount /user/zhansan/inp /user/zhangsan/out
hadoop fs -cat /user/zhangsan/out/*　　(看到词频统计结果)

本地测试：

　　cat in/* | ./map | sort | reduce

mac 配置hadoop 2.6(单机和伪分布式)的更多相关文章

Ubuntu上搭建Hadoop环境（单机模式+伪分布模式） (转载)
Hadoop在处理海量数据分析方面具有独天优势.今天花了在自己的Linux上搭建了伪分布模式,期间经历很多曲折,现在将经验总结如下. 首先,了解Hadoop的三种安装模式: 1. 单机模式. 单机模式 ...
Mac配置Hadoop最详细过程
Mac配置Hadoop最详细过程原文链接: http://www.cnblogs.com/blog5277/p/8565575.html 原文作者: 博客园-曲高终和寡 https://www.cn ...
java大数据最全课程学习笔记(1)--Hadoop简介和安装及伪分布式
Hadoop简介和安装及伪分布式大数据概念大数据概论大数据(Big Data): 指无法在一定时间范围内用常规软件工具进行捕捉,管理和处理的数据集合,是需要新处理模式才能具有更强的决策力,洞察发 ...
网站用户行为分析——Hadoop的安装与配置（单机和伪分布式）
Hadoop安装方式 Hadoop的安装方式有三种,分别是单机模式,伪分布式模式,伪分布式模式,分布式模式. 单机模式:Hadoop默认模式为非分布式模式(本地模式),无需进行其他配置即可运行.非分布 ...
Hadoop环境搭建－入门伪分布式配置（Mac OS,0.21.0,Eclipse 3.6）
http://www.linuxidc.com/Linux/2012-10/71900p2.htm http://andy-ghg.iteye.com/blog/1165453 为Mac的MyEcli ...
Ubuntu 14.04 (32位)上搭建Hadoop 2.5.1单机和伪分布式环境
引言一直用的Ubuntu 32位系统(准备下次用Fedora,Ubuntu越来越不适合学习了),今天准备学习一下Hadoop,结果下载Apache官网上发布的最新的封装好的2.5.1版,配置完了根本 ...
Hadoop单机和伪分布式安装
本教程为单机版+伪分布式的Hadoop,安装过程写的有些简单,只作为笔记方便自己研究Hadoop用. 环境操作系统 Centos 6.5_64bit 本机名称 hadoop001 本机IP ...
Ubuntu上搭建Hadoop环境（单机模式+伪分布模式）
首先要了解一下Hadoop的运行模式: 单机模式(standalone) 单机模式是Hadoop的默认模式.当首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,便保守地选 ...
Ubuntu上搭建Hadoop环境（单机模式+伪分布模式）【转】
[转自:]http://blog.csdn.net/hitwengqi/article/details/8008203 最近一直在自学Hadoop,今天花点时间搭建一个开发环境,并整理成文. 首先要了 ...

随机推荐

从Element.getElementsByTagName方法说起
一.getElementsByTagName方法: 我们先看几个解释:1)W3C:getElementsByTagName() 方法可返回带有指定标签名的对象的集合.没有说明返回值的具体类型.2)菜鸟 ...
Vue.js 是什么
Vue.js 是什么 Vue.js(读音 /vjuː/, 类似于 view) 是一套构建用户界面的渐进式框架.Vue 采用自底向上增量开发的设计. Vue 的核心库只关注视图层. 单页应用:Vue ...
CAD控件：梦想CAD控件功能更新清除图上的所有高亮实体
1,修正得组里面的实体,把删除实体也返回的错误 2,修正代理实体改不了颜色问题. 3,修正捕捉块插入点,有时会跑到很远的位置问题. 4.MxDrawChange类增加ToBlockRefe ...
Redis系列(七)--Sentinel哨兵模式
在上一篇文章了解了主从复制,主从复制本身的容错性很差,一旦master挂掉,只能进行手动故障转移,很难完美的解决这个问题而本文讲解的sentinel可以解决这个问题 Redis sentinel示意 ...
Apache添加到windows服务和移除Apache的windows服务
Apache添加到windows服务和移除Apache的windows服务 Apache免安装版将其添加到Windows服务中: 打开cmd控制台,在上面输入"你的Apache安装目录\bi ...
[转载] Linux Futex的设计与实现
Linux Futex的设计与实现引子在编译2.6内核的时候,你会在编译选项中看到[*] Enable futex support这一项,上网查,有的资料会告诉你"不选这个内核不一定能正 ...
Python使用Flask框架，结合Highchart处理jsonl数据
1.html代码 <!DOCTYPE html> <html lang="en"> <head> <meta charset=" ...
docke容器使用
Docker 容器使用 Docker 客户端 docker 客户端非常简单 ,我们可以直接输入 docker 命令来查看到 Docker 客户端的所有命令选项. runoob@runoob:~# do ...
Just a Hook (HDU 1698) 懒惰标记
Just a Hook (HDU 1698) 题链每一次都将一个区间整体进行修改,需要用到懒惰标记,懒惰标记的核心在于在查询前才更新,比如将当前点rt标记为col[rt],那么此点的左孩子和右孩子标 ...
Ajax_数据格式_HTML
[数据格式提要] 1.在服务器端Ajax是一门与语言无关的技术.在业务逻辑层使用何种服务器端语言都可以. 2.从服务器端接收数据的时候,那些数据必须以浏览器能够理解的格式来发送.服务器端的编程语言只能 ...

mac 配置hadoop 2.6(单机和伪分布式)

mac 配置hadoop 2.6(单机和伪分布式)的更多相关文章

随机推荐

热门专题