mac 配置hadoop 2.6(单机和伪分布式)

一、准备工作：

安装jdk >= 1.7： http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
- java -version
下载hadoop2.6：http://hadoop.apache.org/releases.html
设置ssh信任关系：ssh-keygen -t rsa ---> cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
- 登陆测试：ssh localhost

二、配置环境变量：

JAVA:
- vim ~/.bash_profile:
  - export JAVA_HOME="/Library/Java/JavaVirtualMachines/jdk1.8.0_77.jdk/Contents/Home" (jdk安装路径)
  - export PATH=${JAVA_HOME}/bin:$PATH　　 (有则不用加)
HADOOP:
- vim ~/.bash_profile:
  - export HADOOP_HOME=/XXX/hadoop-2.6.4　　　　(hadoop的解压缩路径)
    
    export YARN_HOME=/XXX/Code/hadoop-2.6.4
    
    export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
    
    export YARN_CONF_DIR=$YARN_HOME/etc/hadoop
  - 使之生效：source ~/.bash_profile

三、编辑hadoop配置文件：(cd $HASOOP_HOME/etc/hadoop)

hadoop-env.sh

export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_77.jdk/Contents/Home

export YARN_HOME=/XXX/Code/hadoop-2.6.4

export PATH=$PATH:/XXX/hadoop-2.6.4/bin
使之生效：source hadoop-env.sh

到此为止即可进行单机测试：
- cd $HASOOP_HOME
- mkdir in
- cp file1 in (拷点东西进去)
- hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.4.jar wordcount in out　　(out 是自动创建的，不能提前创建)
继续进行为分布式配置
core-site.xml

<property>

<name>fs.default.name</name>

<value>hdfs://localhost:9000</value>

<description>The name of the default file system. A URI whose

sceme and authority determine the FileSystem implementation.

</description>

</property>

yarn-site.xml

<property>

<name>yarn.noCHdemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

mapred-site.xml (创建一个，或者把mapred-site.xml.template 复制一份为mapred-site.xml)

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

hdfs-site.xml
- 指定主机上作为namenode和datanode的目录：
  - $HADOOP_PATH/hdfs/name
  - $HADOOP_PATH/hdfs/data
- <property>
  
  <name>dfs.replication</name>
  
  <value>1</value>
  
  </property>
  
  <property>
  
  <name>dfs.namenode.name.dir</name>
  
  <value>file:/$HADOOP_PATH/hdfs/name</value>　　(HADOOP_PATH替换为hadoop的解压缩路径)
  
  </property>
  
  <property>
  
  <name>dfs.datanode.data.dir</name>
  
  <value>file:/$HADOOP_PATH/hdfs/data</value>
  
  </property>

四、启动：

格式化hdfs：hdfs namenode -format
启动hadoop
- cd $HADOOP_PATH/sbin
- ./start-dfs.sh
- ./start-yarn.sh
- http://localhost:50070/ ---hdfs管理页面 http://localhost:8088/ ---hadoop进程管理页面
jsp 会看到有五个进程在运行
测试

hadooop fs -mkdir /user/zhangsan/in
hadooop fs -copyFromLocal ... /user/zhangsan/in (拷贝一些东西到hdfs中)
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.4.jar wordcount /user/zhansan/inp /user/zhangsan/out
hadoop fs -cat /user/zhangsan/out/*　　(看到词频统计结果)

本地测试：

　　cat in/* | ./map | sort | reduce

mac 配置hadoop 2.6(单机和伪分布式)的更多相关文章

Ubuntu上搭建Hadoop环境（单机模式+伪分布模式） (转载)
Hadoop在处理海量数据分析方面具有独天优势.今天花了在自己的Linux上搭建了伪分布模式,期间经历很多曲折,现在将经验总结如下. 首先,了解Hadoop的三种安装模式: 1. 单机模式. 单机模式 ...
Mac配置Hadoop最详细过程
Mac配置Hadoop最详细过程原文链接: http://www.cnblogs.com/blog5277/p/8565575.html 原文作者: 博客园-曲高终和寡 https://www.cn ...
java大数据最全课程学习笔记(1)--Hadoop简介和安装及伪分布式
Hadoop简介和安装及伪分布式大数据概念大数据概论大数据(Big Data): 指无法在一定时间范围内用常规软件工具进行捕捉,管理和处理的数据集合,是需要新处理模式才能具有更强的决策力,洞察发 ...
网站用户行为分析——Hadoop的安装与配置（单机和伪分布式）
Hadoop安装方式 Hadoop的安装方式有三种,分别是单机模式,伪分布式模式,伪分布式模式,分布式模式. 单机模式:Hadoop默认模式为非分布式模式(本地模式),无需进行其他配置即可运行.非分布 ...
Hadoop环境搭建－入门伪分布式配置（Mac OS,0.21.0,Eclipse 3.6）
http://www.linuxidc.com/Linux/2012-10/71900p2.htm http://andy-ghg.iteye.com/blog/1165453 为Mac的MyEcli ...
Ubuntu 14.04 (32位)上搭建Hadoop 2.5.1单机和伪分布式环境
引言一直用的Ubuntu 32位系统(准备下次用Fedora,Ubuntu越来越不适合学习了),今天准备学习一下Hadoop,结果下载Apache官网上发布的最新的封装好的2.5.1版,配置完了根本 ...
Hadoop单机和伪分布式安装
本教程为单机版+伪分布式的Hadoop,安装过程写的有些简单,只作为笔记方便自己研究Hadoop用. 环境操作系统 Centos 6.5_64bit 本机名称 hadoop001 本机IP ...
Ubuntu上搭建Hadoop环境（单机模式+伪分布模式）
首先要了解一下Hadoop的运行模式: 单机模式(standalone) 单机模式是Hadoop的默认模式.当首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,便保守地选 ...
Ubuntu上搭建Hadoop环境（单机模式+伪分布模式）【转】
[转自:]http://blog.csdn.net/hitwengqi/article/details/8008203 最近一直在自学Hadoop,今天花点时间搭建一个开发环境,并整理成文. 首先要了 ...

随机推荐

Redis 它是什么？它用来做什么？它的优势与短板如何？
阅读目的: 对什么是内存型数据库有概念性的认知.? Redis 是什么? 通常而言目前的数据库分类有几种,包括 SQL/NSQL,,关系数据库,键值数据库等等等,分类的标准也不以,Redis本质上也 ...
SDK _ 静态控件的使用
静态控件的使用静态控件主要区分两种使用方式:文本 \ 图片在使用静态控件的时候,ID始终默认为 IDC_STATIC,需要进行更改怎样通过可视化编程显示一张图片需要添加一个位图资源需要添加一 ...
03Microsoft SQL Server 数据类型
Microsoft SQL Server 数据类型数据类型 Number 类型: 数据类型描述存储 bit 允许0,1或NULL tinyint 允许从 0 到 255 的所有数字. 1 ...
org-table
‎ Table of Contents 1. table 1.1. 创建方式 1.2. 重新对齐 1.3. 行列编辑 1.4. 区域 1.5. 计算 1.6. 其他的 1.7. 行宽度 1.8. 列分 ...
POJ3616 Milking Time【dp】
Description Bessie is such a hard-working cow. In fact, she is so focused on maximizing her producti ...
Python使用Flask框架，结合Highchart，搭配数据功能模块处理csv数据
参考链接:https://www.highcharts.com.cn/docs/data-modules 1.javascript代码 var csv = document.getElementByI ...
Python使用Flask框架，结合Highchart处理xml数据
1.html代码 <!DOCTYPE html><html lang="en"><head> <meta charset=" ...
Oracle的shutdown命令
oracle的shutdown命令用来关闭当前实例,有4个可选参数:normal.transactional.immediate和abort.不带参数时默认是normal.这几个参数的差异体现在以下几 ...
chrome://plugins 无法打开的解决方法，同时解决“该网页已屏蔽插件-adobe flash player”
chrome打开想要看视频时提示该网页已屏蔽插件-adobe flash player,在网上查了半天说在chrome plugins里面打开就可以了.可是chrome://plugins 无法打开, ...
Ubuntu notes
ubuntu notes Table of Contents 1. backup data 2. Basics Ubuntu 3. Install, uninstall packages 4. Bas ...

mac 配置hadoop 2.6(单机和伪分布式)

mac 配置hadoop 2.6(单机和伪分布式)的更多相关文章

随机推荐

热门专题