在MacOs上配置hadoop和spark环境

Setting up Hadoop with Spark on MacOs

Instructions

准备环境
如果没有brew，先google怎样安装brew
先uninstall老版本的Hadoop

brew cleanup hadoop

然后更新homebrew formulae

brew update
brew upgrade
brew cleanup

检查版本信息

brew info hadoop
brew info apache-spark
brew info sbt
brew info scala

如果以上程序没有安装，需要使用brew install app 进行安装。
安装环境
安装hadoop

brew install hadoop

安装spark

brew install apache-spark scala sbt

设置环境变量
使用vim编辑~/.bash_profile，将以下内容贴到最后

 # set environment variables

 export JAVA_HOME=$(/usr/libexec/java_home)

 export HADOOP_HOME=/usr/local/Cellar/hadoop/2.5.1

 export HADOOP_CONF_DIR=$HADOOP_HOME/libexec/etc/hadoop

 export SCALA_HOME=/usr/local/Cellar/apache-spark/1.1.0   

 # set path variables

 export PATH=$PATH:$HADOOP_HOME/bin:$SCALA_HOME/bin     

 # set alias start & stop scripts

 alias hstart=$HADOOP_HOME/sbin/start-dfs.sh;$HADOOP_HOME/sbin/start-yarn.sh

 alias hstop=$HADOOP_HOME/sbin/stop-dfs.sh;$HADOOP_HOME/sbin/stop-yarn.sh

Hadoop必须要使ssh生效，设置ssh

配置文件路径：

/etc/sshd_config

生成秘钥：

sh-3.2# sudo ssh-keygen -t rsa

  Generating public/private rsa key pair.

  Enter file in which to save the key (/var/root/.ssh/id_rsa):  输入/var/root/.ssh/id_rsa

  Enter passphrase (empty for no passphrase): ［直接回车］

  Enter same passphrase again: ［直接回车］

  Your identification has been saved in /var/root/.ssh/id_rsa.

  Your public key has been saved in /var/root/.ssh/id_rsa.pub.

  key fingerprint is:

  97:e9:5a:5e:91:52:30:63:9e:34:1a:6f:24:64:75:af root@cuican.local

  The key's randomart image is:

  +--[ RSA 2048]----+

  |       .=.X .    |

  |       . X B .   |

  |        . = . .  |

  |         . + o   |

  |        S = E    |

  |         o . .   |

  |          o .    |

  |         + .     |

  |        . .      |

  +-----------------+

修改配置文

sudo vim /etc/ssh/sshd_config

  Port 22

  #AddressFamily any

  #ListenAddress 0.0.0.0

  #ListenAddress ::

  # The default requires explicit activation of protocol 1

  Protocol 2

  # HostKey for protocol version 1

  #HostKey /etc/ssh/ssh_host_key

  # HostKeys for protocol version 2

  #HostKey /etc/ssh/ssh_host_rsa_key

  #HostKey /etc/ssh/ssh_host_dsa_key

  #HostKey /etc/ssh/ssh_host_ecdsa_key

  HostKey /var/root/.ssh/id_rsa

  # Lifetime and size of ephemeral version 1 server key

  KeyRegenerationInterval 1h

  ServerKeyBits 1024

  # Logging

  # obsoletes QuietMode and FascistLogging

  SyslogFacility AUTHPRIV

  #LogLevel INFO

  # Authentication:

  LoginGraceTime 2m

  PermitRootLogin yes

  StrictModes yes

  #MaxAuthTries 6

  #MaxSessions 10

  RSAAuthentication yes

  PubkeyAuthentication yes

启动ssh服务

which sshd //查找sshd的位置。

Mac 上sshd的位置在 /usr/sbin/sshd

在终端输入sudo /usr/sbin/sshd即可启动sshd服务。

ssh-keygen -t rsa
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

配置Hadoop
到hadoop的安装路径

cd usr/local/Cellar/hadoop/2.5.1/libexec/

编辑etc/hadoop/hadoop-env.sh

 # this fixes the "scdynamicstore" warning

 export HADOOP_OPTS="$HADOOP_OPTS -Djava.security.krb5.realm= -Djava.security.krb5.kdc="

编辑etc/hadoop/core-site.xml

 <configuration>

     <property>

         <name>fs.defaultFS</name>

         <value>hdfs://localhost:9000</value>

     </property>

 </configuration>

编辑etc/hadoop/hdfs-site.xml

 <configuration>

     <property>

         <name>dfs.replication</name>

         <value>1</value>

     </property>

 </configuration>

编辑etc/hadoop/mapred-site.xml

 <configuration>

     <property>

         <name>mapreduce.framework.name</name>

         <value>yarn</value>

     </property>

 </configuration>

编辑etc/hadoop/yarn-site.xml

 <configuration>

     <property>

         <name>yarn.nodemanager.aux-services</name>

         <value>mapreduce_shuffle</value>

     </property>

 </configuration>

开始启用Hadoop
移动到Hadoop的root directory

cd /usr/local/Cellar/hadoop/2.5.1

格式化Hadoop HDFS

./bin/hdfs namenode -format

启动NameNode和DataNode daemon

./sbin/start-dfs.sh

从网页中查看

http://localhost:50070/

启动ResourceManager和NodeManager daemon

./sbin/start-yarn.sh

检查所有的守护线程是不是已经在运行

jps

从网页中查看ResourceManager

http://localhost:8088/

创建HDFS目录

./bin/hdfs dfs -mkdir -p /user/{username}

启动一个MapReduce的例子
```
 \#calculate pi

 ./bin/hadoop jar libexec/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.1.jar pi 10 100
```

启动spark

到Spark的安装目录

cd /usr/local/Cellar/apache-spark/1.1.0

启动Spark的例子

./bin/run-example SparkPi

在网页中查看Spark任务

http://localhost:4040/

也可以使用Spark-submit来提交任务

 # pattern to launch an application in yarn-cluster mode

 ./bin/spark-submit --class <path.to.class> --master yarn-cluster [options] <app.jar> [options]

 # run example application (calculate pi)

 ./bin/spark-submit --class org.apache.spark.examples.SparkPi --master yarn-cluster libexec/lib/spark-examples-*.jar

结束

在MacOs上配置Hadoop和Spark环境的更多相关文章

macOS 上配置 Lua
[最新版]从零开始在 macOS 上配置 Lua 开发环境脚本语言,你可能更需要的是 Lua 不同的脚本语言有不同的特性,第一接触的脚本语言,可能会影响自己对整个脚本语言的理解和认知.我以前接触 ...
在VS2017(VC15)上配置opencv4.0.1环境
在VS2017(VC15)上配置opencv4.0.1环境转 https://blog.csdn.net/GoldenBullet/article/details/86016921 作为萌新最初 ...
Delphi for iOS开发指南(1):在Mac上配置你的开发环境
http://cache.baiducontent.com/c?m=9d78d513d99516f11ab7cf690d678c3b584380122ba7a0020fd18438e4732b4050 ...
从零开始在ubuntu上配置深度学习开发环境
从零开始在ubuntu上配置深度学习开发环境昨天一不小心把原来配置好的台式机的开发环境破坏了,调了半天没有调回来,索性就重装一次ubuntu系统.这篇文章主要记录一个简单的.‘傻瓜式’教程. 一.U ...
手工命令行搭建 hadoop 和 spark 环境
环境准备:3台CentOS7,64位,Hadoop2.7需要64位Linux 192.168.20.161 192.168.20.162 192.168.20.163 三台机器分别叫host01. ...
centos 7 配置hadoop与spark
cd /home mkdir shixi_enzhaocd shixi_enzhaomkdir suaneccd suanecmkdir installsmkdir libsmkdir scripts ...
Linux下配置Hadoop伪分布式环境
1. 准备Linux环境提示:我用的系统是CentOS 6.4. 1.0点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host- ...
Linux下配置Hadoop全分布式环境
1. 前提部署全分布式环境,我们肯定不能在一台服务器上了,这里我用了7台服务器,在VMware上开了7个虚拟机,如下图所示: 我基本配置了一晚上才搞定,第一次配置一般都有错,这时候不妨去到hadoo ...
（转）单机上配置hadoop
哈哈,几天连续收到百度两次电话,均是利好消息,于是乎不知不觉的自己的工作效率也提高了,几天折腾了好久终于在单机上配置好了hadoop,然后也成功的运行了一个用例,耶耶耶耶耶耶. 转自:http://w ...

随机推荐

【USACO 2.3.2】奶牛家谱
[题目描述] 农民约翰准备购买一群新奶牛.在这个新的奶牛群中,每一个母亲奶牛都生两小奶牛.这些奶牛间的关系可以用二叉树来表示.这些二叉树总共有N个节点(3 <= N < 200).这些二叉 ...
逆向iOS SDK -- _UIImageAtPath 的实现（SDK 5.1）
注释过的反汇编代码:http://pan.baidu.com/share/link?shareid=3491166579&uk=537224442 伪代码(不精确,仅供参考): NSStrin ...
10分钟教你学会Linux/Unix下的vi文本编辑器
10分钟教你学会Linux/Unix下的vi文本编辑器 vi编辑器是Unix/Linux系统管理员必须学会使用的编辑器.看了不少关于vi的资料,终于得到这个总结.不敢独享,和你们共享. 首先,记住v ...
git branch分支管理用法总结
查看分支(远程和本地) 1 查看本地分支: $ git branch 2 查看远程分支: $ git branch -r 3.查看本地和远程分支 $ git branch -a 创建分支 1.创建本地 ...
python百科
Python 编辑词条添加义项名 B 添加义项 ? Python(英语发音:/ˈpaɪθən/), 是一种面向对象.解释型计算机程序设计语言,由Guido van Rossum于1989年底发明,第 ...
eclipse 编辑 python 中文乱码的解决方案
今天在学习python时做了一个用户输入一个目录地址,再输入内容,然后将输入的内容存入输入的目录文件中: 具体代码如下: #coding:utf- ''' Created on -- @author: ...
django + nginx + raspberypi + pidaro
对于一个从事后台开发的人来说,搞了个网站,我自己都觉得有点意外.不是很懂html,不是很懂css,不是很懂js,不是很懂web开发模式/框架,不是很懂httpd/nginx--,web的东西样 ...
out.print和out.write方法
<%@ page language="java" import="java.util.*" %> <%@ page pageEncoding= ...
IT的发展路径
1.掌握更多的技能 2.掌握某一门深入的技能 3.掌握更多的工具 4.掌握业务
-_-#URL区分大小写吗
Should url be case sensitive?

在MacOs上配置Hadoop和Spark环境

在MacOs上配置hadoop和spark环境

Setting up Hadoop with Spark on MacOs

Instructions

在MacOs上配置Hadoop和Spark环境的更多相关文章

随机推荐

热门专题