[Spark] Spark 安装配置

原文地址：https://www.cnblogs.com/memento/p/9148732.html

Windows 上的单机版安装

下载地址：http://spark.apache.org/downloads.html

本文以 Spark 2.3.0 为例

>>> 下载下来的文件是 tgz 格式的压缩文件，直接利用压缩软件将其打开，可以看见里面有一个 tar 格式的压缩文件，继续用压缩软件打开，最终如下图所示：

>>> 将其中的 spark-2.3.0-bin-hadoop2.7 文件夹解压，新增 SPARK_HOME 环境变量，设置为解压路径，并将其追加到 PATH 环境变量；

>>> 此时在 cmd 窗口中执行 "spark-shell" 命令可得到如下提示：

C:\Users\Memento>spark-shell

2018-06-06 23:39:36 ERROR Shell:397 - Failed to locate the winutils binary in the hadoop binary path

java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.

        at org.apache.hadoop.util.Shell.getQualifiedBinPath(Shell.java:379)

        at org.apache.hadoop.util.Shell.getWinUtilsPath(Shell.java:394)

        at org.apache.hadoop.util.Shell.<clinit>(Shell.java:387)

        at org.apache.hadoop.util.StringUtils.<clinit>(StringUtils.java:80)

        at org.apache.hadoop.security.SecurityUtil.getAuthenticationMethod(SecurityUtil.java:611)

        at org.apache.hadoop.security.UserGroupInformation.initialize(UserGroupInformation.java:273)

        at org.apache.hadoop.security.UserGroupInformation.ensureInitialized(UserGroupInformation.java:261)

        at org.apache.hadoop.security.UserGroupInformation.loginUserFromSubject(UserGroupInformation.java:791)

        at org.apache.hadoop.security.UserGroupInformation.getLoginUser(UserGroupInformation.java:761)

        at org.apache.hadoop.security.UserGroupInformation.getCurrentUser(UserGroupInformation.java:634)

        at org.apache.spark.util.Utils$$anonfun$getCurrentUserName$1.apply(Utils.scala:2464)

        at org.apache.spark.util.Utils$$anonfun$getCurrentUserName$1.apply(Utils.scala:2464)

        at scala.Option.getOrElse(Option.scala:121)

        at org.apache.spark.util.Utils$.getCurrentUserName(Utils.scala:2464)

        at org.apache.spark.SecurityManager.<init>(SecurityManager.scala:222)

        at org.apache.spark.deploy.SparkSubmit$.secMgr$lzycompute$1(SparkSubmit.scala:393)

        at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$SparkSubmit$$secMgr$1(SparkSubmit.scala:393)

        at org.apache.spark.deploy.SparkSubmit$$anonfun$prepareSubmitEnvironment$7.apply(SparkSubmit.scala:401)

        at org.apache.spark.deploy.SparkSubmit$$anonfun$prepareSubmitEnvironment$7.apply(SparkSubmit.scala:401)

        at scala.Option.map(Option.scala:146)

        at org.apache.spark.deploy.SparkSubmit$.prepareSubmitEnvironment(SparkSubmit.scala:400)

        at org.apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:170)

        at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:136)

        at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)

2018-06-06 23:39:36 WARN  NativeCodeLoader:62 - Unable to load native-hadoop library for your platform... using builtin-java classes where applicable

Setting default log level to "WARN".

To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).

Spark context Web UI available at http://Memento-PC:4040

Spark context available as 'sc' (master = local[*], app id = local-1528299586814).

Spark session available as 'spark'.

Welcome to

      ____              __

     / __/__  ___ _____/ /__

    _\ \/ _ \/ _ `/ __/  '_/

   /___/ .__/\_,_/_/ /_/\_\   version 2.3.0

      /_/

Using Scala version 2.11.8 (Java HotSpot(TM) 64-Bit Server VM, Java 1.8.0_151)

Type in expressions to have them evaluated.

Type :help for more information.

提示说在 hadoop 路径下无法定位到 winutils，所以接下来需要配置 Hadoop；

>>> 详见：Windows 下的 Hadoop 2.7.5 环境搭建

>>> 随后再重新执行 "spark-shell" 命令即可；

By. Memento

[Spark] Spark 安装配置的更多相关文章

spark HA 安装配置和使用（spark1.2-cdh5.3）
安装环境如下: 操作系统:CentOs 6.6 Hadoop 版本:CDH-5.3.0 Spark 版本:1.2 集群5个节点 node01~05 node01~03 为worker. node04. ...
Spark_安装配置_运行模式
一.Spark支持的安装模式: 1.伪分布式(一台机器即可) 2.全分布式(至少需要3台机器) 二.Spark的安装配置 1.准备工作安装Linux和JDK1.8 配置Linux:关闭防火墙.主机名 ...
Hive on Spark安装配置详解（都是坑啊）
个人主页:http://www.linbingdong.com 简书地址:http://www.jianshu.com/p/a7f75b868568 简介本文主要记录如何安装配置Hive on Sp ...
Spark standlone安装与配置
spark的安装简单,去官网下载与集群hadoop版本相一致的文件即可. 解压后,主要需要修改spark-evn.sh文件. 以spark standlone为例,配置dn1,nn2为master,使 ...
Spark(三): 安装与配置
参见 HDP2.4安装(五):集群及组件安装 ,安装配置的spark版本为1.6, 在已安装HBase.hadoop集群的基础上通过 ambari 自动安装Spark集群,基于hadoop yarn ...
spark集群安装配置
spark集群安装配置一. Spark简介 Spark是一个通用的并行计算框架,由UCBerkeley的AMP实验室开发.Spark基于map reduce 算法模式实现的分布式计算,拥有Hadoo ...
安装配置最强Spark IDE--IDEA
1.安装IntelliJ IDEA IDEA 全称 IntelliJ IDEA,是java语言开发的集成环境,IntelliJ在业界被公认为最好的java开发工具之一,尤其在智能代码助手.代码自动提示 ...
centOS7下Spark安装配置
环境说明: 操作系统: centos7 64位 3台 centos7-1 192.168.190.130 master centos7-2 192.168.190.129 slave1 centos7 ...
安装配置Spark集群
首先准备3台电脑或虚拟机,分别是Master,Worker1,Worker2,安装操作系统(本文中使用CentOS7). 1.配置集群,以下步骤在Master机器上执行 1.1.关闭防火墙:syste ...
ubuntu下spark安装配置
一.安装vmware虚拟机二.在虚拟机上安装ubuntu12.04操作系统三.安装jdk1.8.0_25 http://www.oracle.com/technetwork/java/javase ...

随机推荐

u-boot中debug的一些总结
研究u-boot,首要搞清楚的是代码的流程,运行流程是什么样子的呢?不知道,就看log.这就要把log信息打开.研究u-boot的文件,发现里面是很多DEBUG宏定义的打印,这个打印着怎么打开呢? ...
python中基于queue的打印机仿真算法
使用打印机的模型是queue中最经典的应用之一,这里就回顾一下queue在这里的使用方法和起的重要作用. 为了仿真打印状态,这里需要把真实环境中的三个物理模型要建模出来,分别是:打印者,打印任务, ...
postgresql-无序uuid tps测试
# postgresql-无序uuid tps测试 ## 无序uuid对数据库的影响由于最近在做超大表的性能测试,在该过程中发现了无序uuid做主键对表插入性能有一定影响.结合实际情况发现当表的数据 ...
django rest framework serializers解读
serializers是什么?官网是这样的"Serializers allow complex data such as querysets and model instances to b ...
Python——collections模块
collections模块 collections模块在内置数据类型(dict.list.set.tuple)的基础上,还提供了几个额外的数据类型:ChainMap.Counter.deque.def ...
2-1 编写HelloWorld
引用外部的vue.js文件
【BJOI2019】排兵布阵 DP
题目大意:有$n$座城堡,$s$轮游戏. 对于第$x$轮,第i座城堡的士兵数量为$a[x][i]$. 如果你需要攻下第i座城堡,你在第i座城堡部署的士兵必须严格大于$2a[x][i]$,如果攻下了你会 ...
Hexo的next主题安装
通过Git+Hexo搭建的个人博客地址:https://liangh.top/ 1.使用git克隆最新版本 2.先在themes目录创建一个next文件夹,然后在hexo站点目录下右键打开Git Ba ...
PowerShell 连接远程服务器
>>服务端Enable-PSRemoting winrm quickconfig ————这个可能不需要 >>客户端Set-Item wsman:\localhost\Clie ...
EOS生产区块：解析插件producer_plugin
producer_plugin是控制区块生产的关键插件. 关键字:producer_plugin,同步区块的处理,pending区块,生产区块,最后不可逆区块,生产循环,生产安排,水印轮次,计时器,确 ...

[Spark] Spark 安装配置

Windows 上的单机版安装

[Spark] Spark 安装配置的更多相关文章

随机推荐

热门专题