spark在idea中本地如何运行？

前几天尝试使用idea在本地运行spark+scala的程序，出现了问题，http://www.cnblogs.com/yjf512/p/7662105.html 当时还以为是本地spark安装问题，今天发现原来不是。记录如下：

现象

使用pom写了一个程序，发现出现下面的错误

17/10/12 17:09:43 INFO storage.DiskBlockManager: Created local directory at /private/var/folders/bv/0tp4dw1n5tl9cxpc6dg2jy180000gp/T/blockmgr-0b0bf3cf-dd77-4bb4-97dc-60d6a65a35ae

Exception in thread "main" java.lang.ExceptionInInitializerError

     at org.apache.spark.storage.DiskBlockManager.addShutdownHook(DiskBlockManager.scala:147)

     at org.apache.spark.storage.DiskBlockManager.<init>(DiskBlockManager.scala:54)

     at org.apache.spark.storage.BlockManager.<init>(BlockManager.scala:78)

     at org.apache.spark.SparkEnv$.create(SparkEnv.scala:365)

     at org.apache.spark.SparkEnv$.createDriverEnv(SparkEnv.scala:193)

     at org.apache.spark.SparkContext.createSparkEnv(SparkContext.scala:288)

     at org.apache.spark.SparkContext.<init>(SparkContext.scala:457)

     at com.didichuxing.scala.BenchMarkMain$.main(BenchMarkMain.scala:21)

     at com.didichuxing.scala.BenchMarkMain.main(BenchMarkMain.scala)

Caused by: java.lang.NoSuchFieldException: SHUTDOWN_HOOK_PRIORITY

     at java.lang.Class.getField(Class.java:1695)

     at org.apache.spark.util.SparkShutdownHookManager.install(ShutdownHookManager.scala:223)

     at org.apache.spark.util.ShutdownHookManager$.shutdownHooks$lzycompute(ShutdownHookManager.scala:50)

     at org.apache.spark.util.ShutdownHookManager$.shutdownHooks(ShutdownHookManager.scala:48)

     at org.apache.spark.util.ShutdownHookManager$.addShutdownHook(ShutdownHookManager.scala:191)

     at org.apache.spark.util.ShutdownHookManager$.<init>(ShutdownHookManager.scala:58)

     at org.apache.spark.util.ShutdownHookManager$.<clinit>(ShutdownHookManager.scala)

     ... 9 more

之前以为是我本地没有安装spark的问题。后来我的同事使用eclipse可以在本地运行一个spark的程序。于是反思是不是我的项目问题。

看这篇文章https://support.datastax.com/hc/en-us/articles/207038146-DSE-Spark-job-initialisation-returns-java-lang-NoSuchFieldException-SHUTDOWN-HOOK-PRIORITY-

说的是classPath里面的Hadoop的jar包不要使用2.x的，需要使用内置的jar。

打印了classPath，把 /Users/yejianfeng/.m2/repository/org/apache 里面的hadoop文件夹改名了

看了下源码，大概是说在/Users/yejianfeng/.m2/repository/org/apache/spark/spark-core_2.10/1.6.3/spark-core_2.10-1.6.3-sources.jar!/org/apache/spark/util/ShutdownHookManager.scala

下面有个代码：

Try(Utils.classForName("org.apache.hadoop.util.ShutdownHookManager")) match {

      case Success(shmClass) =>

        val fsPriority = classOf[FileSystem]

          .getField("SHUTDOWN_HOOK_PRIORITY")

          .get(null) // static field, the value is not used

          .asInstanceOf[Int]

        val shm = shmClass.getMethod("get").invoke(null)

        shm.getClass().getMethod("addShutdownHook", classOf[Runnable], classOf[Int])

          .invoke(shm, hookTask, Integer.valueOf(fsPriority + 30))

      case Failure(_) =>

        Runtime.getRuntime.addShutdownHook(new Thread(hookTask, "Spark Shutdown Hook"));

    }

里面先获取FileSystem，然后再获取FileSystem的SHUTDOWN_HOOK_PRIORITY属性，而这个属性在当前的FileSystem中并不存在。看起来是个版本问题，而且是org.apache.hadoop.fs.FileSystem的版本问题。

发现我的FileSystem版本在pom里面已经设置的是2.7.1，查看了下源码，

public static final int SHUTDOWN_HOOK_PRIORITY = 10;

里面有这个属性。

使用ide的提示，我发现我的FileSystem被两个引用了

很明显，hadoop-core只有到1.2.1 于是我就尝试把hadoop-core从我的pom中移除，并且从mvn仓库中移除。

问题解决

可以在本机运行spark读取本地文件了

总结

说到底，这个是jar包的版本问题，最终只需要确保FileSystem的jar包是2.x以上，且没有多个FileSystem包就可以了。

好，处理了之后就可以使用idea在本地直接运行spark的程序了。

spark在idea中本地如何运行？（处理问题NoSuchFieldException: SHUTDOWN_HOOK_PRIORITY）的更多相关文章

在IntelliJ IDEA中创建和运行java/scala/spark程序
本文将分两部分来介绍如何在IntelliJ IDEA中运行Java/Scala/Spark程序: 基本概念介绍在IntelliJ IDEA中创建和运行java/scala/spark程序基本概念介 ...
Spark源码在Eclipse中部署/编译/运行
(1)下载Spark源码到官方网站下载:Openfire.Spark.Smack,其中Spark只能使用SVN下载,源码的文件夹分别对应Openfire.Spark和Smack. 直接下载Openf ...
idea中使用scala运行spark出现Exception in thread "main" java.lang.NoClassDefFoundError: scala/collection/GenTraversableOnce$class
idea中使用scala运行spark出现: Exception in thread "main" java.lang.NoClassDefFoundError: scala/co ...
spark (java API) 在Intellij IDEA中开发并运行
概述:Spark 程序开发,调试和运行,intellij idea开发Spark java程序. 分两部分,第一部分基于intellij idea开发Spark实例程序并在intellij IDEA中 ...
spark读取hdfs数据本地性异常
在分布式计算中,为了提高计算速度,数据本地性是其中重要的一环. 不过有时候它同样也会带来一些问题. 一.问题描述在分布式计算中,大多数情况下要做到移动计算而非移动数据,所以数据本地性尤其重要,因此我 ...
[Spark內核] 第42课：Spark Broadcast内幕解密：Broadcast运行机制彻底解密、Broadcast源码解析、Broadcast最佳实践
本课主题 Broadcast 运行原理图 Broadcast 源码解析 Broadcast 运行原理图 Broadcast 就是将数据从一个节点发送到其他的节点上; 例如 Driver 上有一张表,而 ...
spark读取hdfs数据本地性异常【转】
在分布式计算中,为了提高计算速度,数据本地性是其中重要的一环. 不过有时候它同样也会带来一些问题. 一.问题描述在分布式计算中,大多数情况下要做到移动计算而非移动数据,所以数据本地性尤其重要,因此我 ...
Spark Broadcast内幕解密：Broadcast运行机制彻底解密、Broadcast源码解析、Broadcast最佳实践
本课主题 Broadcast 运行原理图 Broadcast 源码解析 Broadcast 运行原理图 Broadcast 就是将数据从一个节点发送到其他的节点上; 例如 Driver 上有一张表,而 ...
Spark On Yarn搭建及各运行模式说明
之前记录Yarn:Hadoop2.0之YARN组件,这次使用Docker搭建Spark On Yarn 一.各运行模式 1.单机模式该模式被称为Local[N]模式,是用单机的多个线程来模拟Spa ...

随机推荐

MVC中ztree异步加载
var setting = { async: { enable: true, url: "*****/LoadChild", autoParam: ["id"] ...
Visual Studio Code 搭建Python开发环境
1.下载Python https://www.python.org/downloads/windows/ 选择一个版本,目前2.0的源码比较多,我下载的2.7.12 2.配置环境变量 3.Visual ...
MyIbatis和Hibernate的区别--2019-04-26
1.MyBatis 真正实现了java代码和sql的分离 2.Hibernate 是全自动的,MyBatis是半自动的 Hibernate实现了部分自动生成SQL 3.SQL优化上 MyBatis 强 ...
python基础知识练习题（二）
1. 有两个列表 l1 = [11, 22, 33] l2 = [22, 33, 44] a.获取内容相同的元素列表 li = []l1 = [11, 22, 33] l2 = [22, 33, 44 ...
jenkins里用ansible发布代码常见的问题
1.stdout: Neither the JAVA_HOME nor the JRE_HOME environment variable is defined cd bin/vi catalina. ...
Spark环境搭建（五）-----------Spark生态圈概述与Hadoop对比
Spark:快速的通用的分布式计算框架概述和特点: 1) Speed,(开发和执行)速度快.基于内存的计算:DAG(有向无环图)的计算引擎:基于线程模型: 2)Easy of use,易用 . 多语 ...
mysql5.7.X版本only_full_group_by问题解决
一.出错原因最近因为开发数据库与部署数据库版本不同,带来了几个问题,其中only_full_group_by问题是之前没有遇到的. 具体报错如下 [Err] 1055 - Expression #1 ...
RDD算子
RDD算子 #常用Transformation(即转换,延迟加载) #通过并行化scala集合创建RDD val rdd1 = sc.parallelize(Array(1,2,3,4,5,6,7,8 ...
Mac自动化环境
1. JDK安装下载JDK for Mac 我这里使用的是 jdk-7u79-macosx-x64.dmg 验证安装open Terminal java -version java versio ...
mybatis逆向工程的注意事项,以及数据库表
1.选择性更新,如果有新参数就更换成新参数,如果参数是null就不更新,还是原来的参数 2.mybatis使用逆向工程,数据库建表的字段user_id必须用下滑线隔开,这样生成的对象private L ...

spark在idea中本地如何运行？（处理问题NoSuchFieldException: SHUTDOWN_HOOK_PRIORITY）

现象

总结

spark在idea中本地如何运行？（处理问题NoSuchFieldException: SHUTDOWN_HOOK_PRIORITY）的更多相关文章

随机推荐

热门专题