Spark遇到的报错和坑

1. Java版本不一致，导致启动报错。

# 解决方法：

在启动脚本最前边添加系统参数，指定Java版本

export JAVA_HOME=/usr/java/jdk1..0_181-amd64/jre

2. Spark1和Spark2并存，启动时报错。

# 在SPARK_HOME中指定启动的spark版本

export SPARK_HOME=/data01/opt/cloudera/parcels/SPARK2-2.3..cloudera3-.cdh5.13.3.p0./lib/spark2

3.缺少Hadoop依赖包

Error: A JNI error has occurred, please check your installation and try again

Exception in thread "main" java.lang.NoClassDefFoundError: org/slf4j/Logger

        at java.lang.Class.getDeclaredMethods0(Native Method)

        at java.lang.Class.privateGetDeclaredMethods(Class.java:)

        at java.lang.Class.privateGetMethodRecursive(Class.java:)

        at java.lang.Class.getMethod0(Class.java:)

        at java.lang.Class.getMethod(Class.java:)

        at sun.launcher.LauncherHelper.validateMainClass(LauncherHelper.java:)

        at sun.launcher.LauncherHelper.checkAndLoadMain(LauncherHelper.java:)

Caused by: java.lang.ClassNotFoundException: org.slf4j.Logger

        at java.net.URLClassLoader.findClass(URLClassLoader.java:)

        at java.lang.ClassLoader.loadClass(ClassLoader.java:)

        at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:)

        at java.lang.ClassLoader.loadClass(ClassLoader.java:)

解决方法：

#添加Hadoop的classpath到SPARK_DIST_CLASSPAHT中

export SPARK_DIST_CLASSPATH=$(hadoop classpath)

4. 报错信息：java.lang.Error: java.lang.InterruptedException: sleep interrupted

Exception in thread "receiver-supervisor-future-0" java.lang.Error: java.lang.InterruptedException: sleep interrupted

    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1155)

    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)

    at java.lang.Thread.run(Thread.java:748)

Caused by: java.lang.InterruptedException: sleep interrupted

    at java.lang.Thread.sleep(Native Method)

    at org.apache.spark.streaming.receiver.ReceiverSupervisor$$anonfun$restartReceiver$1.apply$mcV$sp(ReceiverSupervisor.scala:196)

    at org.apache.spark.streaming.receiver.ReceiverSupervisor$$anonfun$restartReceiver$1.apply(ReceiverSupervisor.scala:189)

    at org.apache.spark.streaming.receiver.ReceiverSupervisor$$anonfun$restartReceiver$1.apply(ReceiverSupervisor.scala:189)

    at scala.concurrent.impl.Future$PromiseCompletingRunnable.liftedTree1$1(Future.scala:24)

    at scala.concurrent.impl.Future$PromiseCompletingRunnable.run(Future.scala:24)

    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)

    ... 2 more

解决方法：

    将 ssc.awaitTerminationOrTimeout(1000)

    改成ssc.awaitTermination() 即可

5. 报错5

FAILED: Execution Error, return code 3 from org.apache.hadoop.hive.ql.exec.mr.MapredLocalTask

解决方法:

    set hive.mapjoin.localtask.max.memory.usage=0.99;

    set hive.auto.convert.join=false;

Ref: https://blog.csdn.net/qq_21383435/article/details/78593267

Spark遇到的报错和坑的更多相关文章

IDEA中写MyBatis的xml配置文件编译报错的坑
IDEA中写MyBatis的xml配置文件编译报错的坑说明:用IDEA编译工具在项目中使用Mybatis框架,编写mybatis-config.xml和Mapper.xml配置文件时,编译项目出现错 ...
spark提交任务报错： java.lang.SecurityException: Invalid signature file digest for Manifest main attributes
spark提交任务报错: java.lang.SecurityException: Invalid signature file digest for Manifest main attributes ...
Spark程序编译报错error: object apache is not a member of package org
Spark程序编译报错: [INFO] Compiling 2 source files to E:\Develop\IDEAWorkspace\spark\target\classes at 156 ...
intellij 调试spark scala 程序报错
spark用的是cdh spark-2.0.1 package main.scala import org.apache.spark.rdd.RDD import org.apache.spark.{ ...
【原创】大叔问题定位分享（10）提交spark任务偶尔报错 org.apache.spark.SparkException: A master URL must be set in your configuration
spark 2.1.1 一问题重现问题代码示例 object MethodPositionTest { val sparkConf = new SparkConf().setAppName(&qu ...
spark的bulkload报错及解决
需求将HDFS上的数据解析出来,然后通过hfile方式批量写入Hbase(需要多列写入) 写入数据的关键api: rdd.saveAsNewAPIHadoopFile( stagingFolder, ...
VS Code编写Python3 insert 数据库插入无效也不报错的坑~.~
标题最近在开发中需要用到web端开发工具.需要用python工具.偶然发现微软的良心之作:Visual Studio Code,这个大小才几十兆的轻量级代码编辑器,功能却是重量级的,通过插件的方法,, ...
python MySQL安装依赖报错的坑
0X01 问题 MySQL-python是python调用MySQL的常用库通常安装时会遇到某些坑. EnvironmentError: mysql_config not found yum -y ...
Error- Overloaded method value createDirectStream in error Spark Streaming打包报错
直接上代码 StreamingExamples.setStreamingLogLevels() val Array(brokers, topics) = args // Create context ...

随机推荐

Vim编码知识,乱码问题
原文:http://demi-panda.com/2012/12/26/vim-encoding/ 在vim的初始学习阶段,乱码经常是困扰新手的一个比较烦躁的问题,本文试图阐述Vim的编码知识,及设置 ...
GlobalAlloc()和malloc()、HeapAlloc()
两者都是在堆上分配内存区. malloc()是C运行库中的动态内存分配函数,WINDOWS程序基本不使用了,因为它比WINDOWS内存分配函数少了一些特性,如,整理内存. GlobalAlloc( ...
delphi让exe开机自启动
procedure AutoRunOnSystemStart(Title, FileName: String);const _Software_Microsoft_Windows_CurrentVe ...
VSCode调试设置
tasks.json { "version": "0.1.0", "isShellCommand": true, "args&qu ...
「BZOJ 1876」「SDOI 2009」SuperGCD「数论」
题意求\(\gcd(a, b)\),其中\(a,b\leq10^{10000}\) 题解使用\(\text{Stein}\)算法,其原理是不断筛除因子\(2\)然后使用更相减损法如果不筛\(2\ ...
移动端复制粘贴clipboardjs
官方网址: https://clipboardjs.com/ 不能一打开就直接触发复制粘贴: 参考博客: http://blog.csdn.net/twoByte/article/details/52 ...
CSS3 transition 属性——逐渐变慢/匀速/加速/减速/加速然后减速
ease: 1.ease:(逐渐变慢)默认值 2.linear:(匀速) 3.ease-in:(加速) 4.ease-out:(减速) 5.ease-in-out:(加速然后减速) 6.cubic-b ...
趣图：TCP 与 UDP 的差别
趣图:程序猿和运维狗的工作日常…… 趣图:Java 和 PHP 之间的战斗
Charles设置可抓https的包
一.help 二.proxy
uoj #111. 【APIO2015】Jakarta Skyscrapers
#111. [APIO2015]Jakarta Skyscrapers 印尼首都雅加达市有 NN 座摩天楼,它们排列成一条直线,我们从左到右依次将它们编号为 00 到 N−1N−1.除了这 NN 座摩 ...

Spark遇到的报错和坑

Spark遇到的报错和坑的更多相关文章

随机推荐

热门专题