SPARK-18560

##### Receiver data can not be dataSerialized properly.

```

// :: ERROR executor.Executor: Exception in task 4.3 in stage 6.0 (TID )

com.esotericsoftware.kryo.KryoException: Encountered unregistered class ID:

    at com.esotericsoftware.kryo.util.DefaultClassResolver.readClass(DefaultClassResolver.java:)

    at com.esotericsoftware.kryo.Kryo.readClass(Kryo.java:)

    at com.esotericsoftware.kryo.Kryo.readClassAndObject(Kryo.java:)

    at org.apache.spark.serializer.KryoDeserializationStream.readObject(KryoSerializer.scala:)

    at org.apache.spark.serializer.DeserializationStream$$anon$.getNext(Serializer.scala:)

    at org.apache.spark.util.NextIterator.hasNext(NextIterator.scala:)

    at org.apache.spark.util.Utils$.getIteratorSize(Utils.scala:)

    at org.apache.spark.rdd.RDD$$anonfun$count$.apply(RDD.scala:)

    at org.apache.spark.rdd.RDD$$anonfun$count$.apply(RDD.scala:)

    at org.apache.spark.SparkContext$$anonfun$runJob$.apply(SparkContext.scala:)

    at org.apache.spark.SparkContext$$anonfun$runJob$.apply(SparkContext.scala:)

    at org.apache.spark.scheduler.ResultTask.runTask(ResultTask.scala:)

    at org.apache.spark.scheduler.Task.run(Task.scala:)

    at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:)

    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:)

    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:)

    at java.lang.Thread.run(Thread.java:)

```

This problem stems from SPARK-, a patch to have Spark automatically pick the "best" serializer when caching RDDs.

```

Affects Version/s:

2.0.

Fix Version/s:

2.0., 2.1.

```

SPARK-18560

SPARK-18560的更多相关文章

Spark踩坑记——Spark Streaming+Kafka
[TOC] 前言在WeTest舆情项目中,需要对每天千万级的游戏评论信息进行词频统计,在生产者一端,我们将数据按照每天的拉取时间存入了Kafka当中,而在消费者一端,我们利用了spark strea ...
Spark RDD 核心总结
摘要: 1.RDD的五大属性 1.1 partitions(分区) 1.2 partitioner(分区方法) 1.3 dependencies(依赖关系) 1.4 compute(获取分区迭代列表) ...
spark处理大规模语料库统计词汇
最近迷上了spark,写一个专门处理语料库生成词库的项目拿来练练手, github地址:https://github.com/LiuRoy/spark_splitter.代码实现参考wordmaker ...
Hive on Spark安装配置详解（都是坑啊）
个人主页:http://www.linbingdong.com 简书地址:http://www.jianshu.com/p/a7f75b868568 简介本文主要记录如何安装配置Hive on Sp ...
Spark踩坑记——数据库（Hbase+Mysql）
[TOC] 前言在使用Spark Streaming的过程中对于计算产生结果的进行持久化时,我们往往需要操作数据库,去统计或者改变一些值.最近一个实时消费者处理任务,在使用spark streami ...
Spark踩坑记——初试
[TOC] Spark简介整体认识 Apache Spark是一个围绕速度.易用性和复杂分析构建的大数据处理框架.最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apach ...
Spark读写Hbase的二种方式对比
作者:Syn良子出处:http://www.cnblogs.com/cssdongl 转载请注明出处一.传统方式这种方式就是常用的TableInputFormat和TableOutputForm ...
（资源整理）带你入门Spark
一.Spark简介: 以下是百度百科对Spark的介绍: Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方 ...
Spark的StandAlone模式原理和安装、Spark-on-YARN的理解
Spark是一个内存迭代式运算框架,通过RDD来描述数据从哪里来,数据用那个算子计算,计算完的数据保存到哪里,RDD之间的依赖关系.他只是一个运算框架,和storm一样只做运算,不做存储. Spark ...
（一）Spark简介-Java&Python版Spark
Spark简介视频教程: 1.优酷 2.YouTube 简介: Spark是加州大学伯克利分校AMP实验室,开发的通用内存并行计算框架.Spark在2013年6月进入Apache成为孵化项目,8个月 ...

随机推荐

django - 总结 - 跨域请求
script ->jsonp跨域浏览器的同源策略:不能跨越网站请求信息: XMLHttpRequests遵循这个规定. 因此ajax等基于XML的都不能进行跨站请求而我们知道img,ifra ...
numpy&pandas基础
numpy基础 import numpy as np 定义array In [156]: np.ones(3) Out[156]: array([1., 1., 1.]) In [157]: np.o ...
Groovy 设计模式 -- 组合模式
Composite Pattern http://groovy-lang.org/design-patterns.html#_chain_of_responsibility_pattern 组合模式, ...
Tupper自我指涉公式生成器
Map和Collection
Map:key---Value(一对儿数据) HashMap:无序存放,key不允许重复 HashTable:无序存放,key不允许重复 key是set集合,value是collection集合 Co ...
《尚学堂_史上最易懂的设计模式视频》--章节3 Iterator迭代模拟列表
广州尚学堂官网-|广州Java培训|Java培训机构|人工智能+Python培训|PHP培训|全栈工程师培训|UI设计培训|前端移动开发培训http://www.gzsxt.cn/ ==Iterato ...
Windows密钥容器和证书的关系
其实CSP主要是对容器里的密钥对操作的,和证书关系不大. 容器里的密钥对有两种类型:一种是AT_KEYEXCHANGE,表示加密的密钥对,一种是AT_SIGNATURE表示签名的密钥对. 由于美国的出 ...
帆软报表（finereport）常用函数
1. SUM SUM(number1,number2,…):求一个指定单元格区域中所有数字之和.Number1,number2,…:1到30个参数或指定单元格区域中所有数字. 注: 函数将直接键入参数 ...
帆软报表（finereport）安装/配置
1.首先是安装帆软报表软件下载地址:http://www.finereport.com/product/download 激活码注册格账号就有了 2.启动软件,新建连接数据库点 ...
解决tomcat端口被占用：Port 8005 required by Tomcat v7.0 Server at localhost is already in use
问题提示8005端口被占用首先:在cmd下,输入 netstat -ano|findstr 8005 (什么端口号被占用就输入什么端口号),回车再输入 taskkill /pid 20 ...

SPARK-18560

SPARK-18560的更多相关文章

随机推荐

热门专题