spark wordcount程序

spark wordcount程序 IllegalAccessError错误

这个错误是权限错误，错误的引用方法，比如方法中调用private,protect方法。

当然大家知道wordcount业务很简单，都是调用依赖的方法，最后在一篇博客讲了错误:spark 2.2 读取 Hadoop3.0 数据异常

我试了下，解决了，我没有像他依赖那么多。

Exception in thread "main" java.lang.IllegalAccessError: class org.apache.hadoop.hdfs.web.HftpFileSystem cannot access its superinterface org.apache.hadoop.hdfs.web.TokenAspect$TokenManagementDelegator

        at java.lang.ClassLoader.defineClass1(Native Method)

        at java.lang.ClassLoader.defineClass(ClassLoader.java:763)

        at java.security.SecureClassLoader.defineClass(SecureClassLoader.java:142)

        at java.net.URLClassLoader.defineClass(URLClassLoader.java:467)

        at java.net.URLClassLoader.access$100(URLClassLoader.java:73)

        at java.net.URLClassLoader$1.run(URLClassLoader.java:368)

        at java.net.URLClassLoader$1.run(URLClassLoader.java:362)

        at java.security.AccessController.doPrivileged(Native Method)

        at java.net.URLClassLoader.findClass(URLClassLoader.java:361)

        at java.lang.ClassLoader.loadClass(ClassLoader.java:424)

        at java.lang.ClassLoader.loadClass(ClassLoader.java:357)

        at java.lang.Class.forName0(Native Method)

        at java.lang.Class.forName(Class.java:348)

        at java.util.ServiceLoader$LazyIterator.nextService(ServiceLoader.java:370)

        at java.util.ServiceLoader$LazyIterator.next(ServiceLoader.java:404)

        at java.util.ServiceLoader$1.next(ServiceLoader.java:480)

        at org.apache.hadoop.fs.FileSystem.loadFileSystems(FileSystem.java:3202)

        at org.apache.hadoop.fs.FileSystem.getFileSystemClass(FileSystem.java:3247)

        at org.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:3286)

        at org.apache.hadoop.fs.FileSystem.access$200(FileSystem.java:123)

        at org.apache.hadoop.fs.FileSystem$Cache.getInternal(FileSystem.java:3337)

        at org.apache.hadoop.fs.FileSystem$Cache.get(FileSystem.java:3305)

        at org.apache.hadoop.fs.FileSystem.get(FileSystem.java:476)

        at org.apache.spark.util.Utils$.getHadoopFileSystem(Utils.scala:1857)

        at org.apache.spark.scheduler.EventLoggingListener.<init>(EventLoggingListener.scala:68)

        at org.apache.spark.SparkContext.<init>(SparkContext.scala:532)

问题分析

我使用cdh安装spark的，spark版本是2.4.0，hadoop是hadoop3.0.0。我特地看下idea的extern依赖包，hadoop的依赖包是2.6.X。

这样的看存在使用的spark包依赖hdoop包版本与生产环境上的hadoop版本不一致。

解决方式就是spark的依赖hadoop，我屏蔽掉，重新手动导入hadoop包

解决方式

    <properties>

        <hbase.version>2.0.0</hbase.version>

        <spark.version>2.4.0</spark.version>

        <scala.version>2.11.12</scala.version>

        <hadoop.version>3.0.0</hadoop.version>

    </properties>

    <dependencies>

<!--        <dependency>

            <groupId>org.apache.spark</groupId>

            <artifactId>spark-core_2.12</artifactId>

            <version>${spark.version}</version>

            <scope>provided</scope>

        </dependency>-->

<!--        解决IllegalAccessError-->

        <dependency>

            <groupId>org.apache.hadoop</groupId>

            <artifactId>hadoop-client</artifactId>

            <version>${hadoop.version}</version>

        </dependency>

        <dependency>

            <groupId>org.apache.spark</groupId>

            <artifactId>spark-core_2.11</artifactId>

            <version>${spark.version}</version>

            <exclusions>

                <exclusion>

                    <artifactId>hadoop-client</artifactId>

                    <groupId>org.apache.hadoop</groupId>

                </exclusion>

            </exclusions>

        </dependency>

</dependencies>

附录 wordcount程序

package com.learn.hadoop.spark.wordcount;

import org.apache.spark.SparkConf;

import org.apache.spark.api.java.JavaPairRDD;

import org.apache.spark.api.java.JavaRDD;

import org.apache.spark.api.java.JavaSparkContext;

import org.apache.spark.api.java.function.FlatMapFunction;

import org.apache.spark.api.java.function.Function2;

import org.apache.spark.api.java.function.PairFunction;

import org.apache.spark.api.java.function.VoidFunction;

import scala.Tuple2;

import java.util.Arrays;

import java.util.Iterator;

public class WordCount {

    public static void main(String[] args) {

        if(args ==null ||args.length<1)

        {

            System.err.println("please input paths");

            System.exit(1);

        }

        String outfile =args[0];

        SparkConf sparkConf =new SparkConf().setMaster("local").setAppName("wordCount");

        JavaSparkContext sc =new JavaSparkContext(sparkConf);

        String inputFile="README.MD";

        JavaRDD<String> input =sc.textFile(inputFile);

        JavaRDD<String> lines =input.flatMap(new FlatMapFunction<String, String>() {

            @Override

            public Iterator<String> call(String s) throws Exception {

                return Arrays.asList(s.split(" ")).iterator();

                //return null;

            }

        });

        //paris

        JavaPairRDD<String,Integer> paris = lines.mapToPair(new PairFunction<String, String, Integer>() {

            @Override

            public Tuple2<String, Integer> call(String s) throws Exception {

                return new Tuple2<String,Integer>(s,1);

            }

        });

        //redues

        JavaPairRDD<String,Integer> counts=paris.reduceByKey(new Function2<Integer, Integer, Integer>() {

            @Override

            public Integer call(Integer integer, Integer integer2) throws Exception {

                return integer+integer2;

            }

        });

        //output

        counts.foreach(new VoidFunction<Tuple2<String, Integer>>() {

            @Override

            public void call(Tuple2<String, Integer> stringIntegerTuple2) throws Exception {

                System.out.println(stringIntegerTuple2);

            }

        });

        counts.saveAsTextFile(outfile);

        sc.stop();

    }

}

spark wordcount程序的更多相关文章

大数据笔记（二十八）——执行Spark任务、开发Spark WordCount程序
一.执行Spark任务: 客户端 1.Spark Submit工具:提交Spark的任务(jar文件) (*)spark提供的用于提交Spark任务工具 (*)example:/root/traini ...
idea配置scala编写spark wordcount程序
1.创建scala maven项目选择骨架的时候为org.scala-tools.archetypes:scala-aechetype-simple 1.2 2.导入包,进入spark官网Docum ...
[转] 用SBT编译Spark的WordCount程序
问题导读: 1.什么是sbt? 2.sbt项目环境如何建立? 3.如何使用sbt编译打包scala? [sbt介绍 sbt是一个代码编译工具,是scala界的mvn,可以编译scala,java等,需 ...
用SBT编译Spark的WordCount程序
问题导读: 1.什么是sbt? 2.sbt项目环境如何建立? 3.如何使用sbt编译打包scala? sbt介绍 sbt是一个代码编译工具,是scala界的mvn,可以编译scala,java等,需要 ...
编写Spark的WordCount程序并提交到集群运行[含scala和java两个版本]
编写Spark的WordCount程序并提交到集群运行[含scala和java两个版本] 1. 开发环境 Jdk 1.7.0_72 Maven 3.2.1 Scala 2.10.6 Spark 1.6 ...
将java开发的wordcount程序提交到spark集群上运行
今天来分享下将java开发的wordcount程序提交到spark集群上运行的步骤. 第一个步骤之前,先上传文本文件,spark.txt,然用命令hadoop fs -put spark.txt /s ...
spark学习11（Wordcount程序-本地测试）
wordcount程序文件wordcount.txt hello wujiadong hello spark hello hadoop hello python 程序示例 package wujia ...
大话Spark(3)-一图深入理解WordCount程序在Spark中的执行过程
本文以WordCount为例, 画图说明spark程序的执行过程 WordCount就是统计一段数据中每个单词出现的次数, 例如hello spark hello you 这段文本中hello出现2次 ...
55、Spark Streaming:updateStateByKey以及基于缓存的实时wordcount程序
一.updateStateByKey 1.概述 SparkStreaming 7*24 小时不间断的运行,有时需要管理一些状态,比如wordCount,每个batch的数据不是独立的而是需要累加的,这 ...

随机推荐

VS“无法查找或打开PDB文件”是怎么回事？如何解决
有时候,我们使用 VS(Visual Studio)编译程序时会出现“无法查找或打开PDB文件”的提示,并且此时程序会生成失败,无法运行,如下图所示: 大家不要惊慌,出现这种提示并不是代码写错了,而是 ...
Java学习笔记(十)面向对象---接口
理解初期理解可以认为接口是一个特殊的抽象类.当接口中的方法都是抽象的,那么该类可以通过接口的形式来表示. class用于定义类 interface用于定义接口格式特点接口中常见定义:常量,抽象 ...
java框架-Mybatis
一.Mybatis介绍 mybatis是一个持久层的框架,是对JDBC操作数据库的封装,使开发者只需要关注业务本身,不需要花费精力去处理加载驱动.创建数据库连接对象.创建statement语句对象.参 ...
bitset 位运算
1. 判断一个数是否是2的方幂n > 0 && ((n & (n - 1)) == 0 ) 解释((n & (n-1)) == 0): 如果A&B==0, ...
bugku 好多压缩包
https://www.cnblogs.com/WangAoBo/p/6951160.html
消息队列（六）--- RocketMQ-消息消费
文章部分图片来自参考资料,侵删概述我们从前面的发送流程知道某个主题的消息到了broker 的 messageque 里,假如让我们来设计一个消息队列的消费者过程,那么多个消费者应该如何消费数量较少 ...
Vue学习心得----新手如何学习Vue（转载）
ps:本文并非原著,转载自:https://www.cnblogs.com/buzhiqianduan/p/7620102.html,请悉知前言使用vue框架有一段时间了,这里总结一下心得,主要为 ...
windows10重置后，鼠标键盘失灵
用大白菜u盘选择工具修复一下驱动
js克隆一个对象
我们知道,对象类型在赋值的过程中其实是复制了地址,所以如果改变了一方,其他都会被改变.我们应该如何克隆一个对象,并且避免这种现象的发生呢? 方法一:Object.assign function cop ...
stopWatch 用法
package com.example.stopwatch; import org.springframework.util.StopWatch; public class TestStopWatch ...