查看Spark与Hadoop等其他组件的兼容版本

安装与Spark相关的其他组件的时候，例如JDK，Hadoop，Yarn，Hive，Kafka等，要考虑到这些组件和Spark的版本兼容关系。这个对应关系可以在Spark源代码的pom.xml文件中查看。

一、下载Spark源代码

打开网址https://github.com/apache/spark，例如选择v2.4.0-rc5版本，再点击“Clone or download”按钮，点击下方的“Download ZIP”进行下载。

二、查看pom.xml文件
将下载的源代码压缩包解压后，打开里面的pom.xml文件，查看properties标签内各配置项，里面有列出其他组件的兼容版本信息，例如<hadoop.version>2.6.5</hadoop.version>表示hadoop版本为2.6.5。如下：

  <properties>

    <project.build.sourceEncoding>UTF-</project.build.sourceEncoding>

    <project.reporting.outputEncoding>UTF-</project.reporting.outputEncoding>

    <java.version>1.8</java.version>

    <maven.compiler.source>${java.version}</maven.compiler.source>

    <maven.compiler.target>${java.version}</maven.compiler.target>

    <maven.version>3.5.</maven.version>

    <sbt.project.name>spark</sbt.project.name>

    <slf4j.version>1.7.</slf4j.version>

    <log4j.version>1.2.</log4j.version>

    <hadoop.version>2.6.</hadoop.version>

    <protobuf.version>2.5.</protobuf.version>

    <yarn.version>${hadoop.version}</yarn.version>

    <flume.version>1.6.</flume.version>

    <zookeeper.version>3.4.</zookeeper.version>

    <curator.version>2.6.</curator.version>

    <hive.group>org.spark-project.hive</hive.group>

    <!-- Version used in Maven Hive dependency -->

    <hive.version>1.2..spark2</hive.version>

    <!-- Version used for internal directory structure -->

    <hive.version.short>1.2.</hive.version.short>

    <derby.version>10.12.1.1</derby.version>

    <parquet.version>1.10.</parquet.version>

    <orc.version>1.5.</orc.version>

    <orc.classifier>nohive</orc.classifier>

    <hive.parquet.version>1.6.</hive.parquet.version>

    <jetty.version>9.3..v20180605</jetty.version>

    <javaxservlet.version>3.1.</javaxservlet.version>

    <chill.version>0.9.</chill.version>

    <ivy.version>2.4.</ivy.version>

    <oro.version>2.0.</oro.version>

    <codahale.metrics.version>3.1.</codahale.metrics.version>

    <avro.version>1.8.</avro.version>

    <avro.mapred.classifier>hadoop2</avro.mapred.classifier>

    <aws.kinesis.client.version>1.8.</aws.kinesis.client.version>

    <!-- Should be consistent with Kinesis client dependency -->

    <aws.java.sdk.version>1.11.</aws.java.sdk.version>

    <!-- the producer is used in tests -->

    <aws.kinesis.producer.version>0.12.</aws.kinesis.producer.version>

    <!--  org.apache.httpcomponents/httpclient-->

    <commons.httpclient.version>4.5.</commons.httpclient.version>

    <commons.httpcore.version>4.4.</commons.httpcore.version>

    <!--  commons-httpclient/commons-httpclient-->

    <httpclient.classic.version>3.1</httpclient.classic.version>

    <commons.math3.version>3.4.</commons.math3.version>

    <!-- managed up from 3.2. for SPARK- -->

    <commons.collections.version>3.2.</commons.collections.version>

    <scala.version>2.11.</scala.version>

    <scala.binary.version>2.11</scala.binary.version>

    <codehaus.jackson.version>1.9.</codehaus.jackson.version>

    <fasterxml.jackson.version>2.6.</fasterxml.jackson.version>

    <fasterxml.jackson.databind.version>2.6.7.1</fasterxml.jackson.databind.version>

    <snappy.version>1.1.7.1</snappy.version>

    <netlib.java.version>1.1.</netlib.java.version>

    <calcite.version>1.2.-incubating</calcite.version>

    <commons-codec.version>1.10</commons-codec.version>

    <commons-io.version>2.4</commons-io.version>

    <!-- org.apache.commons/commons-lang/-->

    <commons-lang2.version>2.6</commons-lang2.version>

    <!-- org.apache.commons/commons-lang3/-->

    <commons-lang3.version>3.5</commons-lang3.version>

    <datanucleus-core.version>3.2.</datanucleus-core.version>

    <janino.version>3.0.</janino.version>

    <jersey.version>2.22.</jersey.version>

    <joda.version>2.9.</joda.version>

    <jodd.version>3.5.</jodd.version>

    <jsr305.version>1.3.</jsr305.version>

    <libthrift.version>0.9.</libthrift.version>

    <antlr4.version>4.7</antlr4.version>

    <jpam.version>1.1</jpam.version>

    <selenium.version>2.52.</selenium.version>

    <!--

    Managed up from older version from Avro; sync with jackson-module-paranamer dependency version

    -->

    <paranamer.version>2.8</paranamer.version>

    <maven-antrun.version>1.8</maven-antrun.version>

    <commons-crypto.version>1.0.</commons-crypto.version>

    <!--

    If you are changing Arrow version specification, please check ./python/pyspark/sql/utils.py,

    ./python/run-tests.py and ./python/setup.py too.

    -->

    <arrow.version>0.10.</arrow.version>

    <test.java.home>${java.home}</test.java.home>

    <test.exclude.tags></test.exclude.tags>

    <test.include.tags></test.include.tags>

    <!-- Package to use when relocating shaded classes. -->

    <spark.shade.packageName>org.spark_project</spark.shade.packageName>

    <!-- Modules that copy jars to the build directory should do so under this location. -->

    <jars.target.dir>${project.build.directory}/scala-${scala.binary.version}/jars</jars.target.dir>

    <!-- Allow modules to enable / disable certain build plugins easily. -->

    <build.testJarPhase>prepare-package</build.testJarPhase>

    <build.copyDependenciesPhase>none</build.copyDependenciesPhase>

    <!--

      Dependency scopes that can be overridden by enabling certain profiles. These profiles are

      declared in the projects that build assemblies.

      For other projects the scope should remain as "compile", otherwise they are not available

      during compilation if the dependency is transivite (e.g. "graphx/" depending on "core/" and

      needing Hadoop classes in the classpath to compile).

    -->

    <flume.deps.scope>compile</flume.deps.scope>

    <hadoop.deps.scope>compile</hadoop.deps.scope>

    <hive.deps.scope>compile</hive.deps.scope>

    <orc.deps.scope>compile</orc.deps.scope>

    <parquet.deps.scope>compile</parquet.deps.scope>

    <parquet.test.deps.scope>test</parquet.test.deps.scope>

    <!--

      Overridable test home. So that you can call individual pom files directly without

      things breaking.

    -->

    <spark.test.home>${session.executionRootDirectory}</spark.test.home>

    <CodeCacheSize>512m</CodeCacheSize>

  </properties>

完毕。

查看Spark与Hadoop等其他组件的兼容版本的更多相关文章

对于spark以及hadoop的几个疑问(转)
Hadoop是啥?spark是啥? spark能完全取代Hadoop吗? Hadoop和Spark属于哪种计算计算模型(实时计算.离线计算)? 学习Hadoop和spark,哪门语言好? 哪里能找到比 ...
Spark学习之基础相关组件（1）
Spark学习之基础相关组件(1) 1. Spark是一个用来实现快速而通用的集群计算的平台. 2. Spark的一个主要特点是能够在内存中进行计算,因而更快. 3. RDD(resilient di ...
【Hadoop】ZooKeeper组件
目录一.配置时间同步二.部署zookeeper(master节点) 1.使用xftp上传软件包至~ 2.解压安装包 3.创建 data 和 logs 文件夹 4.写入该节点的标识编号 5.修改配置 ...
Spark和hadoop的关系
1. Spark VSHadoop有哪些异同点? Hadoop:分布式批处理计算,强调批处理,常用于数据挖掘和数据分析. Spark:是一个基于内存计算的开源的集群计算系统,目的是让数据分析更加快速, ...
Spark和Hadoop作业之间的区别
Spark目前被越来越多的企业使用,和Hadoop一样,Spark也是以作业的形式向集群提交任务,那么在内部实现Spark和Hadoop作业模型都一样吗?答案是不对的. 熟悉Hadoop的人应该都知道 ...
Spark与Hadoop计算模型的比较分析
http://tech.it168.com/a2012/0401/1333/000001333287.shtml 最近很多人都在讨论Spark这个貌似通用的分布式计算模型,国内很多机器学习相关工作者都 ...
完全卸载hadoop安装的组件(hdp版本）
yum remove -y hadoop_* zookeeper* ranger* hbase_* ranger* hbase_* ambari-* hadoop_* zookeeper_* hbas ...
大数据 --> Spark和Hadoop作业之间的区别
Spark和Hadoop作业之间的区别熟悉Hadoop的人应该都知道,用户先编写好一个程序,我们称为Mapreduce程序,一个Mapreduce程序就是一个Job,而一个Job里面可以有一个或多个 ...
大数据 --> Spark与Hadoop对比
Spark与Hadoop对比什么是Spark Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法 ...

随机推荐

JS将扁平化的数据处理成Tree结构
let jsonData= [ { id:1, parentId:0, name:"一级菜单A" }, { id:2, parentId:0, name:"一级菜单B& ...
python随用随学20200118-函数的高级特性
高阶函数话说当年C语言和Java里好像都有这么个东西...忘了一句话说就是函数名本身就是一个引用. 可以作为变量传递. 一个简单的例子: def power_demo(x): return x* ...
Vue.js 从源码理解v-for和v-if的优先级的高低
在vue.js里面,v-for和v-if是可以一起使用作用在某个元素上,网上看到一篇文章说永远不要把v-for和v-if同时用在同一个元素上,感觉有点瞎扯,官网也注明了可以一起使用的,还把两个指令的优 ...
试题基础练习 Huffuman树
试题基础练习 Huffuman树试题基础练习 Huffuman树翻了翻网上,基本都是暴力排序.我就提供一个最小堆的写法吧! 点击这里,跳转查看最小堆插入删除函数的简单写法 Talk i ...
【转载】sql-builder介绍
原文链接:sql-builder介绍关于sql-builder sql-builder尝试使用java对象,通过类SQL的拼接方式,动态快速的生成SQL.它可作为稍后的开源项目ibit-mybati ...
Git操作：查看所有分支的提交修改
我们在廖雪峰Git教程或者一些书籍学习git分支时,大都会学习到这样一个命令git log --graph或者就是单纯的git log,他可以用来查看当前分支.但是这个弊端就是:它只能查看与当前分支有 ...
如何在Mac和Windows PC之间无线共享文件
有时候,我需要在Mac和PC之间无线共享文件.由于并非所有人都在使用macOS,因此无论是在办公室还是在家里,这种情况都会发生.尽管并非一帆风顺,但有一种无需任何第三方应用程序即可弥合差距的方法. 根 ...
hash类型的应用场景 —— Redis实战经验
hash类型是一个string类型的field和value的映射表,每个 hash 可以存储 232 - 1 键值对(40多亿),hash类型主要有以下应用场景. 1. 购物车以用户id为key,商 ...
jsonArray jsonString list<Object> 之间转换
1.示例: package com.test.demo.pojo; import lombok.Data; import lombok.experimental.Accessors; /** * @p ...
剑指offer-拓展训练-N皇后的问题-全排列
/* 题目: N皇后的问题. */ /* 思路: 全排列. 声明一个具有N个元素的数组curr,每个下标i(0>i>n)代表行,每个curr[i]代表列,所以初始化为curr[i] = i ...

查看Spark与Hadoop等其他组件的兼容版本

查看Spark与Hadoop等其他组件的兼容版本的更多相关文章

随机推荐

热门专题