IDEA开发Spark的漫漫摸索（一）

系统：Win10

01 安装IDEA

IDEA版本：IntelliJ IDEA 2017.2.1 64位

使用的学生授权下载的ultimate版本，此处不赘叙安装过程。

02安装编译环境

Spark可以通过Maven和SBT两种方式进行编译，再通过make-distribution.sh脚本生成部署包。考虑到更适用于java语言，选择Maven进行编译。Maven方式编译需要Maven工具，且需要在联网状态下载依赖包。

先在Apache官网下载相应的Maven压缩包，我下载的是apche-maven-3.5.0-bin.zip，在想要安装的位置将压缩包解压。压缩包里面有一个READ.ME文档，我没按那个操作来，直接百度的安装教程来的。

虽然说是安装教程，但实际上只是将整个文件夹放在想放的位置，再配置一下环境变量。

需要配置的环境变量有两个。

新加一个环境变量，命名为M2_HOME,值就是解压的文件夹路径，比如我的是D:\Program Files\apache-maven-3.5.0。

找到另外一个环境变量Path，在后面加上一个值 %M2_HOME%\bin;

关于环境变量，需要提出注意的：一个是不要把之前的值删掉了，我第一次自己配环境就把前面的值删掉了，结果很麻烦才弄好。再就是，win7和win10的显示有所不同，win7的要注意值后面的；千万不能掉，win10每个值的单独的，后面不用加；。

在环境变量配置结束后，要来测试一下环境是否配置成功。测试的方法就是通过cmd调出命令提示符窗口，输入mvn -v 查看。

得到如图结果则说明Maven安装成功。

使用命令mvn help:system 会下载相应的包到本地仓库。

随后将下载好的Maven配置到IDEA中，File→Setting→Build,Execution,Deployment→Build Tools→Maven，点击Maven home directory选择刚才安装的Maven。

03 配置JDK

jdk版本：jdk1.8.0_31

这是在安装IDEA中创建的第一个项目。先前已经安装过JDK，但是此处IDEA不能自动识别，‘’Project SDK‘’后显示“no SDK”。所以，在此处选择手动加入。点击右上角的"New..."来查找JDK所在的位置，然后将整个JDK的包加入，就可以了。

可能由于版本或者其他的原因，有的时候不会在创建项目的时候就要求必须配置JDK。在这种情况下，我们可以选择File——>Project Structure进行配置设置界面。

Platform Setteings/SDKs 中间那栏显示的是已经配置好的JDK，如果想要加入新的JDK，就点击中间栏上方的“+”来添加。

也可以在Project Settings/Project 处，找到Project SDK,点击“New...”来实现JDK的添加。

04 安装Scala插件

IDEA默认情况下没有安装Scala插件，需要手动进行安装。选择File→Settings→Plugins，出现如下界面：

先点击Install JetBrains plugins，接着在插件的搜索栏里输入“scala”，出现搜索结果，选择scala，点击“Install”进行安装。（图中我已经提前完成安装，所以没有Installa按钮）

IDEA开发Spark的漫漫摸索（一）的更多相关文章

IDEA开发Spark的漫漫摸索（二）
1 新建Maven项目特别提醒,Maven项目中有GropId和ArtifactId.GroupId是项目组织唯一的标识符,实际对应JAVA的包的结构,是main目录里java的目录结构.一般Gru ...
使用scala开发spark入门总结
使用scala开发spark入门总结一.spark简单介绍关于spark的介绍网上有很多,可以自行百度和google,这里只做简单介绍.推荐简单介绍连接:http://blog.jobbole.c ...
利用Scala语言开发Spark应用程序
Spark内核是由Scala语言开发的,因此使用Scala语言开发Spark应用程序是自然而然的事情.如果你对Scala语言还不太熟悉,可以阅读网络教程A Scala Tutorial for Ja ...
IDEA搭建scala开发环境开发spark应用程序
通过IDEA搭建scala开发环境开发spark应用程序一.idea社区版安装scala插件因为idea默认不支持scala开发环境,所以当需要使用idea搭建scala开发环境时,首先需要安 ...
windows下Idea结合maven开发spark和本地调试
本人的开发环境: 1.虚拟机centos 6.5 2.jdk 1.8 3.spark2.2.0 4.scala 2.11.8 5.maven 3.5.2 在开发和搭环境时必须注意版本兼容的问题 ...
使用IDEA开发SPARK提交remote cluster执行
开发环境操作系统:windows 开发工具:IntelliJ IDEA 14.1.1 需要安装scala插件编译环境:jdk 1.7 scala 2.10.4 使用IDEA开发spark应用 ...
FusionInsight大数据开发---Spark应用开发
Spark应用开发要求: 了解Spark基本原理搭建Spark开发环境开发Spark应用程序调试运行Spark应用程序 YARN资源调度,可以和Hadoop集群无缝对接 Spark适用场景大多 ...
【机器学习之一】python开发spark环境搭建
环境 spark-1.6 python3.5 一.python开发spark原理使用python api编写pyspark代码提交运行时,为了不破坏spark原有的运行架构,会将写好的代码首先在pyt ...
Spark&Hive：如何使用scala开发spark访问hive作业，如何使用yarn resourcemanager。
背景: 接到任务,需要在一个一天数据量在460亿条记录的hive表中,筛选出某些host为特定的值时才解析该条记录的http_content中的经纬度: 解析规则譬如: 需要解析host: api.m ...

随机推荐

JAVA堆内存和栈内存初步了解
一.堆内存和栈内存程序运行时内存分配有三种:静态存储分配,栈式存储分配,堆式存储分配 1.静态存储分配: 在程序编译时就可以确定数据目标在运行时所需要的内存,因此在编译时就为其分配固定大小的内存. ...
linux命令学习笔记（39）：grep 命令
Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来. grep全称是Global Regular Expression Print,表示全局正则表 ...
freeMarker（四）——模板开发指南之模板
学习笔记,选自freeMarker中文文档,译自 Email: ddekany at users.sourceforge.net 模板开发指南之模板 1. 总体结构实际上用程序语言编写的程序就是模板 ...
windows下用vs2010编译ffmpeg
转载自;http://q1q2q3q4q5q6ln.blog.163.com/blog/static/500794332014666536283/ (注意:请务必先阅读:七,后记补充:) ffmpeg ...
洛谷【P1303】A*B Problem
题目传送门:https://www.luogu.org/problemnew/show/P1303 高精度乘法板子题,灵性地回忆一下小学时期列竖式的草稿纸即可. 时间复杂度:\(O(len^2)\) ...
bzoj 3144 切糕 —— 最小割
题目:https://www.lydsy.com/JudgeOnline/problem.php?id=3144 每个点拆成 R 个,连成一条链,边上是权值,割掉代表选这一层: 然后每个点的第 t 层 ...
块级&行内元素总结
一.块级元素与行内元素的区别块级元素与行内元素有几个关键区别: 格式默认情况下: 块级元素会新起一行: 行内元素不会以新行开始. 内容模型一般块级元素可以包含行内元素和其他块级元素.这种结构上的 ...
关于 sklearn.decomposition.KernelPCA的简单介绍
from sklearn import decomposition import numpy as np A1_mean = [1, 1] A1_cov = [[2, .99], [1, 1]] A1 ...
如何在niosII中添加i2c外设_winday_新浪博客
如何在niosII中添加i2c外设_winday_新浪博客如何在niosII中添加i2c外设 winday 摘要:本文说明了如何在niosII添加第三方i2c外设,以供参考. 由于本人使用的Alte ...
.net 缓存之数据库缓存依赖
当监听的指定数据库内容某张表变化时就更新缓存先来配置数据库,启动监听服务(SQL2008下) 执行如下语句: ALTER DATABASE OumindBlog SET NEW_BROKER WIT ...

IDEA开发Spark的漫漫摸索（一）

IDEA开发Spark的漫漫摸索（一）的更多相关文章

随机推荐

热门专题