使用IDEA运行Spark程序

毛小娃 2024-10-18 20:30:04 原文

使用IDEA运行Spark程序

1.安装IDEA

从IDEA官网下载Community版本，解压到/usr/local/idea目录下。

tar –xzf ideaIC-13.1.4b.tar.gz

mv idea-IC-135.1230/ /usr/local/idea

为了方便使用其bin目录下的命令，把它配置在“/etc/profile”目录下。

export PATH=$PATH:/usr/local/idea/ idea-IC-135.1230/bin

2.安装Scala插件

1. 在终端输入idea.sh进入如下界面：

2. 点击”Configure”进入IDEA的配置界面：

3. 选择“Plugins”,进入插件安装界面：

4. 点击左下角的“Install JetBrains plugin”选项进入如下界面在左上方的输入框输入“scala”来查找scala插件，点击右侧的“Install plugin”开始下载插件：

5. 安装完后重启IDEA:

3.使用scala SBT工程

1. 重启之后进入如下界面，选择“Create New Project”,选择左侧列表中的“Scala”选项，为了方便以后的开发，选择右侧的“SBT”选项：

2. 设置scala工程的名称和目录，点击Finish：

3. 此时发现没有设置Java的JDK路径，点击进入ProjectStructure目录，点击New，选择JDK路径后，关闭后重新打开项目：

4. 此时IDEA会智能的帮助我们构建SBT工具，IDEA自动完成SBT工具的安装需要一段时间（1-2分钟），SBT会自动帮我们建好一些目录：

5. 点击src下的main下的scala在弹出的“New”下选择“Scala Class，输入文件名称并选择类型:

6. 写入代码：

7. 右击代码区点击运行，第一次运行scala程序会有点缓慢：

8. 运行的结果如下：

4.搭建Spark运行环境

1.导入Spark的包，依次点击File -> Project Structure ->Libraries ->点击“+”号 ->选择Java -> 选择spark lib目录下的assembly包

IDEA工作完后发现Spark的jar包导入到我们的工程中

5.运行Spark程序

1.我们这里采用standalone模式运行wordcount作代码演示。数据从hdfs读取，代码如下。

2. 下面描述如何打jar包：

配置路径和包名

之后便可在集群上运行spark程序。

注：每次修改代码后都要rebuild jar包。

使用IDEA运行Spark程序的更多相关文章

eclipse运行spark程序时日志颜色为黑色的解决办法
自从开始学习spark计算框架以来,我们老师教的是local模式下用eclipse运行spark程序,然后我在运行spark程序时,发现控制台的日志颜色总是显示为黑色,哇,作为程序猿总有一种强迫症,发 ...
Hadoop：开发机运行spark程序，抛出异常：ERROR Shell: Failed to locate the winutils binary in the hadoop binary path
问题: windows开发机运行spark程序,抛出异常:ERROR Shell: Failed to locate the winutils binary in the hadoop binary ...
如何在本地使用scala或python运行Spark程序
如何在本地使用scala或python运行Spark程序包含两个部分: 本地scala语言编写程序,并编译打包成jar,在本地运行. 本地使用python语言编写程序,直接调用spark的接口, ...
如何运行Spark程序
[hxsyl@CentOSMaster spark-2.0.2-bin-hadoop2.6]# ./bin/spark-submit --class org.apache.spark.examples ...
luigi框架--关于python运行spark程序
首先,目标是写个python脚本,跑spark程序来统计hdfs中的一些数据.参考了别人的代码,故用了luigi框架. 至于luigi的原理底层的一些东西Google就好.本文主要就是聚焦快速使用, ...
运行Spark程序的几种模式
一. local 模式 -- 所有程序都运行在一个JVM中,主要用于开发时测试无需开启任何服务,可直接运行 ./bin/run-example 或 ./bin/spark-submit 如: ...
在Windows上运行Spark程序
一.下载Saprk程序 https://d3kbcqa49mib13.cloudfront.net/spark-2.1.1-bin-hadoop2.7.tgz 解压到d:\spark-2.1.1-bi ...
spark学习14（spark local模式运行spark程序的报错）
报错1 java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries. 解 ...
记一次运行spark程序遇到的权限问题
设置回滚点在本地运行时正常,在集群时就报错,后来是发现ceshi这个目录其他用户没有写的权限,修改其他用户的权限就好了 hdfs dfs - /ceshi

随机推荐

hihocoder 1391 树状数组
#1391 : Countries 时间限制:1000ms 单点时限:1000ms 内存限制:256MB 描述 There are two antagonistic countries, countr ...
hdu 5274 树链剖分
Dylans loves tree Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/Othe ...
SPOJ NSUBSTR
You are given a string S which consists of 250000 lowercase latin letters at most. We define F(x) as ...
Mianbot:基于向量匹配的情境式聊天机器人
Mianbot是采用样板与检索式模型搭建的聊天机器人,目前有两种产生回覆的方式,专案仍在开发中:) 其一(左图)是以词向量进行短语分类,针对分类的目标模组实现特征抽取与记忆回覆功能,以进行多轮对话,匹 ...
Mysql锁机制--写锁
Mysql 系列文章主页 =============== 1 准备数据 1.1 建表 1.1.1 建立 Employee表 DROP TABLE IF EXISTS employee; CREATE ...
RestTemplate的异常：Not enough variables available to expand
原因:RestTemplate使用出错,我的情况是不知道这里要求用RestTemplate的使用格式,应该很多人都是这样吧?不过,看了下RestTemplate,感觉其实还是很好用的. RestTem ...
Python学习--课本程序练习（周更）
1.绘制正方形螺旋线 import turtle turtle.setup(600,300,200,200) turtle.pensize(1) turtle.color('green') i=0 w ...
Nginx 安装配置使用
Nginx 安装配置使用基本的HTTP服务器特性处理静态文件,索引文件以及自动索引:打开文件描述符缓存(缓存元数据和文件描述符,下一次可以直接从内存找到数据或者文件的位置): 使用缓存加速反向 ...
Go 处理yaml类型的配置文件
先说一下,这里用到了很多关于反射类型的功能,可能刚开始看代码,如果对反射不熟悉的可能会不是非常清晰,但是同时也是为了更好的理解golang中的反射,同时如果后面想在代码中可以直接从我的git地址get ...
常见常用的CSS
字体属性:(font) 大小 {font-size: x-large;}(特大) xx-small;(极小) 一般中文用不到,只要用数值就可以,单位:PX.PD 样式 {font-style: obl ...