Spark（五十三）：Spark RPC初尝试使用

基本用法主要掌握一点就行：

master slave模式运用：driver 就是master，executor就是slave。

如果executor要想和driver交互必须拿到driver的EndpointRef，通过driver的EndpointRef来调接口访问。

driver启动时，会在driver中注册一个Endpoint服务，并暴露自己的ip和端口。executor端生成driver的EndpointRef，就主要需要两个参数就行：driver的host(ip)和port。

导入Maven依赖

        <dependency>

            <groupId>org.apache.spark</groupId>

            <artifactId>spark-core_2.11</artifactId>

            <version>2.4.0</version>

        </dependency>

定义RPC Server端的ip（localhost）。port(57992)、服务名称(hello-rpc-service)

object HelloRpcSettings {

  val rpcName = "hello-rpc-service"

  val port = 57992

  val hostname="localhost"

  def getName() = {

    rpcName

  }

  def getPort(): Int = {

    port

  }

  def getHostname():String={

    hostname

  }

}

定义RPC的Endpoint类和发送数据类SayHi/SayBye

case class SayHi(msg: String)

case class SayBye(msg: String)

import org.apache.spark.rpc.{RpcCallContext, RpcEndpoint, RpcEnv}

class HelloEndpoint(override val rpcEnv: RpcEnv) extends RpcEndpoint {

  override def onStart(): Unit = {

    println(rpcEnv.address)

    println("start hello endpoint")

  }

  override def receive: PartialFunction[Any, Unit] = {

    case SayHi(msg) =>

      println(s"receive $msg" )

  }

  override def receiveAndReply(context: RpcCallContext): PartialFunction[Any, Unit] = {

    case SayHi(msg) => {

      println(s"receive $msg")

      context.reply(s"hi, $msg")

    }

    case SayBye(msg) => {

      println(s"receive $msg")

      context.reply(s"bye, $msg")

    }

  }

  override def onStop(): Unit = {

    println("stop hello endpoint")

  }

}

定义RPC 服务提供者

import org.apache.spark.{SecurityManager, SparkConf, SparkContext, SparkEnv}

import org.apache.spark.rpc._

import org.apache.spark.sql.SparkSession

object RpcServerTest {

  def main(args: Array[String]): Unit = {

    val conf: SparkConf = new SparkConf()

    val sparkSession = SparkSession.builder().config(conf).master("local[*]").appName("test rpc").getOrCreate()

    val sparkContext: SparkContext = sparkSession.sparkContext

    val sparkEnv: SparkEnv = sparkContext.env

    val rpcEnv = RpcEnv.create(HelloRpcSettings.getName(), HelloRpcSettings.getHostname(), HelloRpcSettings.getHostname(), HelloRpcSettings.getPort(), conf,

      sparkEnv.securityManager, 1, false)

    val helloEndpoint: RpcEndpoint = new HelloEndpoint(rpcEnv)

    rpcEnv.setupEndpoint(HelloRpcSettings.getName(), helloEndpoint)

    rpcEnv.awaitTermination()

  }

}

定义RPC服务使用者

import org.apache.spark.{SecurityManager, SparkConf, SparkContext, SparkEnv}

import org.apache.spark.rpc.{RpcAddress, RpcEndpointRef, RpcEnv, RpcEnvConfig}

import org.apache.spark.sql.{Dataset, Row, SparkSession}

import scala.concurrent.duration.Duration

import scala.concurrent.{Await, Future}

object RpcClientTest {

  def main(args: Array[String]): Unit = {

    val conf: SparkConf = new SparkConf()

    val sparkSession = SparkSession.builder().config(conf).master("local[*]").appName("test rpc").getOrCreate()

    val sparkContext: SparkContext = sparkSession.sparkContext

    val sparkEnv: SparkEnv = sparkContext.env

    val rpcEnv: RpcEnv = RpcEnv.create(HelloRpcSettings.getName(),HelloRpcSettings.getHostname(),HelloRpcSettings.getPort(),conf,sparkEnv.securityManager,false)

    val endPointRef: RpcEndpointRef = rpcEnv.setupEndpointRef(RpcAddress(HelloRpcSettings.getHostname(), HelloRpcSettings.getPort()), HelloRpcSettings.getName())

    import scala.concurrent.ExecutionContext.Implicits.global

    endPointRef.send(SayHi("test send"))

    val future: Future[String] = endPointRef.ask[String](SayHi("neo"))

    future.onComplete {

      case scala.util.Success(value) => println(s"Got the result = $value")

      case scala.util.Failure(e) => println(s"Got error: $e")

    }

    Await.result(future, Duration.apply("30s"))

    val res = endPointRef.askSync[String](SayBye("test askSync"))

    println(res)

    sparkSession.stop()

  }

}

启动RPC 服务提供者

Using Spark's default log4j profile: org/apache/spark/log4j-defaults.properties

// :: INFO SparkContext: Running Spark version 2.4.

// :: WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable

// :: INFO SparkContext: Submitted application: test rpc

// :: INFO SecurityManager: Changing view acls to: boco

// :: INFO SecurityManager: Changing modify acls to: boco

// :: INFO SecurityManager: Changing view acls groups to:

// :: INFO SecurityManager: Changing modify acls groups to:

// :: INFO SecurityManager: SecurityManager: authentication disabled; ui acls disabled; users  with view permissions: Set(boco); groups with view permissions: Set(); users  with modify permissions: Set(boco); groups with modify permissions: Set()

// :: INFO Utils: Successfully started service 'sparkDriver' on port .

// :: INFO SparkEnv: Registering MapOutputTracker

// :: INFO SparkEnv: Registering BlockManagerMaster

// :: INFO BlockManagerMasterEndpoint: Using org.apache.spark.storage.DefaultTopologyMapper for getting topology information

// :: INFO BlockManagerMasterEndpoint: BlockManagerMasterEndpoint up

// :: INFO DiskBlockManager: Created local directory at C:\Users\boco\AppData\Local\Temp\blockmgr-7128dde8-9c46--bb72-c2161ba65bf7

// :: INFO MemoryStore: MemoryStore started with capacity 901.8 MB

// :: INFO SparkEnv: Registering OutputCommitCoordinator

// :: INFO Utils: Successfully started service 'SparkUI' on port .

// :: INFO SparkUI: Bound SparkUI to 0.0.0.0, and started at http://DESKTOP-JL4FSCV:4040

// :: INFO Executor: Starting executor ID driver on host localhost

// :: INFO Utils: Successfully started service 'org.apache.spark.network.netty.NettyBlockTransferService' on port .

// :: INFO NettyBlockTransferService: Server created on DESKTOP-JL4FSCV:

// :: INFO BlockManager: Using org.apache.spark.storage.RandomBlockReplicationPolicy for block replication policy

// :: INFO BlockManagerMaster: Registering BlockManager BlockManagerId(driver, DESKTOP-JL4FSCV, , None)

// :: INFO BlockManagerMasterEndpoint: Registering block manager DESKTOP-JL4FSCV: with 901.8 MB RAM, BlockManagerId(driver, DESKTOP-JL4FSCV, , None)

// :: INFO BlockManagerMaster: Registered BlockManager BlockManagerId(driver, DESKTOP-JL4FSCV, , None)

// :: INFO BlockManager: Initialized BlockManager: BlockManagerId(driver, DESKTOP-JL4FSCV, , None)

// :: INFO Utils: Successfully started service 'hello-rpc-service' on port .

localhost:

start hello endpoint

启动RPC 服务使用者

Using Spark's default log4j profile: org/apache/spark/log4j-defaults.properties

// :: INFO SparkContext: Running Spark version 2.4.

// :: WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable

// :: INFO SparkContext: Submitted application: test rpc

// :: INFO SecurityManager: Changing view acls to: boco

// :: INFO SecurityManager: Changing modify acls to: boco

// :: INFO SecurityManager: Changing view acls groups to:

// :: INFO SecurityManager: Changing modify acls groups to:

// :: INFO SecurityManager: SecurityManager: authentication disabled; ui acls disabled; users  with view permissions: Set(boco); groups with view permissions: Set(); users  with modify permissions: Set(boco); groups with modify permissions: Set()

// :: INFO Utils: Successfully started service 'sparkDriver' on port .

// :: INFO SparkEnv: Registering MapOutputTracker

// :: INFO SparkEnv: Registering BlockManagerMaster

// :: INFO BlockManagerMasterEndpoint: Using org.apache.spark.storage.DefaultTopologyMapper for getting topology information

// :: INFO BlockManagerMasterEndpoint: BlockManagerMasterEndpoint up

// :: INFO DiskBlockManager: Created local directory at C:\Users\boco\AppData\Local\Temp\blockmgr-6a0b8e7f-86d2-4bb8-b45c-7c04deabcb91

// :: INFO MemoryStore: MemoryStore started with capacity 901.8 MB

// :: INFO SparkEnv: Registering OutputCommitCoordinator

// :: WARN Utils: Service 'SparkUI' could not bind on port . Attempting port .

// :: INFO Utils: Successfully started service 'SparkUI' on port .

// :: INFO SparkUI: Bound SparkUI to 0.0.0.0, and started at http://DESKTOP-JL4FSCV:4041

// :: INFO Executor: Starting executor ID driver on host localhost

// :: INFO Utils: Successfully started service 'org.apache.spark.network.netty.NettyBlockTransferService' on port .

// :: INFO NettyBlockTransferService: Server created on DESKTOP-JL4FSCV:

// :: INFO BlockManager: Using org.apache.spark.storage.RandomBlockReplicationPolicy for block replication policy

// :: INFO BlockManagerMaster: Registering BlockManager BlockManagerId(driver, DESKTOP-JL4FSCV, , None)

// :: INFO BlockManagerMasterEndpoint: Registering block manager DESKTOP-JL4FSCV: with 901.8 MB RAM, BlockManagerId(driver, DESKTOP-JL4FSCV, , None)

// :: INFO BlockManagerMaster: Registered BlockManager BlockManagerId(driver, DESKTOP-JL4FSCV, , None)

// :: INFO BlockManager: Initialized BlockManager: BlockManagerId(driver, DESKTOP-JL4FSCV, , None)

// :: WARN Utils: Service 'hello-rpc-service' could not bind on port . Attempting port .

// :: INFO Utils: Successfully started service 'hello-rpc-service' on port .

// :: INFO TransportClientFactory: Successfully created connection to localhost/127.0.0.1: after  ms ( ms spent in bootstraps)

bye, test askSync

Got the result = hi, neo

// :: INFO SparkUI: Stopped Spark web UI at http://DESKTOP-JL4FSCV:4041

// :: INFO MapOutputTrackerMasterEndpoint: MapOutputTrackerMasterEndpoint stopped!

// :: INFO MemoryStore: MemoryStore cleared

// :: INFO BlockManager: BlockManager stopped

// :: INFO BlockManagerMaster: BlockManagerMaster stopped

// :: INFO OutputCommitCoordinator$OutputCommitCoordinatorEndpoint: OutputCommitCoordinator stopped!

// :: INFO SparkContext: Successfully stopped SparkContext

// :: INFO ShutdownHookManager: Shutdown hook called

// :: INFO ShutdownHookManager: Deleting directory

此时 RPC 服务提供者打印信息如下：

receive test send

receive neo

receive test askSync

// :: WARN TransportChannelHandler: Exception in connection from /127.0.0.1:

java.io.IOException: 远程主机强迫关闭了一个现有的连接。

    at sun.nio.ch.SocketDispatcher.read0(Native Method)

    at sun.nio.ch.SocketDispatcher.read(SocketDispatcher.java:)

    at sun.nio.ch.IOUtil.readIntoNativeBuffer(IOUtil.java:)

    at sun.nio.ch.IOUtil.read(IOUtil.java:)

    at sun.nio.ch.SocketChannelImpl.read(SocketChannelImpl.java:)

    at io.netty.buffer.PooledUnsafeDirectByteBuf.setBytes(PooledUnsafeDirectByteBuf.java:)

    at io.netty.buffer.AbstractByteBuf.writeBytes(AbstractByteBuf.java:)

    at io.netty.channel.socket.nio.NioSocketChannel.doReadBytes(NioSocketChannel.java:)

    at io.netty.channel.nio.AbstractNioByteChannel$NioByteUnsafe.read(AbstractNioByteChannel.java:)

    at io.netty.channel.nio.NioEventLoop.processSelectedKey(NioEventLoop.java:)

    at io.netty.channel.nio.NioEventLoop.processSelectedKeysOptimized(NioEventLoop.java:)

    at io.netty.channel.nio.NioEventLoop.processSelectedKeys(NioEventLoop.java:)

    at io.netty.channel.nio.NioEventLoop.run(NioEventLoop.java:)

    at io.netty.util.concurrent.SingleThreadEventExecutor$.run(SingleThreadEventExecutor.java:)

    at io.netty.util.concurrent.DefaultThreadFactory$DefaultRunnableDecorator.run(DefaultThreadFactory.java:)

    at java.lang.Thread.run(Thread.java:)

Spark（五十三）：Spark RPC初尝试使用的更多相关文章

Spark学习之路（五）Spark伪分布式安装
一.JDK的安装 JDK使用root用户安装 1.1 上传安装包并解压 [root@hadoop1 soft]# tar -zxvf jdk-8u73-linux-x64.tar.gz -C /usr ...
Spark（五） -- Spark Streaming介绍与基本执行过程
Spark Streaming作为Spark上的四大子框架之一,肩负着实时流计算的重大责任而相对于另外一个当下十分流行的实时流计算处理框架Storm,Spark Streaming有何优点?又有何不 ...
Spark2.2（三十三）：Spark Streaming和Spark Structured Streaming更新broadcast总结（一）
背景: 需要在spark2.2.0更新broadcast中的内容,网上也搜索了不少文章,都在讲解spark streaming中如何更新,但没有spark structured streaming更新 ...
Spark入门（五）--Spark的reduce和reduceByKey
reduce和reduceByKey的区别 reduce和reduceByKey是spark中使用地非常频繁的,在字数统计中,可以看到reduceByKey的经典使用.那么reduce和reduceB ...
【Spark 内核】 Spark 内核解析-上
Spark内核泛指Spark的核心运行机制,包括Spark核心组件的运行机制.Spark任务调度机制.Spark内存管理机制.Spark核心功能的运行原理等,熟练掌握Spark内核原理,能够帮助我们更 ...
【Spark 内核】 Spark 内核解析-下
Spark内核泛指Spark的核心运行机制,包括Spark核心组件的运行机制.Spark任务调度机制.Spark内存管理机制.Spark核心功能的运行原理等,熟练掌握Spark内核原理,能够帮助我们更 ...
初步了解Spark生态系统及Spark Streaming
一. 场景 ◆ Spark[4]: Scope: a MapReduce-like cluster computing framework designed for low-laten ...
R语言爬虫初尝试-基于RVEST包学习
注意:这文章是2月份写的,拉勾网早改版了,代码已经失效了,大家意思意思就好,主要看代码的使用方法吧.. 最近一直在用且有维护的另一个爬虫是KINDLE 特价书爬虫,blog地址见此: http://w ...
【译】Spark官方文档——Spark Configuration（Spark配置）
注重版权,尊重他人劳动转帖注明原文地址:http://www.cnblogs.com/vincent-hv/p/3316502.html Spark主要提供三种位置配置系统: 环境变量:用来启动 ...

随机推荐

【Jmeter】他人总结篇链接（共八篇相关文章）
[Jmeter]他人总结篇链接(共八篇相关文章) https://blog.csdn.net/mu_wind/article/category/9029006
Jmeter学习笔记（二十三）——生成HTML性能报告
有时候我们写性能报告的时候需要一些性能分布图,JMeter是可以生成HTML性能报告的.这篇博客,简单介绍下在利用jmeter进行性能测试时,是如何生成HTML的可视化测试报告的一.准备工作 1:j ...
存储管理器 S3C2440A
CPU通过存储管理器来控制外部设备 SDRAM存储结构 S3C2440A内存控制器原理图 HY57V561620(L)T 4Banks x 4M x 16Bit Synchronous DRAM S ...
深入理解jvm--性能监控工具
1.jvm监控工具介绍 1.1.jconsole JConsole是一个基于JMX的GUI工具,用于连接正在运行的JVM,不过此JVM需要使用可管理的模式启动. 1.2.启动jconsole 通过JD ...
vue-cli 移动端项目如何在手机上调试预览
这里分享下如何在webpack工具构建下的vue项目,在手机端调试和预览,言归正传. 1.电脑和手机连接到同一个WIFI a.台式电脑和手机同时链接一个路由器,使用同一个wifi: b.笔记本也可以直 ...
C#-将照片存入到SQL SERVER
将存照片的字段设为image类型. using System; using System.Collections.Generic; using System.ComponentModel; using ...
vmstat 内存信息
vmstat - Report virtual memory statistics 报告虚拟内存统计信息. 展示的信息可以用做系统资源监控. 语法格式: vmstat [options] [delay ...
jquery对象转成dom对象
jQuery库本质上还是JavaScript代码,它只是对JavaScript语言进行包装处理,为的是提供更好更方便快捷的DOM处理与开发中经常使用的功能.我们使用jQuery的同时也能混合Java ...
[Reprint] Difference Between Job, Work, And Career
https://www.espressoenglish.net/difference-between-job-work-and-career/ A lot of English learners co ...
由Catalan数所引出的
百度一番: 历史 ·1758年,Johann Segner 给出了欧拉问题的递推关系: ·1838年,研究热潮: –GabrielLame给出完整证明和简洁表达式: –EugèneCharlesCat ...