1.构建master的actor

package SparkRPC

import akka.actor.{Actor, ActorSystem, Props}
import com.typesafe.config.ConfigFactory

import scala.collection.mutable

/**
* Created by hqs on 2018/1/24.
* 1.启动master,启动worker
* 2.worker启动后连接master,发送注册消息(封装起来)
* 3.master受到注册消息并保存,返回注册成功消息给worker
* 4.worker启动一个定时任务,发送心跳给master(先发送给自己,在发送给master)
* 5.master接收心跳消息,更新保存的心跳信息
*
* 6.master主动启动一个定时任务,检查心跳时间是否超过设定值,若超过,则删除worker的注册信息。
*/
class Master extends Actor {

private val workerMp: mutable.HashMap[String, WorkerInfo] = new mutable.HashMap[String, WorkerInfo]()

override def preStart(): Unit = {
//启动定时任务去检查是否有死去的worker
import scala.concurrent.duration._
import context.dispatcher
context.system.scheduler.schedule(0 second, 15 second, self, CheckWorker)
}

override def receive: Receive = {
case "start" => println("master start...")
//接收并注册,返回成功消息。
case Register2Master(workerId, cores, memory) => {
workerMp(workerId) = new WorkerInfo(cores, memory)
println(s"add a worker,workerId = ${workerId}")
println(s"now total workers = ${workerMp.size}")
sender() ! RegisSuccess
}
//接收心跳,更新信息
case HeartBeat(workerId) => {
if (workerMp.contains(workerId)) {
workerMp(workerId).lastloginTime = System.currentTimeMillis()
}
}
case CheckWorker => {
//过滤出已经超时的worker,大于两个心跳认为超时。
val deadWorkers = workerMp.filter({
mp => {
System.currentTimeMillis() - mp._2.lastloginTime > 20 * 1000
}
})
//用一个map来减去另外一个map
workerMp --= deadWorkers.map(mp => mp._1)
println(s"now total workers = ${workerMp.size}")
}
}
}

object Master {

val MASTER_ACS_NAME = "master_acs_name"
val MASTER_AC_NAME = "master_ac_name"

def main(args: Array[String]): Unit = {

if (args.length != 2) {
println("Master <masterIp,masterPort>")
sys.exit()
}

val Array(masterIp, masterPort) = args
val str =
s"""
|akka.actor.provider = "akka.remote.RemoteActorRefProvider"
|akka.remote.netty.tcp.hostname = "${masterIp}"
|akka.remote.netty.tcp.port = "${masterPort}"
""".stripMargin
val conf = ConfigFactory.parseString(str)
val acs: ActorSystem = ActorSystem.create(MASTER_ACS_NAME, conf)
val masterRef = acs.actorOf(Props(new Master), MASTER_AC_NAME)

masterRef ! "start"

}
}

2.构建worker的actor

package SparkRPC

import java.util.UUID

import akka.actor.{Actor, ActorSelection, ActorSystem, Props}
import com.typesafe.config.ConfigFactory

/**
* Created by hqs on 2018/1/24.
*/
class Worker(val masterIp:String,val masterPort:Int,val cores:Int,val memory:Int) extends Actor{
val workerId = UUID.randomUUID().toString
var masSele: ActorSelection = null
//注册worker信息
override def preStart(): Unit = {
//取得master的路径
val path = s"akka.tcp://${Master.MASTER_ACS_NAME}@${masterIp}:${masterPort}/user/${Master.MASTER_AC_NAME}"
masSele = context.actorSelection(path)
masSele ! Register2Master(workerId,cores,memory)
}

override def receive: Receive = {
case "start" => println("worker starting")
//发送定时心跳信息
case RegisSuccess => {
println("success start scheduler")
/**
* initialDelay: FiniteDuration, 延迟时间 延迟启动定时任务的时间
* interval: FiniteDuration, 间隔时间 每隔多长时间
* receiver: ActorRef, 信息发给谁 接收方
* message: Any 发送的信息 封装成case class
*/
//导入时间单位,启动定时任务。
import scala.concurrent.duration._
import context.dispatcher
context.system.scheduler.schedule(0 second,10 second,self,SendHeartBeat)
}
case SendHeartBeat => {
masSele ! HeartBeat(workerId)
println("worker 向 master 发送心跳信息...")
}
}
}
object Worker{

val WORKER_ACS_NAME = "worker_acs_name"
val WORKER_AC_NAME = "worker_ac_name"
def main(args: Array[String]): Unit = {

if(args.length != 6){
println("Worker <masterIp,masterPort,workerIp,workerPort,cores,memory>")
sys.exit()
}
val Array(masterIp,masterPort,workerIp,workerPort,cores,memory) = args

val str =
s"""
|akka.actor.provider = "akka.remote.RemoteActorRefProvider"
|akka.remote.netty.tcp.hostname = "${workerIp}"
|akka.remote.netty.tcp.port = "${workerPort}"
""".stripMargin
val conf = ConfigFactory.parseString(str)
val acs = ActorSystem.create(WORKER_ACS_NAME,conf)
val scRef = acs.actorOf(Props(new Worker(masterIp,masterPort.toInt,cores.toInt,memory.toInt)),WORKER_AC_NAME)

scRef ! "start"
}
}

3.master与worker的消息传递封装

package SparkRPC

/**
* Created by hqs on 2018/1/27.
*/
class Message {

}
//worker发送注册消息
case class Register2Master(workerId:String,cores:Int,memory:Int)
//master返回注册成功的消息
case object RegisSuccess
//发送心跳给自己
case object SendHeartBeat
//发送心跳给master
case class HeartBeat(workerId:String)
//master定时检查worker存活状态
case object CheckWorker

4.总结:master与worker依赖于akka的actor来实现通信。会产生定时心跳任务,检查超时的worker。

Spark中master与worker的进程RPC通信实现的更多相关文章

  1. 【原】Spark中Master源码分析(二)

    继续上一篇的内容.上一篇的内容为: Spark中Master源码分析(一) http://www.cnblogs.com/yourarebest/p/5312965.html 4.receive方法, ...

  2. <spark> error:启动spark后查看进程,进程中master和worker进程冲突

    启动hadoop再启动spark后jps,发现master进程和worker进程同时存在,调试了半天配置文件. 测试发现,当我关闭hadoop后 worker进程还是存在, 但是,当我再关闭spark ...

  3. 【原】Spark中Master源码分析(一)

    Master作为集群的Manager,对于集群的健壮运行发挥着十分重要的作用.下面,我们一起了解一下Master是听从Client(Leader)的号召,如何管理好Worker的吧. 1.家当(静态属 ...

  4. Spark技术内幕:Client,Master和Worker 通信源码解析

    http://blog.csdn.net/anzhsoft/article/details/30802603 Spark的Cluster Manager可以有几种部署模式: Standlone Mes ...

  5. Spark技术内幕:Client,Master和Worker 通信源代码解析

    Spark的Cluster Manager能够有几种部署模式: Standlone Mesos YARN EC2 Local 在向集群提交计算任务后,系统的运算模型就是Driver Program定义 ...

  6. 【原】 Spark中Worker源码分析(一)

    Worker作为对于Spark集群的健壮运行起着举足轻重的作用,作为Master的奴隶,每15s向Master告诉自己还活着,一旦主人(Master>有了任务(Application),立马交给 ...

  7. 【原】 Spark中Worker源码分析(二)

    继续前一篇的内容.前一篇内容为: Spark中Worker源码分析(一)http://www.cnblogs.com/yourarebest/p/5300202.html 4.receive方法, r ...

  8. Spark分析之Master、Worker以及Application三者之间如何建立连接

    Master.preStart(){ webUi.bind() context.system.scheduler.schedule( millis, WORKER_TIMEOUT millis, se ...

  9. Spark 中的 RPC 的几个类

    Spark 中 RPC 部分的涉及了几个类,有点晕,在此记录一下 1. RpcEndpoint: RPC的一个端点.给定了相应消息的触发函数.保证  `onStart`, `receive` and ...

随机推荐

  1. C# 最齐全的上传图片方法

    方法里包括了图片大小限制.图片尺寸.文件内容等等的判断... 该案例是mvc下的demo,支持单张图片上传. public ActionResult Upload() { string imgurl ...

  2. ssm框架中处理json格式的数据步骤

    1.导架包 <!--处理json--> <dependency> <groupId>com.fasterxml.jackson.core</groupId&g ...

  3. mysql数据库到底是什么?!

    MySql是MySql.AB公司开发的,采用客户/服务器模型的开放源码关系型SQL数据库管理系统,它可以在多种操作系统上运行. 客户端/服务器:C/S.需要给不同系统安装不同的软件,是专用的协议,比较 ...

  4. _ZNote_Mac_技巧_QuickLook功能扩展

    QuicLook(快速查看)是macOS一项非常方便的独有功能: 当选中一个文件,只需要按下空格键即可查看其内容,在按下空格退出QuickLook, 不需要启动再关闭任何软件. 默认支持大部分视频.音 ...

  5. git diff 理解

    0. 理解 git diff 返回信息 1. 命令 $ git diff README.md 2. 返回信息,注解 diff --git a/README.md b/README.md ## 1. 表 ...

  6. iostat 命令详解

    前言 话说搞运维的人没有两把"刷子",都不好意思上服务器操作.还好,我还不是搞运维的,我一直都自诩是开发人员,奈何现在的东家运维人员"水"的一比,还要我这个自诩 ...

  7. CTFcrackTools-V3 - 一款旨在帮助 CTFer 在 CTF 中发挥作用的一个框架

    CTFcrackTools-V3 CTFcrackTools重置版 作者:米斯特安全-林晨.摇摆.奶权 米斯特安全团队首页:http://www.hi-ourlife.com/ 部分插件来源:希望团队 ...

  8. touch-action属性引起的探索

     最近在做微信项目的时候遇到一个奇怪的问题: 常购清单的商品多了以后往上滑没有任何反应,不能滑动.但商城首页又可以往上滑.而且ios没有这个问题,安卓才有这个问题. 起初我以为是因为这2个页面调用接口 ...

  9. SQL分别求行、列的平均值

    日常工作中,会需要用SQL求平均值,分别是求某一项的平均值或求某一个对象的平均值,放到表格就是求一行中的几个字段的平均值和求一列的平均值. 第一种:[列的平均值]AVG:这个函数相信大家都不陌生的,求 ...

  10. web自动化测试---web页面元素的定位

    selenium提供了很多用于定位元素的方法,首先我们自己需要知道元素有哪些属性,这就需要用到安装测试环境中firebug来定位 打开firefox浏览器,按下F12键,我们就可以看到如下图所示的界面 ...