简述在akka中发送消息的过程

在flink的数据传输过程中，有两类数据，一类数据是控制流数据，比如提交作业，比如连接jm，另一类数据是业务数据。flink对此采用了不同的传输机制，控制流数据的传输采用akka进行，业务类数据传输在自己实现了序列化框架的前提下使用netty进行。之所以采用akka进行控制流数据的传送，是因为akka支持异步调用，并且支持良好的并发模型。所以，了解一下akka进行消息传送的知识，也有助于理解flink的作业运行逻辑。

这张图反映了一个典型的消息发送过程，所有的这些对象，actor,mailbox,dispathcer等等，都存在于一个叫actorSystem的对象中。而actorSystem同时也持有一个根actor，它是所有用户创建actor的父类，如下图。

ActorSystem是进入到Actor的世界的一扇大门。通过它你可以创建或中止Actor。甚至还可以把整个Actor环境给关闭掉。另一方面来说，Actor是一个分层的结构，ActorSystem之于Actor有点类似于java.lang.Object或者scala.Any的角色——也就是说，它是所有Actor的根对象。当你通过ActorSystem的actorOf方法创建了一个Actor时，你其实创建的是ActorSystem下面的一个Actor。

对于一个actorSystem而言，主要的成员变量包含以下几个：

provider:ActorRefProvider，实际创建actor的工厂
guardian:InternalActorRef，用户创建actor的监管者
systemGuardian:InternalActorRef，系统创建actor的监管者
threadFactor:ThreadFactory，事件运行线程池模型
mailboxes:Mailboxes，存放事件的邮箱
dispatcher:ExecutionContextExecutor，负责事件分发的分发器
deadLetters:ActorRef，一个接受deadLetter的actor

而上面需要解释的一个概念是邮箱：MailBox

默认的邮箱是UnboundedMailbox，底层其实是一个java.util.concurrent.ConcurrentLinkedQueue，它非阻塞并且无界。初次之外，akka提供了很多别的邮箱，包括SingleConsumerOnlyUnboundedMailbox、NonBlockingBoundedMailbox、UnboundedControlAwareMailbox、UnboundedPriorityMailbox、UnboundedStablePriorityMailbox等等，可以根据不同的使用场景进行配置。

另一个比较重要的概念是分发器，默认的分发器就是Dispatcher，这个模型中，每个actor都有自己的邮箱，但是他们共享一个dispatcher，这个dispatcher可以运行在不同的线程池模型上，默认的线程池模型是fork-join-executor，这个分发器是专门为非阻塞模型优化。

还有Pinned dispatcher，这个模型中每个actor有一个自己的邮箱，同时有自己的只有一个线程的线程池，不同actor之间的线程不会共享，并且底层只支持thread-pool-executor。这个模型适合于处理阻塞任务，因为他们跑在不同的线程中，比如耗时的IO操作。

除此之外还有balancing dispatcher，这个模式将尝试从繁忙的actor重新分配工作到空闲的actor。所有actor共享单个邮箱，并从中获取他们的消息。这里假定所有使用此调度器的actor都可以处理发送到其中一个actor的所有的消息；即actor属于actor池，并且对客户端来说没有保证来决定哪个actor实例实际上处理某个特定的消息。可共享性：仅对同一类型的Actor共享邮箱：任意，为所有的Actor创建一个使用场景：Work-sharing 底层驱动：java.util.concurrent.ExecutorService 通过”executor”指定，可使用 “fork-join-executor”, “thread-pool-executor” 或akka.dispatcher.ExecutorServiceConfigurator的限定请注意不能将BalancingDispatcher用作一个路由器调度程序。

OK，在了解了基础知识之后，我们来串一下发消息的流程：

 ActorRef

 def !(message: Any)(implicit sender: ActorRef = Actor.noSender) = underlying.sendMessage(message, sender

 Dispatch

 def sendMessage(msg: Envelope): Unit =

     try {

       if (system.settings.SerializeAllMessages) {

         val unwrapped = (msg.message match {

           case DeadLetter(wrapped, _, _) ⇒ wrapped

           case other                     ⇒ other

         }).asInstanceOf[AnyRef]

         if (!unwrapped.isInstanceOf[NoSerializationVerificationNeeded]) {

           val s = SerializationExtension(system)

           s.deserialize(s.serialize(unwrapped).get, unwrapped.getClass).get

         }

       }

       dispatcher.dispatch(this, msg)

     } catch handleException

当我们通过！来发送消息，最后会调用到16行的dispatcher.dispatch方法。

  protected[akka] def dispatch(receiver: ActorCell, invocation: Envelope): Unit = {

  protected[akka] def dispatch(receiver: ActorCell, invocation: Envelope): Unit = {

     val mbox = receiver.mailbox

     mbox.enqueue(receiver.self, invocation)

     registerForExecution(mbox, true, false)

   }

 protected[akka] override def registerForExecution(mbox: Mailbox, hasMessageHint: Boolean, hasSystemMessageHint: Boolean): Boolean = {

     if (mbox.canBeScheduledForExecution(hasMessageHint, hasSystemMessageHint)) { //This needs to be here to ensure thread safety and no races

       if (mbox.setAsScheduled()) {

         try {

           executorService execute mbox

           true

         } catch {

           case e: RejectedExecutionException ⇒

             try {

               executorService execute mbox

               true

             } catch { //Retry once

               case e: RejectedExecutionException ⇒

                 mbox.setAsIdle()

                 eventStream.publish(Error(e, getClass.getName, getClass, "registerForExecution was rejected twice!"))

                 throw e

             }

         }

       } else false

     } else false

   }

这其中的关键在于12行，使用底层的线程池模型来执行这个mbox，当然，mbox能执行的前提是他本身是一个runnable对象，提交即意味着执行其中的run方法。

 MailBox

 override final def run(): Unit = {

     try {

       if (!isClosed) { //Volatile read, needed here

         processAllSystemMessages() //First, deal with any system messages

         processMailbox() //Then deal with messages

       }

     } finally {

       setAsIdle() //Volatile write, needed here

       dispatcher.registerForExecution(this, false, false)

     }

   }

其中processAllSystemMessage方法处理类似watch之类的系统消息，processMailBox处理用户消息。

 MailBox

 @tailrec private final def processMailbox(

     left: Int = java.lang.Math.max(dispatcher.throughput, 1),

     deadlineNs: Long = if (dispatcher.isThroughputDeadlineTimeDefined == true) System.nanoTime + dispatcher.throughputDeadlineTime.toNanos else 0L): Unit =

     if (shouldProcessMessage) {

       val next = dequeue()

       if (next ne null) {

         if (Mailbox.debug) println(actor.self + " processing message " + next)

         actor invoke next

         if (Thread.interrupted())

           throw new InterruptedException("Interrupted while processing actor messages")

         processAllSystemMessages()

         if ((left > 1) && ((dispatcher.isThroughputDeadlineTimeDefined == false) || (System.nanoTime - deadlineNs) < 0))

           processMailbox(left - 1, deadlineNs)

       }

     }

processMailBox的关键在于第9行的代码，真正调用这个actor本身来执行next这个消息。这里的dispatcher.throughput限制了每次执行的消息条数。

 Actor

  final def invoke(messageHandle: Envelope): Unit = try {

     currentMessage = messageHandle

     cancelReceiveTimeout() // FIXME: leave this here???

     messageHandle.message match {

       case msg: AutoReceivedMessage ⇒ autoReceiveMessage(messageHandle)

       case msg                      ⇒ receiveMessage(msg)

     }

     currentMessage = null // reset current message after successful invocation

   } catch handleNonFatalOrInterruptedException { e ⇒

     handleInvokeFailure(Nil, e)

   } finally {

     checkReceiveTimeout // Reschedule receive timeout

   }

invoke方法中，紧接着调用了receiveMessage方法。

 Actor

 final def receiveMessage(msg: Any): Unit = actor.aroundReceive(behaviorStack.head, msg)

 protected[akka] def aroundReceive(receive: Actor.Receive, msg: Any): Unit = receive.applyOrElse(msg, unhandled)

这里终于看到了我们在实现一个actor的时候必然要实现的receiver方法，它在第4行最终被调用。

那么同时能够存在多少个actor执行任务了？那就要看fork-join-pool中提供的线程的个数，以及提交的actor在执行任务的时候需要的线程个数了。虽然每一个actor在执行的时候可以触发的消息个数是有最大值的，但是同时在执行的actor的个数应该是动态的。如果某一个actor使用了线程池中所有的线程，那可能其他actor就没法同时执行，如果大多数actor都只使用一个线程触发消息，则可以同时有多个actor在线程池中运行。但如果相互之间有发送消息，则只有等待，不过，akka本身就是异步的，对于大多数消息而言，发送消息之后就不管了，只等着对方处理完毕之后再发送消息给自己来实现回调。

在flink中提供了大量的默认的akka的配置，比较重要的几个如下：

 akka.ask.timeout:10s 阻塞操作，可能因为机器繁忙或者网络堵塞导致timeout,可以尝试设置大一点。

 akka.client.timeout:60s 在client端的全部阻塞操作的时长

 akka.fork-join-executor.parallelism-factor:2.0 ceil(available processors*factor) bounded by the min and max

 akka.fork-join-executor.parallelism-max:64

 akka.fork-join-executor.parallelism-min:8

 akka.framesize:10485760b,1.25MB JM和TM之间传输的最大的消息值

 akka.lookup.timeout:10s 找JM的时间

 akka.retry-gate-closed-for:50 如果远端的链接断开，多少毫秒之内，gate应该关闭

 akka.throughput:15 每个调度周期能够处理的消息的最大值，小的值意味着公平，大的值意味着效率

参考了如下的地址，感谢。

https://blog.csdn.net/pzw_0612/article/details/47385177

https://www.cnblogs.com/devos/p/4438402.html

https://blog.csdn.net/birdben/article/details/49796923

简述在akka中发送消息的过程的更多相关文章

[转] C#中发送消息给指定的窗口，以及接收消息
原文C#中发送消息给指定的窗口,以及接收消息 public class Note { //声明 API 函数 [DllImport("User32.dll", EntryPoint ...
【转载】Delphi7从子线程中发送消息到主线程触发事件执行
在对数据库的操作时,有时要用一个子线程来进行后台的数据操作.比如说数据备份,转档什么的.在主窗口还能同是进行其它操作.而有时后台每处理一个数据文件,要向主窗口发送消息,让主窗口实时显示处理进度在窗口上 ...
akka设计模式系列-消息模型（续）
在之前的akka设计模式系列-消息模型中,我们介绍了akka的消息设计方案,但随着实践的深入,发现了一些问题,这里重新梳理一下设计方法,避免之前的错误.不当的观点给大家带来误解. 命令和事件我们仍然 ...
重温Android中的消息机制
引入: 提到Android中的消息机制,大家应该都不陌生,我们在开发中不可避免的要和它打交道.从我们开发的角度来看,Handler是Android消息机制的上层接口.我们在平时的开发中只需要和Hand ...
安卓中的消息循环机制Handler及Looper详解
我们知道安卓中的UI线程不是线程安全的,我们不能在UI线程中进行耗时操作,通常我们的做法是开启一个子线程在子线程中处理耗时操作,但是安卓规定不允许在子线程中进行UI的更新操作,通常我们会通过Handl ...
Oozie 生成JMS消息并向 JMS Provider发送消息过程分析
一,涉及到的工程从官网下载源码,mvn 编译成 Eclipse工程文件:
Android中对消息机制(Handler)的再次解读
今天遇到一些关于在子线程中操作Handler的问题,感觉又要研究源代码了,但是关于Handler的话,我之前研究过,可以参考这篇文章:http://blog.csdn.net/jiangwei0910 ...
第三十个知识点：大致简述密钥协商中的BR安全定义。
第三十个知识点:大致简述密钥协商中的BR安全定义. 在两方之间建密钥共享是一件密码学中古老的问题.就算只考虑定义也比标准加密困难的多.尽管古典的Diffie-Hellman协议在1976年思路解决了这 ...
使用Java客户端发送消息和消费的应用
体验链接:https://developer.aliyun.com/adc/scenario/fb1b72ee956a4068a95228066c3a40d6 实验简介本教程将Demo演示使用jav ...

随机推荐

MyBatis-SELECT基本查询
1.返回一个LIST  <!- ...
mysql 常用语句使用
1.查询语句 SELECT * FROM table 2.更改语句 UPDATE table SET name = '123456' WHERE id = 100 3.插入语句 INSERT INTO ...
前台时间格式 2019-03-09T16:00:00.000Z
问题描述: 本想在前台把字符串格式的日期(2019-03-09)转换成日期格式(2019-03-09 00:00:00),但当把这个参数传到后台去后却变成了2019-03-08T16:00:00.00 ...
Visual Studio Code 工具使用教程
软件下载这里就不用讲了,安装完之后: 1.切换中文: 选择扩展搜索“Language”,在下列选项选择 Chinese (Simplified) Language Pack for Visual S ...
ant-design学习准备_1
在学习ant-desin过程中,发现很多知识都不清楚,从现在开始,每天将自己学习到的知识进行一个总结记录,前端大佬勿扰勿喷.先介绍几个基础概念和一些常用命令: 1.什么是脚手架我们经常在各个博客论坛 ...
游戏AI之群组行为
群组行为指的是多个对象组队同时进行的情况.每个boid需满足分离,队列,凝聚三个基本的规则. 分离:群组中的每个个体都与相邻的个体保持一定的距离. 队列:群组以相同的速度,向相同的方向移动. 凝聚:与 ...
用 splice 函数分别实现 push、pop、shift、unshift 的方法
主要需要注意的是不同方法他们本身返回的值应该是什么,是数组当前的长度,还是取出的元素的值,再在splice函数里面进行相应的return就可以了.具体如下: 用 splice函数实现 push方法 f ...
Python入门（4）
一.while循环有时候,你可能需要计算机来帮重复做一件事,这时就需要循环. while condition: statements (else: statements ) 当condition条件 ...
LeetCode 141——环形链表
1. 题目 2. 解答 2.1 方法 1 定义快慢两个指针,慢指针每次前进一步,快指针每次前进两步,若链表有环,则快慢指针一定会相遇. /** * Definition for singly-link ...

简述在akka中发送消息的过程

简述在akka中发送消息的过程的更多相关文章

随机推荐

热门专题