Akka Cluster之集群分片

一、介绍

当您需要在集群中的多个节点之间分配Actor，并希望能够使用其逻辑标识符与它们进行交互时，集群分片是非常有用的。你无需关心Actor在集群中的物理位置，因为这可能也会随着时间的推移而发生变化。

例如，它可以是代表域驱动设计术语中聚合根的参与者。在这里，我们称这些Actore为“实体”。这些Actor通常具有持久状态，但此功能不仅限于具有持久化状态的Actor。

当你有一个很消耗资源的Actor，例如占内存或者CPU，把它放在一台机器上可能吃不消，这时候集群分片就能够提供很好的帮助，将这些Actor分散在集群中的多个结点上。

二、依赖

<dependency>

  <groupId>com.typesafe.akka</groupId>

  <artifactId>akka-cluster-sharding_2.12</artifactId>

  <version>2.5.18</version>

</dependency>

三、例子

假设我们有如下一个需要使用集群分片模式的实体Actor:

case object Increment

case object Decrement

final case class Get(counterId: Long)

final case class EntityEnvelope(id: Long, payload: Any)

case object Stop

final case class CounterChanged(delta: Int)

class Counter extends PersistentActor {

  import ShardRegion.Passivate

  context.setReceiveTimeout(120.seconds)

  // self.path.name is the entity identifier (utf-8 URL-encoded)

  override def persistenceId: String = "Counter-" + self.path.name

  var count = 0

  def updateState(event: CounterChanged): Unit =

    count += event.delta

  override def receiveRecover: Receive = {

    case evt: CounterChanged ⇒ updateState(evt)

  }

  override def receiveCommand: Receive = {

    case Increment      ⇒ persist(CounterChanged(+1))(updateState)

    case Decrement      ⇒ persist(CounterChanged(-1))(updateState)

    case Get(_)         ⇒ sender() ! count

    case ReceiveTimeout ⇒ context.parent ! Passivate(stopMessage = Stop)

    case Stop           ⇒ context.stop(self)

  }

}

上面这个Actor使用PersistActor中的事件来源模式存储其内部状态，当然其不一定需要是持久化的Actor。使用持久化的好处是，如果节点之间的实体发生故障或迁移，它能够恢复其状态。

我们要使用集群的分片模式，通常就需要在群集中每个节点上的系统启动时，使用ClusterSharding.start方法注册支持的实体类型，这样我们就能在所有将承载分片的节点上运行这个方法来部署分片。其中，ClusterSharding.start如下：

val counterRegion: ActorRef = ClusterSharding(system).start(

  typeName = "Counter",

  entityProps = Props[Counter],

  settings = ClusterShardingSettings(system),

  extractEntityId = extractEntityId,

  extractShardId = extractShardId)

其中，start方法返回了ShardRegion，是个ActorRef类型。ShardRegion是一个特殊的Actor，负责管理可能多个分片（shard）内称为Entity的Actor实例。这些分片可能是分布在不同的集群节点上的，外界通过ShardRegion与其辖下Entities沟通。从start函数参数entityProps我们看到：每个分片中只容许一个种类的Actor；具体的Entity实例是由另一个内部Actor即shard构建的，shard可以在一个分片中构建多个Entity实例。多shard多entity的特性可以从extractShardId,extractEntityId这两个方法中得到一些信息。我们说过Actor自编码即entity-id是Cluster-Sharding的核心元素。在entity-id这个自编码中还包含了shard-id，所以用户可以通过entity-id的编码规则来设计整个分片系统包括每个ShardRegion下shard和entity的数量。当ShardRegion得到一个entity-id后，首先从中抽取shard-id，如果shard-id在集群中不存在的话就按集群各节点负载情况在其中一个节点上构建新的shard；然后再用entity-id在shard-id分片中查找entity，如果不存在就构建一个新的entity实例。整个shard和entity的构建过程都是通过用户提供的函数extractShardId和extractEntityId实现的，Cluster-Sharding就是通过这两个函数按用户的要求来构建和使用shard和entity的。下面我们看下这种自编码的例子：

val extractEntityId: ShardRegion.ExtractEntityId = {

  case EntityEnvelope(id, payload) ⇒ (id.toString, payload)

  case msg @ Get(id)               ⇒ (id.toString, msg)

}

val numberOfShards = 100

val extractShardId: ShardRegion.ExtractShardId = {

  case EntityEnvelope(id, _) ⇒ (id % numberOfShards).toString

  case Get(id)               ⇒ (id % numberOfShards).toString

  case ShardRegion.StartEntity(id) ⇒

    // StartEntity is used by remembering entities feature

    (id.toLong % numberOfShards).toString

}

在大多数情况下工作正常的简单分片算法是获取hashCode实体标识符的模数为分数的绝对值。下面我们可以通过如下程序测试：

val counterRegion: ActorRef = ClusterSharding(system).shardRegion("Counter")

counterRegion ! Get(123)

expectMsg(0)

counterRegion ! EntityEnvelope(123, Increment)

counterRegion ! Get(123)

expectMsg(1)

Akka Cluster之集群分片的更多相关文章

Akka（13）：分布式运算：Cluster-Sharding-运算的集群分片
通过上篇关于Cluster-Singleton的介绍,我们了解了Akka为分布式程序提供的编程支持:基于消息驱动的运算模式特别适合分布式程序编程,我们不需要特别的努力,只需要按照普通的Actor编程方 ...
akka 集群分片
akka 集群 Sharding分片分片上下级结构集群(多台节点机) —> 每台节点机(1个片区) —> 每个片区(多个分片) —> 每个分片(多个实体) 实体: 分片管理的 A ...
akka-typed(7) - cluster：sharding, 集群分片
在使用akka-typed的过程中发现有很多地方都简化了不少,变得更方便了,包括:Supervision,只要用Behaviors.supervise()把Behavior包住,很容易就可以实现这个a ...
Akka-Cluster（6）- Cluster-Sharding：集群分片，分布式交互程序核心方式
在前面几篇讨论里我们介绍了在集群环境里的一些编程模式.分布式数据结构及具体实现方式.到目前为止,我们已经实现了把程序任务分配给处于很多服务器上的actor,能够最大程度的利用整体系统的硬件资源.这是因 ...
超详细的 Redis Cluster 官方集群搭建指南
今天从 0 开始搭建 Redis Cluster 官方集群,解决搭建过程中遇到的问题,超详细. 安装ruby环境因为官方提供的创建集群的工具是用ruby写的,需要ruby2.2.2+版本支持,rub ...
MySQL Cluster(MySQL 集群) 初试（转）
作/译者:叶金荣(imysql#imysql.com>),来源:http://imysql.com,欢迎转载. 作/译者:叶金荣(Email: ),来源:http://imysql.cn,转载请 ...
mongodb集群+分片部署(二)
机器:10.165.38.68 10.165.38.72 部署包:mongodb-linux-x86_64-rhel55-3.0.2.tgz(百度云盘下载地址:http://pan.baidu. ...
Redis Cluster（集群）的搭建
一.Redis的下载.安装.启动(单实例) 我们统一将Redis安装在/opt目录下,执行命令如下: $ cd /opt $ wget http://download.redis.io/release ...
MySQL Cluster(MySQL 集群) 初试
MySQL Cluster 是MySQL适合于分布式计算环境的高实用.高冗余版本.它采用了NDB Cluster 存储引擎,允许在1个 Cluster 中运行多个MySQL服务器.在MyQL 5.0及 ...

随机推荐

Python全栈工程师（包、模块的导入）
ParisGabriel 每天坚持手写一天一篇决定坚持几年为了梦想为了信仰 Python人工智能从入门到精通 $ pip3 install tenso ...
【Python】print 方法的参数
当在IDEL或者命令行中执行 help(print) 命令时,就可以看到 print 方法的详细说明: print(value, ..., sep=' ', end='\n', file=sys.st ...
c++知识点总结--静态与动态类型
对象的静态类型(static type),就是它在程序中被声明时所采用的类型对象的动态类型(dynamic type)是指“目前所指对象的类型” vitual 函数是动态绑定而来,调用一个vir ...
NIO--1
1.为什么不直接用jdk NIO(1) API繁杂(2) 原始NIO可靠性不是很高.可靠性包括:断开重连,网络闪断,半包读写,失败缓存(3) NIO 的epoll BUG会导致多路复用器Selecto ...
Redis客户端命令
Redis客户端命令 Redis 命令用于在 redis 服务上执行操作. 要在 redis 服务上执行命令需要一个 redis 客户端.Redis 客户端在我们之前下载的的 redis 的安装包中. ...
spark与storm比对与选型
大数据实时处理平台市场上产品众多,本文着重讨论spark与storm的比对,最后结合适用场景进行选型. 一.spark与storm的比较比较点 Storm Spark Streaming 实时计算模 ...
洛谷 P2797 Facer的魔法解题报告
P2797 Facer的魔法题意:给你n个数,你可以选若干个数,使得平均数减中位数最大数据范围:$n \le 10^5$ 原题CF626E 很容易想到枚举一个中位数,但是如果选取的数字的个数是 ...
svn installation
# yum install mod_dav_svn.x86_64 subversion-svn2cl.noarch=========================================== ...
iOS-android-windowsphone等移动终端平台开发流程图
到了公司后,半个月时间就是在熟悉下面这张图里的流程, 项目流程图: 下面是我对这张图的一些理解:
java基础练习 19
public class Ninetheen { /*求1+2!+3!+...+20!的和*/ public static void main(String[] args){ int i,j; lon ...

Akka Cluster之集群分片

Akka Cluster之集群分片的更多相关文章

随机推荐

热门专题