使用Vertx重构系统小结
背景
前几个月,使用Vertx重构了公司的一个子系统,该系统负责公司核心数据subscriber的采集、处理、存储和搜索。这里介绍下重构该系统时的一些关键点。
架构
重构前系统部署图:

重构前系统主要有2部分组成,这2部分都会对Subscriber数据操作:
Java APP: 是个定时任务触发的APP,每2小时跑一次,每次启动后做以下的事情:
- 从MongoDB里加载已有的数据到内存。
- 读取准备好的Data文件,处理文件中的数据,和已加载的数据做合并,这个处理的过程会导致Subscriber数据有添加、删除和更新操作。
- 处理完Data文件后,将数据持久化到MongoDB和Elasticsearch。
JBoss服务:
- 从Kafka中来的消息数据,批量处理Kafka消息,会添加和更新Subscriber数据到MongoDB和Elasticsearch中。
- 从其他系统触发的API调用,接收一些API请求,这些请求也会增加、删除和更新Subscriber数据。在更新的时候,因为查询条件的多样性,为了提高查询Subscriber的速度,对MongoDB的Subscriber Collection建了各种索引。
重构原因
- 对同一种的数据的操作在2个不同的服务中,一种是war一种是jar,不利于维护。代码在不同的Rep和Project下,维护也不方便。
- Jboss现在是单实例部署,Jboss中还部署有其他的服务,Jboss的稳定性直接影响了该服务。为了提高查询速度,对数据建立了多种不同的索引,更新数据增加了数据库的负担。
- 定时任务JavaAPP每次在处理某个客户的Subscriber数据时候,都要从MongoDB加载数据到内存,耗时没有效率。因为是定时任务,对数据更新不够及时,会影响其他依赖Subscriber数据的服务。
- 数据更新冲突:在定时任务把数据加载到内存,正在处理时,此时如果Jboss也在更新数据会导致数据更新冲突(现在采用了一个很tricky的方式解决)。
重构后系统部署图

重构后,系统组件介绍和说明:
Adapter服务:
- 数据适配服务,统一接收来自文件、Kafka和API调用的数据,对数据进行预处理,发送相应的业务消息到Event Bus。
- 因为对Adapter的触发方式只有2种,一种是REST API,另一种是连接Kafka读取消息,所以Adapter服务可以通过部署多个实例来增加可用性,也顺便提高了整体性能。
Mapper服务:
- 数据处理服务,按数据分片进行部署,分片规则可以按客户大小来分,比如把10个大客户的数据部署在一个实例上,200个小客户的数据部署在另一个实例上,也可以按数据量平均分。
- 初始启动时候加载所属该实例的所有Subscriber数据到内存,从EventBus上接收来自Adapter的业务请求,处理请求并对数据进行更新。
- 数据更新策略:
- 来自API的请求都会实时的更新到MongoDB和Elasticsearch中。
- 来自文件和Kafka的数据更新量比较大,为了避免每次对数据更新的时候都去操作DB和ES,通过一个队列缓存所有的更新。触发队列持久化条件:一种是当缓存Size达到阈值时候触发,另一种是定时触发,触发后批量更新数据到MongoDB和Elasticsearch中。
- 内存、MongoDB和Elasticsearch中数据一致性:因为现在数据在内存中,使用了Vertx的MongoClient的异步回调机制,保证只有更新到MongoDB成功后才去更新Elasticsearch,保证MongoDB里数据的准确性是第一位的。而ElasticSearch中数据的准确性是通过“定时补偿机制”去保证:有其他定时执行的脚本去定时检查,并决定是否重新对某个客户的数据重建索引。
重构之后的可改进项:
- 耗内存,所有的Subscriber数据都分片加载到了JVM里。这部分可以把数据放到其他的存储中,比如redis,但就算是放到redis,也是耗内存。
- 如果系统出错,会导致数据在MongoDB和ElasticSearch之间不一致,需要其他方式去做“数据一致性补偿”。如果资源允许,可以把数据更新同步单独拿出来实现,使用类似处理“分布式系统数据一致性”的方式来改善这一点。
小结
一些技术关键点
1 异步非阻塞
Vertx的异步非阻塞机制有很好的并发性能。网络IO依赖了Netty,Java NIO的特性。
2 Vert.x-Web
Vertx-web可以很方便的去实现一个web app,很容易实现一些REST APIs。
3 Data access client
Vertx提供了访问各种存储的Client,这些client的API都是异步的,可以很方便的去访问MongoDB,JDBC,Redis等。
4 Event Bus
Vertx的一个核心功能,重构这个子系统时也很依赖这个功能。Event Bus可用于不同Verticle之间的通信,也可以用于Vertx cluster之间的通信。
5 功能解耦
系统中各个子功能可以按不同的Verticle去实现,不同的Verticle可以通过EventBus去通信解耦。Vertx支持动态的加载和卸载Verticle,也就可以实现在运行时动态的加载卸载某些功能。
6 集群模式
Adapter服务和Mapper服务是通过Vertx的Cluster模式组成了集群,集群中节点发现和通信通过Hazelcast管理。使用Vertx实现的服务,可以单实例部署,也可以组成集群提供服务。
参考
- https://vertx.io/docs/vertx-core/java/
- https://vertx.io/docs/vertx-web/java/
- A gentle guide to asynchronous programming with Eclipse Vert.x for Java developers
使用Vertx重构系统小结的更多相关文章
- Diskpart命令安装系统小结
<diskpart命令安装系统小结> 今天给同学安装系统,win8改win7.同学是预装了win8的联想y480,分区表采用的是GPT格式,捣鼓了半天才知道.GPT格式是新式的分区格式,相 ...
- 构建ASP.NET MVC4+EF5+EasyUI+Unity2.x注入的后台管理系统(28)-系统小结
原文:构建ASP.NET MVC4+EF5+EasyUI+Unity2.x注入的后台管理系统(28)-系统小结 我们从第一节搭建框架开始直到二十七节,权限管理已经告一段落,相信很多有跟上来的园友,已经 ...
- 构建ASP.NET MVC4+EF5+EasyUI+Unity2.x注入的后台管理系统(14)-系统小结
原文:构建ASP.NET MVC4+EF5+EasyUI+Unity2.x注入的后台管理系统(14)-系统小结 不知不觉已经过了13讲,(本来还要讲多一讲是,数据验证之自定义验证,基于园友还是对权限这 ...
- 一次业务网关用ASP.NET Core 2.1重构的小结
目录 前言 统一鉴权 服务限流 路由转发 参数重组 链路跟踪 熔断降级 服务计次 业务指标监控 日志记录 迭代更新 总结 前言 对于API网关,业界貌似对它进行下划分,有下面几个分类/场景. 面向We ...
- ASP.NET MVC5+EF6+EasyUI 后台管理系统(28)-系统小结
系列目录 我们从第一节搭建框架开始直到二十七节,权限管理已经告一段落,相信很多有跟上来的园友,已经搭配完成了,并能从模块创建授权分配和开发功能了 我没有发布所有源代码,但在14节发布了最后的一次源代码 ...
- 安装win7 64位和win10 64位双系统小结
1.gpt比mbr更先进.与主启动记录 (MBR) 分区方法相比,GPT 具有更多的优点,因为它允许每个磁盘有多达 128 个分区(mbr只支持4个分区),支持高达 18 千兆兆字节的卷大小,允许将主 ...
- 远程控制Ubuntu系统小结
一.在远程控制的Ubuntu上,按shift键总会出现中文字符 因为在Ubuntu中,默认启动搜狗输入法,导致在按shift键时,不停出现中文字符 一开始以为是因为远程控制,在主控机和被控机的输入法之 ...
- 从零开始,搭建博客系统MVC5+EF6搭建框架(5),博客详情页、留言、轮播图管理、右侧统计博文
一.博客系统进度回顾 上一遍博客介绍到,系统已经实现到了发布以及前台布局展示,接下来就是实现一些,详情页,留言.轮播图管理.右侧博文统计信息实现. 二.博客系统详情页实现 2.1先来看看详情页展示的效 ...
- 新闻公布系统 (Asp.net 三层架构 )
2012年度课程设计---新闻公布系统(小结) ...
随机推荐
- redis-cli的一些有趣也很有用的功能
redis-cli我们最常用的两个参数就是-h.-p.-a选项,分配用来指定连接的redis-server的host和port. 通过redis-cli –help发现,redis-cli还提供了其他 ...
- 本地不安装oracle,PLsql远程连接
Oracle的Instant client工具包可以很好地解决本地不安装oracle,PLsql远程连接. 1.首先到Oracle网站下载Instant Client : http://www.ora ...
- C语言的字符串操作函数小结
一.strcat()函数 char *strcat(char *dest, const char *src) 把 src 所指向的字符串追加到 dest 所指向的字符串的结尾.它返回一个指向字符串de ...
- php的错误日志级别 error_report(转)
; E_ALL 所有错误和警告(除E_STRICT外); E_ERROR 致命的错误.脚本的执行被暂停.; E_RECOVERABLE_ERROR 大多数的致命错误.; E_WARNING 非致命的运 ...
- 20155306 2006-2007-2 《Java程序设计》第3周学习总结
20155306 2006-2007-2 <Java程序设计>第3周学习总结 教材学习内容总结 第四章 认识对象 4.1 类与对象 定义类 1.先在程序中定义类: Clothes{ Str ...
- 项目Beta冲刺预热
Beta准备 1. 讨论组长是否重选的议题和结论. 经过讨论,我们认为,经过一段时间的磨合,现任组长是不需要更换的. 2. 下一阶段需要改进完善的功能. 增加关于征信的功能,贴近选题主题 美化界面,尽 ...
- Alpha冲刺Day2
Alpha冲刺Day2 一:站立式会议 今日安排: 首先完善前一天的剩余安排工作量,其次我们把项目大体分为四个模块:数据管理员.企业人员.第三方机构.政府人员.数据管理员这一模块,数据管理员又可细分为 ...
- jvm垃圾收集器总结jdk1.7
内存 ● 线程私有:程序计数器,虚拟机栈,本地方法栈 ● 线程共享: 方法区,堆 判断存活算法 ● 引用计数法:无法解决循环引用问题. ● 可达性分析算法: 从GCRoot作为起始点,向下搜索,经过的 ...
- nyoj Color the fence
Color the fence 时间限制:1000 ms | 内存限制:65535 KB 难度:2 描述 Tom has fallen in love with Mary. Now Tom w ...
- django报错Manager isn't accessible via UserInfo instances
出现这种错误是因为调用模型对象时使用了变量名,而不是对象名(模型类),例如: user = UserInfo()user_li = user.objects.filter(uname=username ...