一个word合并项目的分布式架构设计
一个word合并项目的分布式架构设计
项目背景与问题起源
我们要给一个客户做word生成报告以及报告合并的工作,要合并的报告非常多,而且每个报告也比较大,一个多的报告大概有200页以上。我们用c#操作word,并把程序部署到了一个配置还可以的服务器上。现在大概有20几个客户端,每个客户端把生成的数据传输到服务器上,等到一组数据完整之后,会触发合并报告。我们的程序会自动生成N份报告,并把这N份报告合并成一个大的报告。
但随着要合并的报告越来越多,word经常会报一些异常,这些异常是单机版从来没有出现过的。(一样的代码,单机版已经运行了几年了)我们查了很多资料,也没有解决这些异常。同时我们观察了服务器的资源占用情况,CPU和内存占用都不多,这说明不是资源的问题。
思考与解决方案
我们考虑了很久,觉得可能是word本身的bug(当然,这个可能性比较小,但我们没有别的办法了)。word被设计成一个单机版的软件,对通过API同时操作多个word的情况可能没有处理。考虑到这里,我们在想,有没有办法把每个生成word和合并word都变成单机版操作呢?我们想到了分布式的方法。
解决方案是这样的,我们可以利用虚拟机(XEN)虚拟出N个系统,每个系统里面部署一个生成报告和合并报告的程序(slave)。在外面现在的服务器(master)上,部署主程序,用来分发任务。但是这样的话就要做一个任务控制器(controller),这个控制器要去控制下面每个slave的任务,要了解slave的运行状态,并给slave分配任务。如果任务比较多,还要做一个任务队列,用来存储任务。这个控制器的功能虽然很常见,但是也有一定的复杂度,有没有更好的方案呢?
我们忽然想到之前用过MQ发送消息,消息可以永久性的存储在queue里面,直到有consumer拿走消息。我们可以利用MQ的这个功能,实现controller。具体实现就是首先部署一个MQ,在现在的服务器上部署一个程序,这个程序的主要功能是:
- 接收客户端发过来的请求。
- 把此请求转发到MQ的队列中。
- 读取另外一个完成队列中的内容,返回到客户端。
slave上面程序的主要功能是:
- 如果没有任务,则从MQ中读取任务队列。
- 读到任务队列后,执行任务,并向MQ的完成队列中发消息标志完成。
需要注意的是:
- master与slave之间是异步的。
- 客户端与服务器是同步的。
- 自动做了负载均衡,单个slave的故障对系统没有影响,如果负载很大,直接增加slave即可,扩展性非常好。
- slave部署在虚拟机上,虚拟机用XEN实现,控制起来非常方便。
其图如下图所示:
【大半夜画图有点糙】
总之,这个方案应用MQ,降低了代码开发的复杂性。
各位如果对此方案有和建议,请不吝赐教。
PS:这篇文章是我用markdown写的第一篇文章,马克飞象很赞!
一个word合并项目的分布式架构设计的更多相关文章
- Slithice 分布式架构设计
项目原因: 参与过各种 分布式项目,有 Socket,Remoting,WCF,当然还有最常用的可以跨平台的 WebService. 分布式编码的时间浪费: 但是,无一例外的,开发分布式程序的开发遵循 ...
- 大型分布式架构设计与实现-第一章SOA(面向服务的体系架构)
拜读了大型分布式架构设计与实现,觉得该书作为入门不错,但内容过于简单,描述过于琐碎,小节之间连续性不强,不适合深入钻研学习.但为了更多的希望向架构师行业靠拢的工程师学习需要,本博客将对上书进行简化讲解 ...
- Java 18套JAVA企业级大型项目实战分布式架构高并发高可用微服务电商项目实战架构
Java 开发环境:idea https://www.jianshu.com/p/7a824fea1ce7 从无到有构建大型电商微服务架构三个阶段SpringBoot+SpringCloud+Solr ...
- 『设计』Slithice 分布式架构设计-支持一体式开发,分布式发布
项目原因: 参与过各种 分布式项目,有 Socket,Remoting,WCF,当然还有最常用的可以跨平台的 WebService. 分布式编码的时间浪费: 但是,无一例外的,开发分布式程序的开发遵循 ...
- 从腾讯QQgame高性能服务器集群架构看“分而治之”与“自治”等分布式架构设计原则
转载:http://space.itpub.net/17007506/viewspace-616852 腾讯QQGame游戏同时在线的玩家数量极其庞大,为了方便组织玩家组队游戏,腾讯设置了大量游戏室( ...
- 以一个权限系统来告别WebForm —(一)项目整休架构设计与数据库设计
在本节我想与大家与分享一下,我所将要做的权限系统的架构和数据库的表的设计.请各位大神们对我项目中设计的不足之处进行指导,让我得以更好的写完它,留给需要它的人. 我的项目架构如下图所示: 如上图所示,在 ...
- 分布式架构设计(一) --- 面向服务的体系架构 SOA
1.1 基于TCP协议的RPC 1.1.1 RPC名词解释 RPC的全称是Remote Process Call,即远程过程调用,RPC的实现包括客户端和服务端,即服务调用方和服务提供方.服务调用方发 ...
- crm项目开发之架构设计
CRM customer relationship management 客户管理系统 1. 干什么用的? 管理客户 维护客户关系 2. 谁去使用? 销售 班主任 项目经理 3. 需求: 1. 登录 ...
- petshop4.0 具体解释之中的一个(系统架构设计)
前言:PetShop是一个范例,微软用它来展示.Net企业系统开发的能力.业界有很多.Net与J2EE之争,很多数据是从微软的PetShop和Sun的PetStore而来.这样的争论不可避免带有浓厚的 ...
随机推荐
- firebug的使用方法和技巧(web开发调试工具)
Firebug是firefox下的一个插件,能够调试所有网站语言,如Html,Css等,但FireBug最吸引我的就是javascript调试功 能,使用起来非常方便,而且在各种浏览器下都能使用(IE ...
- 带你认识HTML5中的WebSocket
这篇文章主要介绍了带你认识HTML5中的WebSocket,本文讲解了HTML5 中的 WebSocket API 是个什么东东.HTML5 中的 WebSocket API 的用法.带Socket. ...
- hdu 4968 Improving the GPA (水 暴力枚举)
题目链接 题意:给平均成绩和科目数,求可能的最大学分和最小学分. 分析: 枚举一下,可以达到复杂度可以达到10^4,我下面的代码是10^5,可以把最后一个循环撤掉. 刚开始以为枚举档次的话是5^10, ...
- java--关键字和保留字
关键字:Java的关键字对java的编译器有特殊的意义,他们用来表示一种数据类型,或者表示程序的结构等. 保留字:为java预留的关键字.现在还没用到,但是在升级版本中可能作为关键字. 访问控制:pr ...
- busybox filesystem add ldd function
/******************************************************************** * busybox filesystem add ldd f ...
- 【转】linux驱动开发的经典书籍
原文网址:http://www.cnblogs.com/xmphoenix/archive/2012/03/27/2420044.html Linux驱动学习的最大困惑在于书籍的缺乏,市面上最常见的书 ...
- 在linux的shell里访问一个URL
在linux上访问一个网址有四种方法 1.elinks,用法举例: [weishusheng@centOS6 ~]$ elinks -dump http://www.baidu.com 2. wget ...
- 小技巧--让JS代码只执行一次
有时候实在是没办法,就像我这个比赛系统中,有一个弹出框,这个弹出框之外都是模糊的(这是在ajax写出弹出框时,加了一个水印). 然而遇到的问题,也是蹊跷古怪,因为这个弹出框的事件是数据查询事件,但是因 ...
- 如何获取数据块结构信息dump
有个pub_department的表,索引为PK_PUB_DEPARTMENT. 1.找到object_id select object_id from dba_objects s where ...
- HTML5实现扫描识别二维码/生成二维码
扫描识别二维码 思路: 1. 操作摄像头,获取图片.HTML5 WEBRTC的navigator.getUserMedia方法去实时获取摄像头资源. 2. 利用canvas使用相关算法分析图片识别图 ...