如何为一个高负荷站点配置tomcat连接器(connector)【译文】(第一篇)
引言
最近正好要用到这些内容,因此就找了一篇比较有分量的文章,思来想去,还是尝试写一下译文吧。其实LZ的英语是非常烂的(四级没过的LZ眼泪掉下来),因此这篇文章翻译的水平LZ自己也不敢恭维。各位猿友大致参考一下即可,其中【】符号是LZ的标注,()内的是原文。如果各位有哪里实在看不明白的话,可能是LZ翻译的问题,各位猿友可以去看原文的内容,地址:http://people.apache.org/~mturk/docs/article/ftwai.html。
摘要
倘若你想实现最大的性能和稳定性的话,那么在web服务器后运行tomcat集群是必经之路,这篇文章就是用来描述完成这件事的最佳实践。
tomcat之前
一些人可能会问“为什么要在tomcat前面放置一个web server?”由于最近的JVM技术以及tomcat核心本身的原因,单个tomcat的性能已经非常接近于本地的web服务器,甚至当发送静态文本时,tomcat也只比当前的Apache2web服务器慢10%。因此答案就是:扩展性。
tomcat通过给每个客户端连接分配独立的线程,可以服务许多用户的并发访问。尽管这样tomcat可以做的很好,但是当并发连接数上升的时候,将会出现一些问题。系统为了管理这些线程所花费的时间会降低整体的性能,JVM也将花费更多的时间管理和切换这些线程,然后才能真正的对客户的请求做一些具体的工作。
此外,当应用直接运行在tomcat上的时候,连通性(connectivity)也有不少严重的问题。一个典型的应用可能会处理用户数据、访问数据库或者做一些计算再将结果返回给客户端。所有的这些都是一些耗时的工作,但是为了让用户感觉这是一个可以正常运行的应用程序,大多数时候必须在半秒内(500ms)就完成。如果应用的响应时间为10ms,那么在你的客户抱怨之前,你的应用最多只能同时服务50个并发用户【这句话有点别扭,0.0,但大致意思是理解的】。那么为了支持更多的用户你该怎么做呢?最简单的办法就是买一个更快的硬件,增加更多的CPU或者更多的箱子(boxes)【boxes?箱子?】。两个双路箱子一般比一个四路的便宜,因此添加更多的箱子一般比买一个服务器更加省钱【貌似这个箱子可以替代服务器,到底是什么东西,有英语好的给翻译一下】。
降低tomcat负载的第一件事就是使用web server处理静态文本,就像下图一样。

上图给出了最简单的可行的配置方案。web server用来传送静态文本,而tomcat只处理具体的工作,也就是应用服务。大多数情况下,这就可以满足你了。如果用一个四路的箱子【又是箱子,0.0】,并且应用的响应时间为10ms的话,那么你将能同时服务200个用户,也就是说,一天可以支持350万的访问量【不知道350万这个数字怎么算出来的,用200*60*60*24不是350万,0.0】,这已经是一个比较可观的数字了。
在以上这种程度负载的情况下,你或许不太需要将web server放在tomcat之前。但是还有第二个原因让你这么做,那就是这样创建了一个控制区(demilitarized zone)。将web server放在一个主机上等于在公司的私有网络与互联网或者是其它的外部公共网络之间插入了一个隔离区(neutral zone),这可以让tomcat上的应用安全的访问其它的私有资源,也可以访问公司的私有数据。

除了拥有控制区和可以安全的访问私有网络,还有一些其它的原因,比如可以满足自定义授权的需要。
如果有更多的负载需要承载的话,那么你将不得不添加更多的tomcat应用服务器,这可能是因为客户端的负载已经无法被一个简单的箱子【靠,到现在还没猜出来箱子是什么】处理,也可能是因为当某一个节点宕机时,你需要一种故障恢复的机制。

部署一个包含了多个tomcat应用服务器的架构,需要在web server和tomcat之间加入一个负载均衡器。在apache1.3、apache2.0和IIS中,你可以使用Jakarta Tomcat Connector,因为它提供负载均衡和黏性session机制。在将来的apache2.1/2.2中,可以使用advanced mod_proxy_balancer,它是一个新设计的模块并整合在apache httpd的核心当中。
计算负载
当决定tomcat服务器数量时,你需要满足客户端负载,首要的任务就是决定应用的平均响应时间。正如之前所说,为了满足用户体验,应用不得不在半秒内响应用户。客户端浏览器收到的内容通常会触发多次对web server的请求,比如图片。web页面通常由html和图片数据构成,所以客户端会分发一系列的请求,而获得这些所花费的总的处理和传送时间就是平均响应时间。为了不超过tomcat的极限,你应该限制并发请求数不高于“200/CPU”。
因此,我们可以从一个简单的公式计算出一个物理箱子【这个箱子到底是什么,0.0】能够处理的最大的并发连接数:
并发请求数 = max(500/平均响应时间,200) * CPU个数
另外一件你需要考虑的事,就是web server和tomcat实例之间的网络吞吐量。这里介绍一个新的概念,叫做平均响应大小,这是指一个web页面传送给用户的所有的字节大小。对于一个标准的“8位/字节”的100Mbps网卡,理论上最大的吞吐量为12.5Mbytes。
并发连接数 = 12500/平均响应大小
对于20KB的平均响应大小来说,最大可以支持625的并发请求数。如果你需要承载更大的负载,那么可以增加更多的卡或者使用更快的1Gbps的硬件。
上面的公式教你对于一定数量的并发请求,如何大概估算tomcat、箱子和CPU的数量。如果你接触不到具体的硬件就要进行配置,你可以在一个测试平台上测试平均响应时间,然后比较测试平台与硬件提供商的SPECmarks,这样你可以获得一个比较接近的数值。
文章小结
文章就先翻译到这里吧,剩下的有时间再来翻译,锻炼下自己的有道水平。总的来说,LZ是大致看懂了这篇文章,但是仍旧有些不明白的地方,比如那个box,也就是箱子,到底是指的什么。LZ觉得这个box绝对不应该简单的翻译成箱子,但是LZ实在想不到是什么玩意,所以就只能暂时这么写了。希望有高人路过的话,回答一下这个箱子到底是什么。
幽你一默
LZ看到这两幅图的时候笑跪了,您呢,0.0。


如何为一个高负荷站点配置tomcat连接器(connector)【译文】(第一篇)的更多相关文章
- 分布式文件系统 FastDFS 5.0.5 & Linux CentOS 7 安装配置(单点安装)——第一篇
分布式文件系统 FastDFS 5.0.5 & Linux CentOS 7 安装配置(单点安装)--第一篇 简介 首先简单了解一下基础概念,FastDFS是一个开源的轻量级分布式文件系统,由 ...
- [转]Loadrunner Error code 10053 & Tomcat 连接器(connector)优化
LoadRunner提示错误:Error : socket0 - Software caused connection abort. Error code : 10053. 在今天的测试过程中发现,s ...
- 配置tomcat连接器后,启动服务报错“No Certificate file specified or invalid file format"异常
1:原来的配置是 <Connector port="8443" protocol="HTTP/1.1" SSLEnabled="true&quo ...
- 配置Tomcat的日志系统
成功配置tomcat的log4j日志系统,格式:HTML+每天以yyyy-mm-dd.log命名的日志文件 一.引言: 实习单位让用log4j配置webapp的日志系统,要求产生的日志文件是html格 ...
- Maven 工程下 Spring MVC 站点配置 (二) Mybatis数据操作
详细的Spring MVC框架搭配在这个连接中: Maven 工程下 Spring MVC 站点配置 (一) Maven 工程下 Spring MVC 站点配置 (二) Mybatis数据操作 这篇主 ...
- Eclipse配置tomcat程序发布到哪里去了?
今天帮同事调一个问题,明明可以main函数执行的,他非要固执的使用tomcat执行,依他.但是发布到tomcat之后我想去看看发布后的目录,所以就打开了tomcat中的webapps目录,可是并没有发 ...
- 成功配置TOMCAT的LOG4J日志系统,格式:HTML+每天以YYYY-MM-DD.LOG命名的日志文件
关于log4j.properties文件在web项目中放的位置,找过很多,最后实践结果是: 一.web项目 二.放在src的目录里面,然后项目生成后会自动在\WEB-INF\classes文件里有份l ...
- Tomcat(2):配置Tomcat
1,打开IDEA创建一个项目 2,配置Tomcat服务器 3,运行 5,成功 t t
- 高流量站点NGINX与PHP-fpm配置优化(译)
使用Nginx搭配PHP已有7年的这份经历让我们学会如何为高流量站点优化NGINX和PHP-fpm配置. 以下正是这方面的一些提示和建议: 1. 将TCP切换为UNIX域套接字 UNIX域套接字相比T ...
随机推荐
- Word、rss、HTML解析等dll
RSS.NET.dll RSS.NET是一款操作RSS feeds的开源.NET类库.它为解析和编写RSS feeds提供了一个可重用的对象模型.它完全兼容RSS 0.90, 0.91, 0.92, ...
- 【2017-01-08】QTimer与QThread的调度时间精度
在最近的项目开发中,我发现有的人喜欢用QThread来实现需要循环执行的工作流,而有的人又喜欢用QTimer来实现. 在表面上,两种实现方式似乎都可以,但我觉得QTimer的精度可能会有问题,首先看一 ...
- Java重写&重载
在学习完类和对象后,接下来就要进入面向对象的内容了,先从重写和重载开始吧.重写(Override)和重载(Overload)是两个不同的概念,也是两个容易混淆的概念,下面具体来说说这两者. 重写( ...
- App案例分析——XBMC
本文分析app的是安卓本地视频播放器:XBMC. 第一部分: 调研,评测 1.下载软件并使用起来,描述最简单直观的个人第一次上手体验. 第一次使用这个播放器,就很喜欢这个主界面,其他类似软件的主界 ...
- TCP socket和web socket的区别
小编先习惯性的看了下某中文百科网站对Web Socket的介绍,觉得很囧.如果大家按照这个答案去参加BAT等互联网公司的前端开发面试,估计会被鄙视. 还是让我们阅读一些英文材料吧. 让我们直接看sta ...
- JSON转换的原创工具类
进来在项目中总是遇到ArrayList线性表需要转化成JSONArray的场景,或者Java对象和JSON字符串之间的转化问题,于是乎自己写了一个粗糙的工具类,经过初步的测试,暂时还未发现什么bug, ...
- 是否含有RTTI(运行时类型信息)是动态语言与静态语言的主要区别
运行时类型信息代表类型信息和对内存的操作能力. 运行时类型信息是运行时系统的基础. 类型信息分为编译时类型信息和运行时类型信息两种: 静态语言的类型信息只在编译时使用和保留,在可执行文件中没有类型信息 ...
- PHP学习笔记一:谁动了你的mail(),PHP?
PHP编写邮件发送的函数时候,会出现一个很奇怪的问题,那就是: Warning: mail(): Failed to connect to mailserver at "localhost& ...
- virtualbox+vagrant学习-3-Vagrant Share-5-Security
Security 可以理解,分享你vagrant环境引发了一些安全问题. vagrant share的主要安全机制是通过隐藏的安全性以及SSH的加密密钥.此外,还有几个配置选项可用来帮助控制访问和管理 ...
- ethereumjs/ethereumjs-common-2-API文档
https://github.com/ethereumjs/ethereumjs-common/blob/master/docs/index.md 该API的调用的详细例子可见ethereumjs/e ...