读书笔记-构建高性能Web站点
基本概念
- 带宽:通常说的带宽比如8M带宽,是指主机与互联网运营商的交换机之间的数据传输速度,因为数据链路层的流量是通过控制接收方实现的。而百兆网卡则是指网卡的发送速度为100Mbit/s,则是指网卡发送数据的速度
- 吞吐率:单位是reqs/s,指服务器的并发能力,就是单位时间内服务器处理的请求数.最大吞吐率是指单位时间内服务器能够处理的最大请求数.通常使用压力测试的方法通过模拟足够数目的并发用户数,分别连续发送一定的Http请求,并统计测试持续的总时间,计算出基于这种压力下的吞吐率,即为一个平均计算值.注意在压力测试中提到的每个用户连续发送请求是指在发送一个请求并接收到相应数据后再发送下一个请求.所以1个用户连续向服务器发送1000个请求与100个用户连续向服务器发送10个请求给服务器造成的压力是不一样的,后者造成的压力更大,因为同一时刻网卡接收缓存区排队的请求更多.
- 吞吐率要在一个前提下得出,那就是压力和请求资源的性质,压力一般包含两部分,即并发用户数和总请求数,也就是模拟多个用户同时向服务器发送多少个请求.请求资源性质则是请求的Url所代表的资源的描述,比如1kb的静态文件或者包含19次数据库查询的动态内容.所以吞吐率的前提包括:
- 并发用户数:某一时刻同时向服务器发送请求的用户数目
- 服务器最多支持多少并发用户数,即最大并发用户数也是有一定前提的,即满足服务器和和用户所期待的最大收益,失去前提那么最大并发数会更大,但用户体验会很糟,比如等待时间过长,服务器吞吐率会变的很低
- 一个用户可能会给服务器带来两个或者更多的并发用户数压力
- 总请求数
- 请求资源描述
- 并发用户数:某一时刻同时向服务器发送请求的用户数目
- 长连接:本身是Tcp通信的一种普通方式,即在一次Tcp连接中持续发送多分数据而不断开连接.与之对应的是短连接,也就是建立连接后发送一份数据便断开,然后再次建立连接发送下一份数据,周而复始.Http长连接需要浏览器和服务器共同协作,一方面浏览器需要保持一个Tcp连接并重复利用,另一方面服务器不能过早的主动关闭连接.目前浏览器都支持长连接,表现在发出的Http请求数据头中包含长连接的声明:Connection:Keep-Alive.对于长连接的有效使用,关键的一点在于长连接超时设置,即什么时候关闭长连接,这个设置同时出现在浏览器和web服务器上,因为双方都可以主动关闭连接.如IE7 默认的超时时间是1分钟,Web服务器则会在配置文件中提供超时设置。浏览器与服务器超时设置不一致时以最短的超时时间为准
缓存
- 缓存机制包括整页缓存,局部缓存,数据缓存,代码解释器缓存以及web服务器缓存等
- 对于动态网页,页面缓存的内容实际上就是动态网页输出的HTML。一个动态网页根据url参数的不同会生成不同结果,对于每种结果都必须生成对应的缓存文件.缓存文件文件必须标记过期时间,动态页面每次都要对缓存进行过期检查.过期检查一般有两种方法:
- 根据缓存文件的创建时间和缓存的有效期长度,计算当前时间缓存文件是否过期
- 根据缓存文件的过期时间判断当前时间缓存文件是否过期
- 缓存文件除了放在磁盘中,还可以放到内存中(memcached),也可以放在独立的缓存服务器中,利用memcached可以很容易将缓存存到其他服务器
- 缓存有效期是一个需要斟酌的值,有效期过大可以提高缓存命中率,但动态网页的内容得不到及时更新,有效期过小则需要频繁创建缓存。除了不断调整缓存有效期之外,缓存机制还提供了一个有效的缓存控制途径,可以在任何时候强制清空所有缓存
- 静态化内容的更新策略包含如下两种,它们可以互相弥补,共同应用在站点的静态化方案中
- 在数据更新时重新生成静态化内容
- 定时重新生成静态化内容
- 尽可能让web站点的内容缓存在用户浏览器中,这样可以一定程度减少浏览器的计算开销。浏览器一般会在用户的文件系统中创建一个目录,用于存放缓存文件,并给每个缓存文件打上一些必要的标记,比如过期时间
- 缓存协商的过程: 首先浏览器向web服务器请求内容时,web服务器会告诉浏览器哪些内容可以被缓存,浏览器对这些内容进行缓存后,当再次向服务器请求这些内容时,就会询问服务器是否可以使用本地的缓存,服务器收到询问就会做出回应,到底是允许浏览器使用本地缓存还是将最新的内容传回浏览器
- 协商方法有两种:
- Last-Modified:动态程序可以在返回给浏览器的Http响应头添加最后修改时间,这个时间是GMT时间.浏览器再次请求相同内容时会在Http请求头里添加 If-Modified-Since:时间 ,这表示在询问服务器请求的内容在这个时间之后是否有更新.对于静态内容web服务器会自己进行浏览器缓存是否过期的检查,如果是动态内容则需要动态程序自己来检查. 如果内容没有更新,返回给浏览器的http相应头会包含304 Not Modified的信息,表示web服务器告诉浏览器这个内容没有更新,浏览器可以使用本地缓存的内容,同时服务器也没有将内容正文传给浏览器
- ETag协商,ETag是一串编码,web服务器可以自由定义ETag的格式和实现,如以文件内容的md5值作为ETag。Web服务器返回的相应头里会包含ETag值,web浏览器询问改内容是否发生变化时则会在请求头里添加 If-None-Match:ETag值。
- 浏览器缓存截止日期:使用Expires标记可以告诉浏览器缓存过期的时间,暗示浏览器在缓存过期之前可以直接使用缓存,不用询问服务器,这样可以节省宽带和服务器处理等开销。对于静态内容web服务器在默认情况下不会开启Expires标记,对于动态内容Expires标记仍然需要程序自身添加,类似于之前的Last-Modified.要注意的是Expires是服务器的时间,如果用户本地时间与服务器时间不一致,可能影响到本地缓存的有效期检查.Http协议还有一个Cache-Control的标记可以弥补Expires的不足,格式是Cache-Control:max-age=<second>,它表示缓存过期的相对时间,单位是秒,而且是相对于浏览器本地时间而言。Http响应头同时包含Expires和Cache-Control时浏览器会优先考虑Cache-Control的值
- 如何请求页面:
- Ctrl+F5:强制刷新,不适用缓存协商,获取所有内容的最新版本
- F5:允许浏览器在请求中附加必要的缓存协商,但不允许浏览器直接使用本地缓存,也就是能让Last-Modified发挥作用,但对Expires无效
- 转到按钮:浏览器会对所有没有过期的内容直接使用本地缓存,Expires标记只对这种方式有效
Web服务器缓存
。。。。。。。。。。
读书笔记-构建高性能Web站点的更多相关文章
- 【读书笔记】2016.12.10 《构建高性能Web站点》
本文地址 分享提纲: 1. 概述 2. 知识点 3. 待整理点 4. 参考文档 1. 概述 1.1)[该书信息] <构建高性能Web站点>: -- 百度百科 -- 本书目录: 第1章 绪论 ...
- 构建高性能WEB站点笔记三
构建高性能WEB站点笔记三 第10章 分布式缓存 10.1数据库的前端缓存区 文件系统内核缓冲区,位于物理内存的内核地址空间,除了使用O_DIRECT标记打开的文件以外,所有对磁盘文件的读写操作都要经 ...
- 构建高性能WEB站点笔记二
构建高性能WEB站点笔记 因为是跳着看的,后面看到有提到啥epoll模型,那就补充下前面的知识. 第三章 服务器并发处理能力 3.2 CPU并发计算 进程 好处:cpu 时间的轮流使用.对CPU计算和 ...
- 构建高性能web站点笔记一
构建高性能web站点笔记 第三章 服务器并发处理能力 3.1吞吐率 描述服务器在实际运行期间单位时间内处理的请求数.也就是一定并发用户的情况下,服务器处理请求能力的量化体现. 吞吐率的前提包括: 并发 ...
- 构建高性能web站点--读书大纲
用户输入你的站点网址,等了半天..还没打开,裤衩一下就给关了.好了,流失了一个用户.为什么会有这样的问题呢.怎么解决自己站点“慢”,体验差的问题呢. 在这段等待的时间里,到底发生了什么?事实上这并不简 ...
- 《构建高性能 Web站点》笔记
书名:构建高性能Web站点 出版社: 电子工业出版社 ISBN:9787121170935 一 绪论 等待的时间: (1) 数据在网络上的传输时间 (2) 站点服务器处理请求并生成回应数据的时间 ( ...
- 《构建高性能web站点》随笔 无处不在的性能问题
前言– 追寻大牛的足迹,无处不在的“性能”问题. 最近在读郭欣大牛的<构建高性能Web站点>,读完收益颇多.作者从HTTP.多级缓存.服务器并发策略.数据库.负载均衡.分布式文件系统多个方 ...
- [拇指飞动]构建高性能Web站点(1)
<构建高性能Web站点>中提到了Aphache, Nginx和lighthttpd. 把我的笔记share一下. 一般来讲Apache主要是基于多进程模型,早期的fork模式会为每一个re ...
- 【转】构建高性能WEB站点之 吞吐率、吞吐量、TPS、性能测试
内容参考:构建高性能WEB站点.pdf 一.吞吐率 我们一般使用单位时间内服务器处理的请求数来描述其并发处理能力.称之为吞吐率(Throughput),单位是"req/s".吞吐率 ...
随机推荐
- 常见问题处理之Emoji
所谓Emoji就是一种在Unicode位于\u1F601-\u1F64F区段的字符.这个显然超过了目前常用的UTF-8字符集的编码范围\u0000-\uFFFF.Emoji表情随着IOS的普及和微信的 ...
- Java基础——GridBagLayout布局
1.GridBagLayout布局管理器非常灵活,每个 GridBagLayout 对象维持一个动态的矩形单元网格: 2.需要和它的约束类(GridBagConstraints类)一起使用: 3.Gr ...
- Sqlite基本命令集合(linux/fedora/ubuntu)
注:fedora自带sqlite3,无需安装,直接输入命令sqlite3即可. ------------Ubuntu在命令行输入sqlite3,确认没有安装在进行--- 1.安装sqlite3 ubu ...
- SQL Server死锁排查
1. 死锁原理 根据操作系统中的定义:死锁是指在一组进程中的各个进程均占有不会释放的资源,但因互相申请被其他进程所站用不会释放的资源而处于的一种永久等待状态. 死锁的四个必要条件:互斥条件(Mutua ...
- 常规RPC通讯过程【转载】
在 HTTP2 协议正式开始工作前, 如果已经知道服务器是 HTTP2 的服务器, 通讯流程如下: 客户端必须首先发送一个连接序言,其逻辑结构: PRI * HTTP/2.0\r\n\r\nSM\r\ ...
- Chrome添加Unity本地文档引擎
前提:输入Unity后出来的第一连接 浏览器的设置: 分别填入: UnityDocs unity3d.com/cn file:///Applications/Unity/Documentation/e ...
- ABBYY FineReader双十一优惠享不停,战绩如何?
随着双十一的火热来袭,购物达人也是不吝啬囊中票子,各种姿势剁手齐全,立誓过后吃土半月,双十一的好与不好?自己也是门清,反正真真的是促进消费了! 就ABBYYFineReader而言,此次的双十一力度就 ...
- flex-2
1. 2. justify:整理版面 3. 4.归纳 justify-content:flex-start(默认).center.flex-end 下面还会提到剩下的两种项目在主轴上对齐方式: spa ...
- io框架
IO流的三种分类方式 1.按流的方向分为:输入流和输出流 2.按流的数据单位不同分为:字节流和字符流 3.按流的功能不同分为:节点流和处理流 (节点流表示的是直接操作节点(例如文件,键盘)的流,例如F ...
- UVALive-8079 Making a Team 排列组合公式化简
题目链接:https://cn.vjudge.net/problem/UVALive-8079 题意 n个人组队,队伍人数小于等于n,每个队伍需要4个不同的职务的领导. 问这n个人可以组成多少队? n ...