《Linux 性能及调优指南》3.1 确认瓶颈

翻译：飞哥 ( http://hi.baidu.com/imlidapeng )

原文名称：《Linux Performance and Tuning Guidelines》

原文地址：http://www.redbooks.ibm.com/abstracts/redp4285.html

-------------------------------------------------------------------------------------------

下面的步骤可用来作为快速调优的策略：

1. 了解你的系统。
2. 备份系统。
3. 监控和分析系统性能。
4. 缩小瓶颈范围，找出原因。
5. 修复导致瓶颈的原因，每次只做一个变更。
6. 回到第3步，直到系统性能达到满意。

提示：你应该将每一个步骤记录在文件中，特别是你针对性能所做的变更和及其影响。

3.1.1 搜集信息

大多数情况下，你所能得到的第一手信息就是“服务器出现了问题”。
所以利用一些探索性问题来弄清和记录下问题是非常重要的。

这里列出一些问题用来帮助你更好的了解系统。

▶ 你能给我关于所涉及服务器的完整信息吗？

- 型号
- 使用年限
- 配置
- 外围设备
- 操作系统版本和更新等级

▶ 你能告诉我究竟出现了什么问题？

- 都有哪些症状？
- 描述一下错误信息。

对于有些人回答这个问题有些困难，但用户提供的任何额外信息都有可能帮助你找到问题。
例如，用户可能说“当我拷贝文件到服务器时速度真的很慢。”。这就暗示网络有问题或硬盘子系统有问题。

▶ 谁受到这个问题的影响？

一个人、某些人还是整个组织受这个问题的影响？这可以帮助你判断问题是否出现在某段特定的网络中还是与应用相关等等。
如果只有一个用户受此问题影响，很可能是用户的PC出了问题（或者是他们想象出来的）。

The perception clients have of the server is usually a key factor.
从这个观点来说，性能问题并不一定与涉及服务器直接有关：
位于服务器和客户端的网络极易成为导致问题的原因，这包括网络设备和其他提供服务的服务器，例如域控制器。

▶ 问题是否可以重现？

所有可以重现的问题都能被解决。如果你在系统方面经验丰富，你应该能找出问题根源并采取相应的措施。

问题的重现可以让你更好的了解和明白此问题。记录重现问题的相关步骤是十分必要的：

- 重现问题需要哪些步骤？

知道这些步骤可以帮助你在相同条件下不同的机器中再现相同的问题。如果可以，你将有机会使用测试机来代替崩溃的生产服务器。

- 是一个间歇性问题吗？

如果问题间歇性发生，第一件要做的是就是搜集信息并找到可以重现问题的规律，目标就是构建一个情境让问题可以随时发生。

- 问题在每天的特定时间或每周的特定某天发生吗？

这可能帮助你查明问题是由什么引起的。问题可能发生在大家上午上班或下午上班时，想办法改变现有作息时间（这可能减少问题发生的机会或发生的更加频繁）；以便让问题可以重现。

- 问题很少见吗？

如果问题不可以重现，你可能得出结果在特殊情况下问题才会发生并将其归类为已解决。在现实生活中，此问题还是极有可能再次发生的。

在排除难以重现的问题时，有效的措施就是：重启或将机器的驱动程序和补丁升级到最新。

▶ 问题是什么时候开始的？是渐渐的还是突然发生的？

如果性能问题是渐渐出现的，这很像是一个容量规划问题；
如果它是突然出现的，很可能是由于服务器或外围设备的变更引起的。

▶ 服务器是否有做过变更（小的或大的）或客户端使用服务器的方法有改变吗？

- 客户是否改变过服务器或外围设备而导致了问题的发生？有网络变更的所有记录吗？

需求会随着业务的改变而改变，影响对服务器和网络系统的需求。

▶ 还涉及了其它的服务器或硬件吗？

▶ 有日志可以用吗？

▶ 问题的优先级是什么？什么时候问题必须解决？

- 必须在几分钟内解决还是允许在几天内解决？你可能有充分时间来解决问题；或已启动应急方案。

- 问题有多大？

- 相关的损失有哪些？

3.1.2 分析服务器性能

重要提示：在执行任何故障排除动作前，备份所有的数据和配置信息，防止其部分或全部丢失。

此时，你应开始监控服务器。最简单的方法就是在需要分析的服务器上运行监控工具。（参看第二章“监控和基准工具”）。

在运行高峰时（例如，上午9点到下午5点）记录服务器的性能日志；
取决于有提供哪些服务和有哪些人在使用这些服务。

在记录日志时如果可以应该包含下列字段：

处理器【Processor】
系统【System】
服务器工作队列【Server work queues】
内存【Memory】
分页文件【Page file】
物理硬盘【Physical disk】
重定向器【redirector】
网络接口【Network interface】

在你开始前，要牢记井然有序的进行性能调优是非常重要的。
你可以使用我们推荐的流程为你的服务器进行调优，

流程如下：

1.清楚影响服务器性能的因素。

2.测量出当前的性能作为基线，用于与后来的测量数据比较来识别出系统的瓶颈。

3.使用监控工具来识别性能瓶颈。按照下节介绍，你可以缩小瓶颈的范围到子系统级。

4.针对导致瓶颈的元件执行相应调整，提升服务器性能以满足需要。

注释：当服务器其它元件都有足够的能力来维持性能在一个较高的级别时，通过升级存在瓶颈的元件可以获得最好的效果。

5.对性能进行新的测量，对比调优前后的性能差异。

当尝试处理性能问题时，请记住下列事项：

▶ 应用程序应该使用适当的优化级别进行编译，这样可以少走弯路。

▶ 在你做任何升级和修改前执行测量，以便于确定变更是否有效果。（换句话说就是执行基线测量）

▶ 检查项目不应只有新增加的硬件，还要包括配置有更改的现有设备。

《Linux 性能及调优指南》3.1 确认瓶颈的更多相关文章

《Linux 性能及调优指南》写在后面的话
感谢飞哥的翻译. 目前飞哥 (http://hi.baidu.com/imlidapeng)的网址已经不能访问了. <Linux 性能及调优指南>这本书的原文地址:http://www.r ...
《linux性能及调优指南》 3.5 网络瓶颈
3.5 Network bottlenecks A performance problem in the network subsystem can be the cause of many prob ...
Linux性能及调优指南1.2之Linux内存架构
本文为IBM RedBook的Linux Performanceand Tuning Guidelines的1.2节的翻译原文地址:http://www.redbooks.ibm.com/redpap ...

随机推荐

Redis Cluster 4.0高可用集群安装、在线迁移操作记录
之前介绍了redis cluster的结构及高可用集群部署过程,今天这里简单说下redis集群的迁移.由于之前的redis cluster集群环境部署的服务器性能有限,需要迁移到高配置的服务器上.考虑 ...
hiho一下第165周#1327 : 分隔相同字符
题目要求: 时间限制:10000ms单点时限:1000ms内存限制:256MB 描述给定一个只包含小写字母'a'-'z'的字符串 S ,你需要将 S 中的字符重新排序,使得任意两个相同的字符不连在一起 ...
struts2+dojo实现datagrid
ACTION: package test.action; import java.util.ArrayList; import java.util.HashMap; import java.util. ...
Java锁的选择
1.synchronized: 当只有少量竞争者.synchronized不会引发死锁 2.ReentrantLock:竞争者不少,但是趋势可以预估.使用不当,可能造成死锁.
Hanlp中使用纯JAVA实现CRF分词
Hanlp中使用纯JAVA实现CRF分词与基于隐马尔可夫模型的最短路径分词.N-最短路径分词相比,基于条件随机场(CRF)的分词对未登录词有更好的支持.本文(HanLP)使用纯Java实现CRF模型 ...
win10：如何开启自带虚拟机
1.首先要找到控制面板,我们点开windows键,然后选择在所有应用中找到“Windows 系统”,打开之后,我们找到“控制面板”,打开. 2.打开控制面板之后,我们选择程序,如图示. 3 ...
GTX log 6
5.24-7.2 相关算法判断两颗二叉树相等有两种方法:一种是递归比较.另一种是二叉树的遍历. 先说二叉树的遍历.由于先序遍历再加上中序遍历能唯一确定一棵二叉树.故,对这两棵树分别进行先序和中 ...
sourceInsight与IAR的同步
编写与编译二者同步:引用http://bbs.ednchina.com/BLOG_ARTICLE_3013475.HTM 1 在IAR中新建一个工程TEST.菜单栏 File->New-> ...
oracle 存储过程、游标参考实例
create or replace procedure INIT_DICT_QUEUECODE(p_queueId int,p_paramType in varchar2,p_queenName in ...
STL基础--仿函数(函数对象)
1 首先看个仿函数的例子 class X { public: void operator()(string str) { // 函数调用运算符,返回类型在operator之前 cout << ...

《Linux 性能及调优指南》3.1 确认瓶颈

《Linux 性能及调优指南》3.1 确认瓶颈的更多相关文章

随机推荐

热门专题