Linux性能优化之内存优化(二)

前言

　　不知道大家看完前面一章关于CPU优化，是否受到相应的启发呢？如果遇到任何问题，可以留言和一起探讨这方面的问题。接下来我们介绍一些关于内存方面的知识。内存管理软件包括虚拟内存系统、地址转换、交换、换页和分配。与性能密切相关的内容包括：内存释放、空闲链表、页扫描、交换、进程地址空间和内存分配器。在Linux中，空闲链表通常由分配器消耗，如内核的slab分配器和SLUB,以及用户级分配器(glibc,linux系统)libmalloc、libumem和mtmalloc。

slab: 内核slab分配器管理特定大小的对象缓存，使他们能够被快速的回收利用，并且避免页分配的开销。适用于处理固定大小结构的内核内存分配。
slub: 基于slab分配器。它主要是解决slab分配器带来的问题，其中包括移除对象队列，以及每个CPU缓存，把NUMA优化留给页分配器。
glibc: 结合多种非配器策略的高效分配器，它基于分配请求的长度进行分配。较小的分配来自内存集合，包括用伙伴关系算法合并长度相近的单位。较大的分配用树高效地搜索空间。对于非常大的分配，会转到mmap（）。

　　回收大多是从内核的slab分配器缓存释放内存。这些缓存包含slab大小的未使用内存块,以供充裕。内核页面换出守护进程管理利用换页释放内存。当主存中可用的空闲链表低于阈值时，页面换出守护进程会开始页扫描。页面换出守护进程被称作kswapd（）,它扫描非活动和活动内存的LRU页列表以释放页面。它的激活基于空闲内存核两个提供滞后的阈值。一旦空闲内存达到最低阈值,kswapd运行于同步模式，按需求释放内存页。该最低阈值是可调的(vm.min_free_kbytes)，并且其他阈值基于它按比例放大。

相关概念

主存：物理内存，描述了计算机的告诉数据存储区域，通常是动态随机访问内存；
虚拟内存: 抽象的主从概念，它几乎是无限的和非竞争性的；
常驻内存：当前处于主存中的内存；
匿名内存：无文件系统位置或者路径名的内存。它包括进程地址空间的工作数据，称作堆；
地址空间：内存上下文。每个进程和内核都有对应的虚拟地址空间；
页：操作系统和CPU使用的内存单位。它一直以来是4KB和8KB。现代的处理器允许多种页大小以支持更大的页面尺寸，以及更大的透明大页；
缺页：无效的内存访问；
换页：在主存与存储设备间交换页；
交换：指页面从主从转移到交换设备（迁移交换页）；
交换（空间）：存放换页的匿名数据和交换进程的磁盘空间；

　　进程地址空间是一段范围的虚拟页，由硬件和软件同事管理，按需映射到物理页。这些地址被划分为段以存放线程栈、进程可执行、库和堆。应用程序可执行段包括分离的文本和数据段。库也由分离的可执行文本和数据段组成。分别如下：

可执行文本：包括可执行的进程CPU指令。由文件系统中的二进制应用程序文本映射而来。它是只读的并带有执行的权限。
可执行数据：包括已初始化的变量，由二进制应用程序的数据段映射而来。有读写权限，因此这些变量在应用程序的运行过程中可以被修改。
堆：应用程序的临时工作内存并且是匿名内存。它按需增长并且用mollac()分配。
栈：运行中的线程栈，映射为读写。

　　对于内存而言，经常关注的信息如下：

页扫描：寻找连续的页扫描（超过10秒），它是内存压力的预兆。可以使用sar -B并查看pgscan列。
换页：换页是系统内存低的进一步征兆。可以使用vmstat 并查看si（换入）和 so（换出）列。
可用内存：查看和关注buffer和cache值；
OOM终结者：在系统日志/var/log/messages或者dmesg中查看，直接搜索"Out of memory"；
top/prstat：查看那些进程和用户是常驻物理内存和虚拟内存的最大使用者；
stap/perf：内存分配的栈跟踪，确认内存使用的原因；

　　如何快速定位内存故障？
　　1. 首先应该检查饱和度（作为释放内存压力的衡量，页扫描、换页、交换和Linux OOM终结者牺牲进度的使用程度），因为持续饱和状态是内存问题的征兆。这些指标可以通过vmstat、sar、dmesg等操作系统工具轻易获得。对于配置了独立磁盘交换设备的系统，任何交换设备活动都是内存压力的征兆。

　　2. 使用率（使用内存和可用内存，物理内存和虚拟内存都应该关注）通常较难读取和解读。比如一个系统可能会报告只有几十兆内存可用，但事实上它有10GB的文件系统缓存在，需要时立刻被应用程序回收利用。虚拟内存使用，这应该也是我们关注的一个点。

　　3. 内存错误（Out of memory）一般都是由应用程序报告。

关于内存性能排查命令

vmstat

[root@zbredis-30104 ~]# vmstat

procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----

r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st

0  0    0 14834208 158384 936512    0    0     0     0    1    3  0  0 100  0  0

提示：

　　swpd：交换处的内存量；
　　free：空闲的可用内存；
　　buff: 用户缓冲缓存的内存；
　　cache: 用于页缓存的内存；
　　si: 换入的内存(换页);
　　so：换出的内存（换页）；

如果si 和 so列一直非0,那么系统正存在内存压力并换页到交换设备或文件。经常使用参数为"vmstat 1 -Sm"和"vmstat -a 1"；

sar

　　-B: 换页统计信息；

　　-H: 大页面统计信息
　　-r: 内存使用率
　　-R：内存统计信息
　　-S：交换空间统计信息
　　-W：交换统计信息

slabtop

　　通过slab分配器实时输出内核slab缓存使用情况；

[root@localhost ~]# slabtop -sc

Active / Total Objects (% used)    : 297064 / 300262 (98.9%)

Active / Total Slabs (% used)      : 6638 / 6638 (100.0%)

Active / Total Caches (% used)     : 66 / 96 (68.8%)

Active / Total Size (% used)       : 80612.41K / 81749.09K (98.6%)

Minimum / Average / Maximum Object : 0.01K / 0.27K / 8.00K

OBJS ACTIVE  USE OBJ SIZE  SLABS OBJ/SLAB CACHE SIZE NAME

7648   7528  98%    2.00K    478	 16     15296K kmalloc-2048

65142  65142 100%    0.19K   1551	 42     12408K dentry

17985  17985 100%    0.58K    327	 55     10464K inode_cache

7110   7110 100%    1.06K    237	 30	 7584K xfs_inode

10880  10160  93%    0.50K    170	 64	 5440K kmalloc-512

30564  30564 100%    0.11K    849	 36	 3396K sysfs_dir_cache

输出包括顶部的汇总和slab列表。其中包括对象数量(OBJS)、多少是活动的(ACTIVE)、使用百分比(USE)、对象大小(OBJ SIZE,字节)和缓存大小(CACHE SIZE,字节)。

　　可以列出包括内存使用统计信息在内的所有进程细节；

　　%MEM: 主存使用(物理内存、RSS)占总内存的百分比；
　　RSS：常驻集合大小；
　　VSZ: 虚拟内存大小；

提示：RSS显示主存使用，它也包括如系统库在内的映射共享段，可能会被几十个进程共享。如果你把RSS列求和，会发现她超过系统内存总和，这是由于重复计算了这部分共享内存。

pmap

[root@localhost ~]# pmap -x 1096

1096:   /usr/sbin/mysqld --basedir=/usr --datadir=/var/lib/mysql --plugin-dir=/usr/lib64/mysql/plugin --log-error=/var/log/mysqld.log --pid-file=/var/run/mysqld/mysqld.pid --socket=/var/lib/mysql/mysql.sock

Address           Kbytes     RSS   Dirty Mode  Mapping

0000000000400000   11960    3468       0 r-x-- mysqld

00000000011ae000     668     240     172 r---- mysqld

0000000001255000    1028     364     208 rw--- mysqld

0000000001356000     340     312     312 rw---   [ anon ]

0000000001887000    7508    7344    7344 rw---   [ anon ]

...省略部分...

00007ffc659e9000     132      72      72 rw---   [ stack ]

00007ffc65ba1000       8       4       0 r-x--   [ anon ]

ffffffffff600000       4       0       0 r-x--   [ anon ]

---------------- ------- ------- -------

total kB          961172  121756  116468

内存优化

首先关于内核优化的相关参数

vm.dirty_background_bytes：默认值为0，触发pdflush后台回写的脏存储器量；

vm.dirty_background_ratio：默认值10，触发pdflush后台回写脏系统存储器百分比；
vm.dirty_bytes：默认值为0，触发一个写入进程开始回写的脏存储器量；
vm.dirty_ratio：默认值为20，触发一个写入进程开始回写的脏系统存储器比例；
vm.dirty_expire_centisecs：默认值为3000，使用pdflush的脏存储器最小时间；
vm.dirty_writeback_centisecs：默认值为500，pdflush活跃时间间隔(0为停用)；
vm.min_free_kbytes：默认值为 dynamic，设置期望的空闲存储器量（一些内核自动分配器能消耗它）；
vm.overconmmit_memory：默认值为0，0表示利用探索法允许合理的国度分配；1表示一直国度分配；3表示禁止国度分配；
vm.swappiness：默认值为60，相对于页面高速缓存回收更倾向用交换释放存储器的程度；
vm.vfs_cache_pressure：默认值为100，表示回收高速缓存的目录和inode对象的程度。较低的值会保留更多;0意味着从不回收，容器导致存储器耗尽的情况；

提示：

vm.dirty_background_bytes和vm.dirty_background_ratio是互斥的，dirty_bytes 和 dirty_ratio 也是如此，仅能设置一个。vm.swappiness参数对性能会产生显著的影响，建议设置为0;因为应用程序内存能尽可能就地驻留。

最后说明，在现在内核发展过程之中，linux内存页面已经支持大页面和超大页面以及透明大页面等，可以根据自身环境进行适当的调整。红帽企业版 Linux 6 采用第二种方法，即使用超大页面。简单说，超大页面是 2MB 和 1GB 大小的内存块。2MB 使用的页表可管理多 GB 内存，而 1GB 页是 TB 内存的最佳选择。

超大页面必须在引导时分配。它们也很难手动管理，且经常需要更改代码以便可以有效使用。因此红帽企业版 Linux 也部署了透明超大页面 (THP)。THP 是一个提取层，可自动创建、管理和使用超大页面的大多数方面。

THP 系统管理员和开发者减少了很多使用超大页面的复杂性。因为 THP 的目的是改进性能，所以其开发者（社区和红帽开发者）已在各种系统、配置、程序和负载中测试并优化了 THP。这样可让 THP 的默认设置改进大多数系统配置性能。

　　注：THP 目前只能映射异步内存区域，比如堆和栈空间。关于THP相关使用及问题可自行查阅资料。

Linux性能优化之内存优化(二)的更多相关文章

微擎开启性能优化里面的性能优化memcache内存优化及数据库读写分离
http://www.mitusky.com/forum.php?mod=viewthread&tid=3135 [微擎安装使用] 微擎开启性能优化里面的性能优化memcache内存优化及数 ...
转 iOS和android游戏纹理优化和内存优化(cocos2d-x)
iOS和android游戏纹理优化和内存优化(cocos2d-x) (未完成) 1.2d游戏最占内存的无疑是图片资源. 2.cocos2d-x不同平台读取纹理的机制不同.ios下面使用CGImage, ...
【转】一文掌握 Linux 性能分析之内存篇
[转]一文掌握 Linux 性能分析之内存篇前面我们已经学习了 CPU 篇,这篇来看下内存篇. 01 内存信息同样在分析内存之前,我们得知到怎么查看系统内存信息,有以下几种方法. 1.1 /pro ...
KVM总结-KVM性能优化之内存优化
我们说完CPU方面的优化(http://blog.csdn.net/dylloveyou/article/details/71169463),接着继续第二块内容,也就是内存方面的优化.内存方面有以下四 ...
2017版：KVM 性能优化之内存优化
我们说完CPU方面的优化,接着我们继续第二块内容,也就是内存方面的优化.内存方面有以下四个方向去着手: EPT 技术大页和透明大页 KSM 技术内存限制 1. EPT技术 EPT也就是扩展页表,这 ...
tomcat性能优化，内存优化和并发线程连接优化
今天被一同事问到tomcat和内存优化的问题,而网上的资料基本都是来回copy,所以抽时间随便写点.文章中设置的参数都是一个随便写的,具体的还要根据自己的情况来定. 1.内存优化: 说到tomcat不 ...
python性能优化、内存优化、内存泄露；与其他语音比较效率如何？
1.内存泄露:http://www.cnblogs.com/xybaby/p/7491656.html 2.内存优化:http://www.cnblogs.com/xybaby/p/7488216.h ...
Android优化之内存优化倒计时篇
本文来自网易云社区作者:聂雷震本篇文章介绍的内容是如何在安卓手机上实现高效的倒计时效果,这个高效有两个标准:1.刷新频率足够高,让用户觉得这个倒计时的确是倒计时,而不是幻灯片:2.不能占用太多的内 ...
一文掌握 Linux 性能分析之内存篇
本文首发于我的公众号 Linux云计算网络(id: cloud_dev),专注于干货分享,号内有 10T 书籍和视频资源,后台回复「1024」即可领取,欢迎大家关注,二维码文末可以扫. 前面我们已经学 ...

随机推荐

Mysql(四)正则表达式
一.正则表达式 1.使用like可以进行不确定的查询(模糊查询),然而,模糊查询的功能有限,当需要进行更加复杂的模式匹配时,可以使用正则表达式来完成. 2.正则表达式可以对指定的字符串与模式之间执 ...
【总结】STL--map
map支持以下功能: size():查询 map 中的 key 的个数 empty():判空 clear():清空 insert()/erase():插入/删除 find(x):查找 key 为 x ...
【疑点】js中的break,continue和return到底怎么用？
转: [疑点]js中的break,continue和return到底怎么用? 为什么要说个?好像很简单,但是我也会迷糊,不懂有时候为什么要用return,然而break和continue也经常和他放在 ...
冒泡排序与选择排序(经典版)----java基础总结
前言:关于冒泡排序和选择排序,每次写的时候都要再看看他们的概念,这次,就自己写明白 1.冒泡排序: 其实冒泡排序应该用例子证明,设数组长度为N. 1．比较相邻的前后二个数据,如果前面数据大于后面的数据 ...
linux服务器安装mysql并配置外网访问
linux服务器安装mysql并配置外网访问更新系统,如果不运行该命令,直接安装mysql,会出现"有几个软件包无法下载 sudo apt-get update 安装mysql sudo ...
bzoj千题计划269：bzoj2655: calc (拉格朗日插值）
http://www.lydsy.com/JudgeOnline/problem.php?id=2655 f[i][j] 表示[1,i]里选严格递增的j个数,序列值之和那么ans=f[A][n] * ...
[Apio2012]dispatching 左偏树做法
http://codevs.cn/problem/1763/ 维护子树大根堆,当子树薪水和>m时,删除最贵的点 #include<cstdio> #include<iostre ...
贪心算法： Codevs 1052 地鼠游戏
#include <iostream> #include <algorithm> #include <queue> #include <cstring> ...
Javascript你不知道的那些事！（数字计算篇-变态篇）无意中聊天发现的一些奇怪的事情
javascript:alert(0.1 + 0.2) 如果看到这样一道题你会怎么思考了!大家肯定第一反应0.3,但是考虑到我已经这样问了!那么幼稚的答案我会专门写篇文章吗然后人就开始折磨自己了会不 ...
JavaScript编写风格指南 (三)
七(七):严格模式 // 严格模式应当仅限在函数内部使用,千万不要在全局使用 //不好的写法:全局使用严格模式"user strict"; function doSomething ...

Linux性能优化之内存优化(二)

Linux性能优化之内存优化(二)的更多相关文章

随机推荐

热门专题