在linux服务器使用过程中,由于linux对内存的使用原则是能cache就尽量cache,所以会出现pagecache占用很多的情况。

suse的版本有一个pagecachelimit的功能,centos中没有看到。即便是将这个功能合入到centos中,也会发现设置了没效果的情况。

cat /proc/sys/vm/pagecache_limit_mb

1.将0改为对应的值,比如说12000,限制为120G,我们来看对应的内核中算法为什么没有生效,

page cache总数 > 8*free_pages + pagecache_limit_mb

算法的关键是判断是否需要进行pagecache限制触发的回收,当pagecache设置某个值之后,系统中并不是直接以这个值作为判断标志,而是加上了free的限制,

从这个意义上说,因为设置的pagecache_limit_mb比较少,但是当free很多的时候,是比较难触发这个条件的。那么要加大回收还有哪些手段?下面针对读和写两个方面来描述。

2.是通过修改/proc/sys/vm/dirty_background_ration以及/proc/sys/vm/dirty_ratio两个参数的大小来实现回收。

这种场景针对的是很多写的情况:vm.dirty_background_ratio:这个参数指定了当文件系统缓存脏页数量达到系统内存百分之多少时(如5%)就会触发pdflush/flush/kdmflush等后台回写进程运行,将一定缓存的脏页异步地刷入外设;

vm.dirty_ratio:而这个参数则指定了当文件系统缓存脏页数量达到系统内存百分之多少时(如10%),系统不得不开始处理缓存脏页(因为此时脏页数量已经比较多,为了避免数据丢失需要将一定脏页刷入外存);在此过程中很多应用进程可能会因为系统转而处理文件IO而阻塞。

为什么需要两个比例?之前一直错误的认为dirty_ratio的触发条件不可能达到,因为每次肯定会先达到vm.dirty_background_ratio的条件,后来根据业务现象,发现不是如此。确实是先达到vm.dirty_background_ratio的条件然后触发flush进程进行异步的回写操作,但是这一过程中应用进程仍然可以进行写操作,如果多个应用进程写入的量大于flush进程刷出的量那自然有可能达到vm.dirty_ratio这个参数所设定的坎,此时操作系统会转入同步地处理脏页的过程,可能阻塞应用进程。

3.针对流媒体使用的时候,写脏页不多,大多数是读的场景,大多是sendfile或者read引起了很多文件进入cache,但是这些文件被继续访问的概率很低,所以相当于是一次性使用,之后相当长的时间之内是不会再使用的,所以我们对于pagecache限制的需求很强烈,由于内核本身就有根据水线来动态回收page cache的功能,因此问题的根源可能还在于默认情况下min和low水线间隔太近,导致当free内存低于low水线后,发起的kswapd回收太慢,无法跟上临时大量内存申请的节奏,从而free内存很快突破min水线,造成内存申请过程中进行cache回收或是申请失败,从而引起性能问题

因此解决问题的办法之一,可以通过加大min和low水线之间的间隔来实现

内核刚好提供了这样一个参数,即/proc/sys/vm/extra_free_kbytes,设置该参数后将拉大min和low水线的间隔,从而保证有足够的空闲内存来应对临时大量的内存动态申请。

4.加大水线,提高水线有助于提前触发回收,这样相当于后面的内存需求,能从时间上更快触发回收,但是当你的内存消耗速度大于内存回收的速度,还是会cahce很多,kswap很高。

5.如果还是回收不及时的话,那么需要将kswap的nice级别调低,也有一些帮助,renice设置为-20,虽然从调度上来说它还是低于实时进程,但是比调整前级别高了些。

6.使用posix_madvise,madvise,fadvise,利用POSIX_MADV_DONTNEED特性,但也不能调用太多,容易引起sys冲高,大家在测试的时候,可以分别对访问几M之后做清理,找到最佳的设置点。

7.修改系统调用,带入一个特性值进入,使得系统得知不放入cache,这个和directio的区别是,尽量不要拷贝到用户态,要区分应用场景,因为directio目前还不支持sendfile这种调用,需要多一次拷贝,也就是虽然节省了查找address_space中的radix树的流程,但是多了一次内核到用户态的内存拷贝。当然,我曾经尝试将directio变成支持sendfile,因为sendfile是基于splice的调用,而原来的directio的流程中,是将用户的页面作为写入地址的,所以需要将directio中对页面的检查部分进行定制修改,主要修改pmd的映射。

8.如果是内存化的存储介质,也就是可以按字节寻址的存储介质,则可以开启DAX特性,mount挂载的时候,带上该特性,这样就绕过了pagecache。

9.这个是对6的改进,有一定的特殊性,在加入radix树之前,主动调用 invalidate_mapping_pages ,这个比在用户态释放麻烦些,但是效果更好。

如果大家有更好的办法,希望能提醒一下我。

另外,cache里面保持了哪些内容,这个问题经常会被问到。

这里要提到两个工具,一个是vmtouch,另外一个是hcache,源码我就不贴了,有兴趣的可以去网上下载。

lsof |grep REG|grep mnt|sort -u |awk '{print $9}'|xargs vmtouch

这个会将我们应用场景下cache占用的文件累计起来,大家要使用的话需要根据文件名称过滤一下。前提是这个文件的句柄还在被pid所持有,有的文件fd已经关闭,但是还是在系统中存放,那么这个方法是获取不到的。

除了这两个工具查看,还有slab的占用要算在里面,

SlabInfo=`cat /proc/slabinfo |awk 'BEGIN{sum=0;}{sum=sum+$3*$4;}END{print sum/1024/1024}'`

常见的还有另外一个问题,就是热点文件的访问,当时我的处理思路是,每隔一段时间,取一下lsof,然后对比前后两个文件。

#!/bin/bash

sum=;

while read line
do
if [ $(grep $line $|wc -l) -eq ]
then
echo $line >>$1_2_$.txt
sum=$(($sum+))
fi
done < $
echo "sum=$sum"

sum的个数就是前后相同的文件个数,不太精确,因为文件有打开就有关闭,但是多次取样的话,效果还可以。

有的应用场景会尽量不要pagecache,比如视频点播,但是又不能用dio读,因为dio读有对齐要求,而且没法预读,常用的办法是在用户态取dropcache,但这个dropcache不分青红皂白,

所以我们在内核态改造成了对某些特定格式,特定大小,特定访问时间的进行drop,效果比较好。

linux pagecache限制与查看的更多相关文章

  1. Linux使用jstat命令查看jvm的GC情况

    Linux使用jstat命令查看jvm的GC情况 http://www.open-open.com/lib/view/open1390916852007.html http://www.aiuxian ...

  2. Linux使用netstat命令查看并发连接数[转]

    转自:http://www.cnblogs.com/wayne173/p/5652043.html Linux使用netstat命令查看并发连接数   我们的网站部署在linux的服务器上,特别是we ...

  3. Linux和Windows下查看环境变量方法对比

    摘自:Linux和Windows下查看环境变量方法对比 一.查看所有环境变量的名称和值 Linux下:export Windows下:set 二.根据名称查该环境变量的值 Linux下:echo $环 ...

  4. Linux命令 — 设置或查看网络配置命令ifconfig

    ifconfig命令用于设置或查看网络配置,包括IP地址.网络掩码.广播地址等.它是linux系统中,使用频率最高的关于网络方面的命令. 1. 命令介绍 命令格式: ifconfig [interfa ...

  5. 在Linux下用netstat查看网络状态、端口状态

    在Linux下用netstat查看网络状态.端口状态 在linux一般使用netstat 来查看系统端口使用情况步. netstat命令是一个监控TCP/IP网络的非常有用的工具,它可以显示路由表.实 ...

  6. Linux下的tree命令 --Linux下目录树查看

    Linux下的tree命令 --Linux下目录树查看 有时我们需要生成目录树结构,可以使用的有ls -R,但是实际效果并不好 这时需要用到tree命令,但是大部分Linux系统是默认不安装该命令的, ...

  7. linux上的图片查看器FEH_image_view

    Linux上的图片查看器, 简单,没有多余功能,打开快速,体积小 在终端用feh # 直接执行feh显示当前目录所有图片 feh # 或者指定图片名 feh pic1 pic2 pic3 # 显示一个 ...

  8. Linux 如何使用gdb 查看core堆栈信息

    转载:http://blog.csdn.net/mergerly/article/details/41994207 core dump 一般是在segmentation fault(段错误)的情况下产 ...

  9. [转帖]Linux 硬件和系统配置查看命令小结

    https://blog.csdn.net/strongwangjiawei/article/details/8208825 转帖了不少 发现自己记住的还是不多.. Linux 硬件和系统配置查看命令 ...

随机推荐

  1. MyEclipse 2015利用Cygwin+CDT搭建C/C++开发环境

    GitHub原文:https://github.com/x113773/testall/issues/22 首先安装Cygwin 1:首先去网站 www.cygwin.com 下载 Cygwin 的 ...

  2. angular4.0命令行汇总

    查看ng命令行 ng help 创建项目 ng new projectName ng new projectName --routing[--routing表示创建带路由的项目] 配置依赖 npm i ...

  3. 关于dl dt dd 文字过长换行在移动端显示对齐的探讨总结

    关于dl  dt dd 文字过长换行在移动端显示对齐的探讨总结 <dl> <dt>抵押房产:</dt> <dd>1.北京市大兴区兴华大街丽园小区3单大兴 ...

  4. 获取Windows系统中的所有可用和在用串口

    目的:获取Windows系统中的所有可用和在用串口 方法:注册表查询法 优点:简单.实用.快速.无遗漏,无多余结果. 说明:另外还有8种方法可以枚举串口,但都不如此法. 代码和详细注释如下: //-- ...

  5. 关于S/4HANA里Sales Office 和Sales Organization那些事儿

    今天这篇文章来自我的成都同事Zhang Sean(张正永). Sean也是一位在SAP行业摸爬滚打多年的老兵了,2009年从大学硕士毕业之后就进入了SAP Labs从事开发工作,目前是SAP 成都S/ ...

  6. Core Animation 文档翻译 (第二篇)

    Core Animation 文档翻译 (第二篇) 核心动画基础要素 核心动画为我们APP内Views动画和其他可视化元素动画提供了综合性的实现体系.核心动画不是我们APP内Views的替代品,相反, ...

  7. Class对象的创建与使用

    类与Class对象 类是程序的一部分,每个类都有一个Class对象,即每当编写并且编译一个新类的时候就会产生一个Class对象.当程序创建第一个对类的静态成员的引用的时候,会将该类动态加载到JVM中, ...

  8. Windows下安装Selenium

    安装python,建议在官网下载python3以上的版本 安装easy_install,找度娘 安装selenium,在命令行窗口下输入:pip install -U selenium 下载chrom ...

  9. 基于Grafana+SimpleJson的灵活报表解决方案

    在时序分析及监控展现领域,Grafana无疑是开源解决方案中的翘楚,其灵活的插件机制,支持各种漂亮的面板.丰富的数据源以及强大的应用.典型的面板有Graph.Text.Singlestat.PieCh ...

  10. CSS3中only-child伪类选择器

    <body> <style type="text/css"> //只对li1设置样式 li:nth-child(1):nth-last-child(1){ ...