利用内核cgroup机制轻松实现类似docker的系统资源管控
近几年,以docker为代表的容器技术异常火热,它的轻量、高效让人欣喜若狂,它被赋予了改变传统IT运维的使命。相信随着时间推移,以容器云为落地形式的产品将真正实现这一使命。
我们都知道docker能够实现资源的隔离和控制,正当打算引入docker来管理产品不同业务的资源占用时,发现它的隔离性是我们所不需要的,而我们都知道,docker底层实际上是利用了linux内核提供的namespace和cgroup机制,而前者是用于资源隔离的,后者是用于资源控制的。这时,我们想到了直接用cgroup来实现。下面先谈谈什么是cgroup,接着讲解如何使用cgroup来轻松实现对系统资源的管控:
首先,什么是cgroup:
cgroup是Linux内核提供的一种机制,这种机制可以根据特定的行为,把一系列系统任务及其子任务整合(或分隔)到按资源划分等级的不同组内,从而为系统资源管理提供一个统一的框架。cgroups可以限制、记录、隔离进程组所使用的物理资源(包括:CPU、memory、IO等),为容器实现虚拟化提供了基本保证,是构建Docker等一系列虚拟化管理工具的基石。
cgroup提供了哪些功能:
1、资源限制(Resource Limitation):cgroups可以对进程组使用的资源总额进行限制。如设定应用运行时使用内存的上限,一旦超过这个配额就发出OOM(Out of Memory)。
2、优先级分配(Prioritization):通过分配的CPU时间片数量及硬盘IO带宽大小,实际上就相当于控制了进程运行的优先级。
3、资源统计(Accounting): cgroups可以统计系统的资源使用量,如CPU使用时长、内存用量等等,这个功能非常适用于计费。
4、进程控制(Control):cgroups可以对进程组执行挂起、恢复等操作。
对开发者来说,cgroup有哪些有趣的特点:
1、cgroups的API以一个伪文件系统的方式实现,即用户可以通过文件操作实现cgroups的组织管理。
2、cgroups的组织管理操作单元可以细粒度到线程级别,用户态代码也可以针对系统分配的资源创建和销毁cgroups,从而实现资源再分配和管理。
3、所有资源管理的功能都以“subsystem(子系统)”的方式实现,接口统一。
4、子进程创建之初与其父进程处于同一个cgroups的控制组。
本质上,cgroups是内核附加在程序上的一系列钩子(hooks),通过程序运行时对资源的调度触发相应的钩子以达到资源追踪和限制的目的。
好了,下面到主题了,cgroup有这么一些特性,怎么用起来呢,下面分步骤简要描述整个过程:
1、更新linux内核,加入对cgroup机制的支持
2、安装libcgroup,libcgroup是一个开源cgroup工具包,利用它可以更方便使用cgroup特性
1)解压上面的压缩包
2)设置ac_default_prefix指定安装路径,接着执行./configure
3)make clean;make
4)make install
5)拷贝安装文件、脚本、配置到设备上,其中部分启动脚本,包括cgconfig、cgred存在于samples目录下
6)修改/etc/init.d/cgconfig、/etc/init.d/cgred等脚本运行出错问题
3、启动cgconfig、cgred守护服务
1)配置/etc/cgconfig.conf、/etc/cgrules.conf
#######/etc/cgconfig.conf(供cgconfig加载,用于mount挂载成cgroup文件系统)#######
#cgconfigparser -l cgconfig.conf
mount {
cpu = /sys/fs/cgroup;
memory = /sys/fs/cgroup;
cpuset = /sys/fs/cgroup;
cpuacct = /sys/fs/cgroup;
devices = /sys/fs/cgroup;
freezer = /sys/fs/cgroup;
blkio = /sys/fs/cgroup;
hugetlb = /sys/fs/cgroup;
}
group cgroup1{
perm{
admin{
uid=root;
gid=root;
}
task{
uid=root;
gid=root;
}
}
cpuset{
cpuset.cpus=2;
cpuset.mems=0;
}
cpu{
cpu.shares=1024;
}
memory{
memory.limit_in_bytes=40M;
}
blkio{
blkio.weight=1000;
}
}
group cgroup2{
perm{
admin{
uid=root;
gid=root;
}
task{
uid=root;
gid=root;
}
}
cpuset{
cpuset.cpus=2;
cpuset.mems=0;
}
cpu{
cpu.shares=512;
}
memory{
memory.limit_in_bytes=40M;
}
blkio{
blkio.weight=1000;
}
}
#########/etc/cgrules.conf(供cgred加载,用于控制不同名字进程加入指定cgroup,怎么样,这个是不是很叼!)########
#<user> <controllers> <destination>
#
#john cpu usergroup/faculty/john/
#john:cp cpu usergroup/faculty/john/cp
#@student cpu,memory usergroup/student/
*:test_cpu1.sh * cgroup1 #模拟测试cpu资源分配有效性
*:test_mem1.sh * cgroup1 #模拟测试内存资源分配有效性
*:test_blk1.sh * cgroup1 #模拟测试io资源分配有效性
*:test_cpuset.sh * cgroup1 #模拟测试cpu core分配有效性
*:test_blk2.sh * cgroup2 #模拟测试io资源分配有效性
*:test_cpu2.sh * cgroup2 #模拟测试cpu资源分配有效性
*:test_mem2.sh * cgroup2 #模拟测试内存资源分配有效性
2)使用/etc/init.d/cgconfig start、/etc/init.d/cgred start启动服务
3)启动成功之后可以使用多个命令查看cgroup信息,如lscgroup/lssubsys/cgget/等
4、到这里,就已经完成了基本环境的搭建,下一步就可以通过脚本模拟各种资源占用(包括cpu/内存/io/cpu core等)来测试cgroup
对应子系统有效性了
由于时间关系这里就先不描述具体的测试过程了,可以自行摸索下,有疑问可以留言
http://www.infoq.com/cn/articles/docker-kernel-knowledge-cgroups-resource-isolation/
http://www.ibm.com/developerworks/cn/linux/1506_cgroup/index.html#ibm-pcon
libcgroup:
http://libcg.sourceforge.net/html/index.html
libcgroup使用:
http://www.jianshu.com/p/dc3140699e79
https://access.redhat.com/documentation/zh-CN/Red_Hat_Enterprise_Linux/6/html/Resource_Management_Guide/
http://www.elmerzhang.com/2012/12/28/cgroups-learning-6-blkio-subsystem/
内核读写文件过程分析:
http://oenhan.com/linux-kernel-write
mmap和direct io区别:
http://www.cnblogs.com/zhaoyl/p/5901680.html
利用内核cgroup机制轻松实现类似docker的系统资源管控的更多相关文章
- Docker资源管理探秘:Docker背后的内核Cgroups机制
http://www.infoq.com/cn/articles/docker-resource-management-cgroups 随着Docker技术被越来越多的个人.企业所接受,其用途也越来越 ...
- Linux内核同步机制--转发自蜗窝科技
Linux内核同步机制之(一):原子操作 http://www.wowotech.net/linux_kenrel/atomic.html 一.源由 我们的程序逻辑经常遇到这样的操作序列: 1.读一个 ...
- Linux内核OOM机制的详细分析【转】
本文转载自:http://blog.csdn.net/liukuan73/article/details/43238623 Linux内核根据应用程序的要求分配内存,通常来说应用程序分配了内存但是并没 ...
- 锁相关知识 & mutex怎么实现的 & spinlock怎么用的 & 怎样避免死锁 & 内核同步机制 & 读写锁
spinlock在上一篇文章有提到:http://www.cnblogs.com/charlesblc/p/6254437.html 通过锁数据总线来实现. 而看了这篇文章说明:mutex内部也用到 ...
- Linux内核同步机制
http://blog.csdn.net/bullbat/article/details/7376424 Linux内核同步控制方法有很多,信号量.锁.原子量.RCU等等,不同的实现方法应用于不同的环 ...
- Linux内核OOM机制的详细分析(转)
Linux 内核 有个机制叫OOM killer(Out-Of-Memory killer),该机制会监控那些占用内存过大,尤其是瞬间很快消耗大量内存的进程,为了 防止内存耗尽而内核会把该进程杀掉.典 ...
- Linux 内核同步机制
本文将就自己对内核同步机制的一些简要理解,做出一份自己的总结文档. Linux内部,为了提供对共享资源的互斥访问,提供了一系列的方法,下面简要的一一介绍. Technorati 标签: ...
- Linux内核OOM机制的详细分析
Linux 内核有个机制叫OOM killer(Out-Of-Memory killer),该机制会监控那些占用内存过大,尤其是瞬间很快消耗大量内存的进程,为了防止内存耗尽而内核会把该进程杀掉.典型的 ...
- 利用linux信号机制调试段错误(Segment fault)
在实际开发过程中,大家可能会遇到段错误的问题,虽然是个老问题,但是其带来的隐患是极大的,只要出现一次,程序立即崩溃中止.如果程序运行在PC中,segment fault的调试相对比较方便,因为可以通过 ...
随机推荐
- Java线程:堵塞队列与堵塞栈
一.堵塞队列 Java定义了堵塞队列的接口java.util.concurrent.BlockingQueue,堵塞队列是一个指定长度的队列,当试图向队列中添加元素而队列已满,或者是想从队列移出元素而 ...
- HTML 表单和输入
HTML 表单 表单是一个包含表单元素的区域. 表单元素是允许用户在表单中输入内容,比如:文本域(textarea).下拉列表.单选框(radio-buttons).复选框(checkboxes)等等 ...
- Bootstrap 输入组
Bootstrap 输入组: <!DOCTYPE html> <html lang="en"> <head> <meta charset= ...
- JSTL标签之c:foreach,c:if标签小结
<c:forEach>标签用于通用数据循环,它有以下属性 属 性 描 述 是否必须 缺省值 items 进行循环的项目 否 无 begin 开始条件 否 0 end 结束条件 否 集合中的 ...
- Recurrent Neural Network系列3--理解RNN的BPTT算法和梯度消失
作者:zhbzz2007 出处:http://www.cnblogs.com/zhbzz2007 欢迎转载,也请保留这段声明.谢谢! 这是RNN教程的第三部分. 在前面的教程中,我们从头实现了一个循环 ...
- tbl.js div实现的表格控件,完全免费,no jquery
html上现在有比较好用的表格控件是datatable,但是编辑.按钮等部分是收费的,只有基础功能免费.而且尺寸发生变化时需要手工刷新等繁琐操作较多.所以我开发一个免费的供大家使用. 本项目已用于“虚 ...
- loadrunner动态从mysql取值
loadrunner动态从mysql取值 [需要下载跟数据库服务器一致的dll,32位或64位] loadrunner中有参数化从数据库中取值,但是只是静态的,对于一些要实时取值的数据就game ov ...
- 图论——Dijkstra算法
图论其实是比较难的一种题型,但是一些模板题,是没有什么太大难度的! 这里给大家带来的是迪杰斯特拉(Dijkstra)算法. 迪杰斯特拉算法是由荷兰计算机科学家狄克斯特拉于1959 年提出的,因此又叫狄 ...
- 在QT中引用Shark Machine Learning library
最近因为项目需要,看了看机器学习方面的东西.Google一番,发现Shark正是朕需要的东西.于是准备按官方文档来使用它了.但是官方文档只有怎么生成静态库,并没有在QT里引用的sample. 废话不多 ...
- PHP变量处理之serialize
官方定义: string serialize ( mixed $value ) serialize() 返回字符串,此字符串包含了表示 value 的字节流,可以存储于任何地方.这有利于存储或传递 P ...