Block层也是有IO的优先级的
---恢复内容开始---
今天查看iotop的原理,竟然发现了IO优先级一说,IO是block层cfs调度器中的概念
block层也有一个类似于CPU的调度算法
对进程分成三个级别:RT,BE,IDLE
其中,RT就是最高优先级的调度,类似与CPU调度中的RT调度,当有RT进程在的时候,其他的进程不会享受到磁盘的带宽;
BE:相当于CPU中的cfs调度器,可以保证公平高效地让进程共享IO资源;
IDLE:就是CPU中的最高一级的调度器了,当没有RT和BE的进程在的时候,才会让IDLE策略的进程去使用IO资源;
//-------------
通用块层和电梯调度层的区别【】
目前内核中的算法叫做CFQ,试图为所有进程提供一个完全公平的调度环境,以此保证每个进程的IO资源的占用是公平的,同时也设计了进程级别的优先级调度,在这里我们只需要知道,时间片分好了,优先级调好了,block层肯定能给所有的进程一个公平的IO资源占用(实现进程级别的IO资源按照权重分配)。
blkio中的cgroup资源的划分就是在cfq的基础上做的。所以如果想要使用权重比例分配,应该先确认对应的磁盘使用的是cfq调度算法.
cfq是比较好的IO调度算法,对桌面用户也是比较好的选择。但是对于很多IO压力较大的场景就并不是很适用,尤其在IO压力集中在某些进程上的场景。因为这些场景我们需要满足某几个进程的执行速度,而不是让全部进程公平想用IO的带宽。
deadline更适应这样的场景的解决方案。deadline有四个通用的
//-----------
调度器:
block层可
在哪里更新iops的值
blk_throtl_bio
generic_make_request_check --> blkcg_bio_issue_check --> blk_throtl_bio
在哪里更新IO信息?add_acct_request
blk_queue_bio --> add_acct_request 【IO经过层层检查并且已经进入了某个等待队列】
各种方法各有利弊,cfq是一种比较通用的调度算法,是一种以进程为出发点考虑的算法,以尽量保证大家的公平。deadline只有当IO请求达到一定期限的时候才进行调度,因此非常适合业务比较单一且IO压力比较重的业务。
当然,IO贮存是以分区为单位,还是以磁盘为单位呢?
---恢复内容结束---
今天查看iotop的原理,竟然发现了IO优先级一说,IO是block层cfs调度器中的概念
block层也有一个类似于CPU的调度算法
对进程分成三个级别:RT,BE,IDLE
其中,RT就是最高优先级的调度,类似与CPU调度中的RT调度,当有RT进程在的时候,其他的进程不会享受到磁盘的带宽;
BE:相当于CPU中的cfs调度器,可以保证公平高效地让进程共享IO资源;
IDLE:就是CPU中的最高一级的调度器了,当没有RT和BE的进程在的时候,才会让IDLE策略的进程去使用IO资源;
//-------------
通用块层和电梯调度层的区别【】
目前内核中的算法叫做CFQ,试图为所有进程提供一个完全公平的调度环境,以此保证每个进程的IO资源的占用是公平的,同时也设计了进程级别的优先级调度,在这里我们只需要知道,时间片分好了,优先级调好了,block层肯定能给所有的进程一个公平的IO资源占用(实现进程级别的IO资源按照权重分配)。
blkio中的cgroup资源的划分就是在cfq的基础上做的。所以如果想要使用权重比例分配,应该先确认对应的磁盘使用的是cfq调度算法.
cfq是比较好的IO调度算法,对桌面用户也是比较好的选择。但是对于很多IO压力较大的场景就并不是很适用,尤其在IO压力集中在某些进程上的场景。因为这些场景我们需要满足某几个进程的执行速度,而不是让全部进程公平想用IO的带宽。
deadline更适应这样的场景的解决方案。deadline有四个通用的
//-----------
调度器:
block层可
在哪里更新iops的值
blk_throtl_bio
generic_make_request_check --> blkcg_bio_issue_check --> blk_throtl_bio
在哪里更新IO信息?add_acct_request
blk_queue_bio --> add_acct_request 【IO经过层层检查并且已经进入了某个等待队列】
各种方法各有利弊,cfq是一种比较通用的调度算法,是一种以进程为出发点考虑的算法,以尽量保证大家的公平。deadline只有当IO请求达到一定期限的时候才进行调度,因此非常适合业务比较单一且IO压力比较重的业务。
当然,IO贮存是以分区为单位,还是以磁盘为单位呢?
---恢复内容开始---
今天查看iotop的原理,竟然发现了IO优先级一说,IO是block层cfs调度器中的概念
block层也有一个类似于CPU的调度算法
对进程分成三个级别:RT,BE,IDLE
其中,RT就是最高优先级的调度,类似与CPU调度中的RT调度,当有RT进程在的时候,其他的进程不会享受到磁盘的带宽;
BE:相当于CPU中的cfs调度器,可以保证公平高效地让进程共享IO资源;
IDLE:就是CPU中的最高一级的调度器了,当没有RT和BE的进程在的时候,才会让IDLE策略的进程去使用IO资源;
//-------------
通用块层和电梯调度层的区别【】
目前内核中的算法叫做CFQ,试图为所有进程提供一个完全公平的调度环境,以此保证每个进程的IO资源的占用是公平的,同时也设计了进程级别的优先级调度,在这里我们只需要知道,时间片分好了,优先级调好了,block层肯定能给所有的进程一个公平的IO资源占用(实现进程级别的IO资源按照权重分配)。
blkio中的cgroup资源的划分就是在cfq的基础上做的。所以如果想要使用权重比例分配,应该先确认对应的磁盘使用的是cfq调度算法.
cfq是比较好的IO调度算法,对桌面用户也是比较好的选择。但是对于很多IO压力较大的场景就并不是很适用,尤其在IO压力集中在某些进程上的场景。因为这些场景我们需要满足某几个进程的执行速度,而不是让全部进程公平想用IO的带宽。
deadline更适应这样的场景的解决方案。deadline有四个通用的
//-----------
调度器:
block层可
在哪里更新iops的值
blk_throtl_bio
generic_make_request_check --> blkcg_bio_issue_check --> blk_throtl_bio
在哪里更新IO信息?add_acct_request
blk_queue_bio --> add_acct_request 【IO经过层层检查并且已经进入了某个等待队列】
各种方法各有利弊,cfq是一种比较通用的调度算法,是一种以进程为出发点考虑的算法,以尽量保证大家的公平。deadline只有当IO请求达到一定期限的时候才进行调度,因此非常适合业务比较单一且IO压力比较重的业务。
当然,IO贮存是以分区为单位,还是以磁盘为单位呢?
---恢复内容结束---
今天查看iotop的原理,竟然发现了IO优先级一说,IO是block层cfs调度器中的概念
block层也有一个类似于CPU的调度算法
对进程分成三个级别:RT,BE,IDLE
其中,RT就是最高优先级的调度,类似与CPU调度中的RT调度,当有RT进程在的时候,其他的进程不会享受到磁盘的带宽;
BE:相当于CPU中的cfs调度器,可以保证公平高效地让进程共享IO资源;
IDLE:就是CPU中的最高一级的调度器了,当没有RT和BE的进程在的时候,才会让IDLE策略的进程去使用IO资源;
//-------------
通用块层和电梯调度层的区别【】
目前内核中的算法叫做CFQ,试图为所有进程提供一个完全公平的调度环境,以此保证每个进程的IO资源的占用是公平的,同时也设计了进程级别的优先级调度,在这里我们只需要知道,时间片分好了,优先级调好了,block层肯定能给所有的进程一个公平的IO资源占用(实现进程级别的IO资源按照权重分配)。
blkio中的cgroup资源的划分就是在cfq的基础上做的。所以如果想要使用权重比例分配,应该先确认对应的磁盘使用的是cfq调度算法.
cfq是比较好的IO调度算法,对桌面用户也是比较好的选择。但是对于很多IO压力较大的场景就并不是很适用,尤其在IO压力集中在某些进程上的场景。因为这些场景我们需要满足某几个进程的执行速度,而不是让全部进程公平想用IO的带宽。
deadline更适应这样的场景的解决方案。deadline有四个通用的
//-----------
调度器:
block层可
在哪里更新iops的值
blk_throtl_bio
generic_make_request_check --> blkcg_bio_issue_check --> blk_throtl_bio
在哪里更新IO信息?add_acct_request
blk_queue_bio --> add_acct_request 【IO经过层层检查并且已经进入了某个等待队列】
各种方法各有利弊,cfq是一种比较通用的调度算法,是一种以进程为出发点考虑的算法,以尽量保证大家的公平。deadline只有当IO请求达到一定期限的时候才进行调度,因此非常适合业务比较单一且IO压力比较重的业务。
当然,IO贮存是以分区为单位,还是以磁盘为单位呢?
///-------->
内核
每次同步的读操作都会触发这样的操作,在这个读操作中会触发:__blk_run_queue_uncond,干哈子啊这是,也就是说我一个读的操作,要刷回目前device等待队列里的所有的IO!天啊,如果系统中此时有等待的IO,那么这个时候要刷回系统中所有的IO?
【突然有个想法:其实对于block来说,每个进程都是同步!无论是同步读,调用sync/directIO,还是kworker异步的进程,都是一个进程带着IO进入设备的等待队列,对于上面这些线程来说,都是同步的】
#0 scsi_dispatch_cmd (cmd=0xffff88007d351380) at drivers/scsi/scsi_lib.c:1578
#1 0xffffffff814ba3ae in scsi_request_fn (q=0xffff88007c4d0000) at drivers/scsi/scsi_lib.c:1769
#2 0xffffffff813521a3 in __blk_run_queue_uncond (q=<optimized out>) at block/blk-core.c:325
#3 __blk_run_queue (q=0xffff88007c4d0000) at block/blk-core.c:343
#4 0xffffffff81356738 in blk_queue_bio (q=0xffff88007c4d0000, bio=0xffff88007c4dfb00) at block/blk-core.c:1799
#5 0xffffffff81354900 in generic_make_request (bio=0xffff88007c4dfb00) at block/blk-core.c:2062
#6 0xffffffff81354a1e in submit_bio (bio=0xffff88007d351380) at block/blk-core.c:2122
#7 0xffffffff811b35e4 in submit_bh_wbc (op=<optimized out>, op_flags=2087354696, bh=0xffff88007d351380, bio_flags=18446612134400221448,
wbc=<optimized out>) at fs/buffer.c:3101
#8 0xffffffff811b4115 in submit_bh (bh=<optimized out>, op_flags=<optimized out>, op=<optimized out>) at fs/buffer.c:3114
#9 ll_rw_block (op=0, op_flags=48, nr=<optimized out>, bhs=<optimized out>) at fs/buffer.c:3164
#10 0xffffffff811fd5f8 in ext4_bread (handle=<optimized out>, inode=<optimized out>, block=<optimized out>, map_flags=<optimized out>)
at fs/ext4/inode.c:998
#11 0xffffffff81206834 in __ext4_read_dirblock (inode=0xffff88007c14f120, block=0, type=DIRENT, func=<optimized out>, line=960)
at fs/ext4/namei.c:99
#12 0xffffffff81207177 in htree_dirblock_to_tree (dir_file=<optimized out>, dir=0xffff88007c14f120, block=<optimized out>,
hinfo=0xffffc9000025bd90, start_hash=<optimized out>, start_minor_hash=<optimized out>) at fs/ext4/namei.c:960
#13 0xffffffff81207f86 in ext4_htree_fill_tree (dir_file=0xffff88007d351380, start_hash=2087354696, start_minor_hash=<optimized out>,
next_hash=<optimized out>) at fs/ext4/namei.c:1079
#14 0xffffffff811f5e40 in ext4_dx_readdir (ctx=<optimized out>, file=<optimized out>) at fs/ext4/dir.c:574
#15 ext4_readdir (file=0xffff88007c4df900, ctx=0xffffc9000025bef0) at fs/ext4/dir.c:121
#16 0xffffffff81192339 in iterate_dir (file=0xffff88007c4df900, ctx=0xffffc9000025bef0) at fs/readdir.c:50
#17 0xffffffff811927c8 in SYSC_getdents (count=<optimized out>, dirent=<optimized out>, fd=<optimized out>) at fs/readdir.c:230
#18 SyS_getdents (fd=<optimized out>, dirent=<optimized out>, count=32768) at fs/readdir.c:211
#19 0xffffffff8186bd60 in entry_SYSCALL_64 () at arch/x86/entry/entry_64.S:209
#20 0x00007f9cc87a4698 in ?? ()
什么情况下已经合并到电梯里面了,但是却并没有下发,竟然给了合并的机会。感觉都是直接下发去了. plug只是很少的情况吧:
[昨晚睡觉之前想出来的答案:非plugin的进程,每个进程来了之后,就是会直接通过run_blk_queue下去刷自己的包,在函数blk_peek_request中取request去下发,但是这个时候scsi的处理速度也不是一定,所以会有大量的包在堆积在电梯中的情况,因为去取包的时候是加锁的吗?接着朝下看]
spin_unlock_irq(q->queue_lock);
上面这个锁用的太恶心了,因为散落在各处的 lock VS unlock ,也就是说在进程A去刷自己的东西的时候,进程B也可能去刷掉,进程C也有可能把自己的一个bio插入到某一个队列中去,好了,那现在进程可以排队这个没有疑问了,那么新的疑问是:我进程A是一个读的进程,那么我通过__run_blk_queue方法进入到这个函数中去了,然后这个函数是一个循环,他要刷掉所有的要等待的IO才算数,我去,真的是这个样子吗?并且这样也不合理呀,我只要保证我的读下去了不就行了,为什么要保证别的读,甚至是别的写的IO要下去呀,
Block层也是有IO的优先级的的更多相关文章
- 《Linux内核精髓:精通Linux内核必会的75个绝技》一HACK #13 使用Block I/O控制器设置I/O优先级
HACK #13 使用Block I/O控制器设置I/O优先级 本节介绍使用Block I/O控制器的功能设置I/O优先级的方法.Block I/O控制器可以将任意进程分组,并对该分组设置I/O的优先 ...
- BLOCK层基本概念:bio,request,request_queue
Summary bio 代表一个IO 请求 request 是bio 提交给IO调度器产生的数据,一个request 中放着顺序排列的bio 当设备提交bio 给IO调度器时,IO调度器可能会插入bi ...
- 限制容器的 Block IO - 每天5分钟玩转 Docker 容器技术(29)
前面学习了如何限制容器对内存和CPU的使用,本节我们来看 Block IO. Block IO 是另一种可以限制容器使用的资源.Block IO 指的是磁盘的读写,docker 可通过设置权重.限制 ...
- 第 4 章 容器 - 029 - 限制容器的 Block IO
限制容器的 Block IO Block IO 是另一种可以限制容器使用的资源. Block IO 指的是磁盘的读写,docker 可通过设置权重.限制 bps 和 iops 的方式控制容器读写磁盘的 ...
- 27-限制容器的 Block IO
Block IO 是另一种可以限制容器使用的资源.Block IO 指的是磁盘的读写,docker 可通过设置权重.限制 bps 和 iops 的方式控制容器读写磁盘的带宽,下面分别讨论. 注:目前 ...
- Linux文件IO与通用块层的请求合并
本文参考https://mp.weixin.qq.com/s/Imt4BW-zoHPpcOpcKZs_AQ, 公众号“Linux阅码场” 请求合并就是将进程内或者进程间产生的在物理地址上连续的多个IO ...
- 转 Linux 性能优化之 IO 子系统
本文介绍了对 Linux IO 子系统性能进行优化时需要考虑的因素,以及一些 IO 性能检测工具. 本文的大部分内容来自 IBM Redbook - Linux Performance and Tun ...
- Linux 性能优化之 IO 子系统
本文介绍了对 Linux IO 子系统性能进行优化时需要考虑的因素,以及一些 IO 性能检测工具. 本文的大部分内容来自 IBM Redbook - Linux Performance and Tun ...
- Linux 性能优化之 IO 子系统 系列 图
http://blog.sina.com.cn/s/articlelist_1029388674_11_1.html Linux 性能优化之 IO 子系统(一) 本文介绍了对 Linux IO 子系统 ...
随机推荐
- 项目 XXX 受源代码管理。向源代码管理注册此项目时出错。建议不要对此项目进行任何修改
原本带vss或者svn管理的项目独立复制出来后,如果出现下面问题 解决办法: 使用记事本打开,项目csproj文件删除图中
- java基础30问
Java基础知识30问 1. 面向对象和面向过程的区别 面向过程 优点: 性能比面向对象高,因为类调用时需要实例化,开销比较大,比较消耗资源;比如单片机.嵌入式开发.Linux/Unix等一般采用 ...
- kruscal 模板
/* Kruskal模板 */ struct edge{ int from; int to; int next; int value; bool operator<(const edge a) ...
- Java的按值传递和按引用传递解说
在网上看到的一个帖子解释Java的按值传递和按引用传递,感觉挺全面,就转过来,以供以后学习参考: 1:按值传递是什么 指的是在方法调用时,传递的参数是按值的拷贝传递.示例如下: public clas ...
- php获取设备的宽度和高度
php获取设备的宽度和高度 如果前台没有传输当前请求的宽度和高度,我们有时候需要用php借助javascript获取屏幕的宽和高,以控制现实的样式. 代码如下: <?php /* * 获取设备宽 ...
- stark组件(7):增加分页功能
效果图: 分页部分代码: # 1.分页处理 all_count = self.model_class.objects.all().count() query_params = request.GET. ...
- c++右值引用
右值 右值是相对与左值来说的. 左值是以变量的形式存在,指向一个指定的内存,可以对它取地址.右值就是不指向任何地方,它是暂时和短命的,不能对它取地址. 右值引用 把临时的.生命周期短的值,绑定到一个变 ...
- 匿名函数lambda python
lambda 的主体是一个表达式,不是一个代码块lambda 只有一行,仅仅能在lambda表达式种封装有限的逻辑进去匿名函数:需要一个函数,而又不想动脑筋去想名字 #普通函数的定义 def f(a, ...
- POJ:2385-Apple Catching(dp经典题)
Apple Catching Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 14311 Accepted: 7000 Descr ...
- python-1基础总结
输入 >>> name = input() 1--如果字符串里面有很多字符都需要转义,就需要加很多\,为了简化,Python还允许用r''表示''内部的字符串默认不转义,可以自己试 ...