为什么epoll会那么高效
参考(原文简直超赞):https://zhidao.baidu.com/question/687563051895364284.html
下面是我结合原文写的,为了便于自己理解:
关于阻塞和非阻塞的理解可以看这个:http://www.cnblogs.com/xcywt/p/8146123.html
1.举例子说明
假设你在读大学,有个朋友F来找你,你住在A栋。但是不知道具体是哪个房间。于是你们约好在A栋门口见面。
如果用阻塞IO模型来处理这个问题,你就相当于一直在A栋门口等着,这个时候你不能做别的事情,效率比较低,如果F一直不来你就得一直在那等着。
接着来看用非阻塞模型来处理这个问题,主要有两种select/poll(这两个可以看成一种)和epoll:
select大妈做的事情是这样:当朋友F到了楼下时,她带着F一个个房间了轮询的去找你。
epoll大妈就比较高级了:大妈拿本子记录下你的房间号,当朋友F来的时候告诉F你的房间号。这样就不用整栋楼去跑了。
在大并发服务器中,轮询IO是一件比较费时的操作,就跟select大妈一样。
epoll大妈多用了一个本子,就有点用空间去换取时间的意思。
2.select/poll为什么慢:
1)select/poll 是遍历所有添加进fd_set的fd。并且需要将所有用户态的fd拷贝到内核态。数量巨大时这个效率比较慢
2)并且返回之后,还要轮询将所有集合查询一次
3)内核空间的数据需要拷贝到用户空间
3.epoll的实现原理:
具体使用方法可以参考:http://www.cnblogs.com/xcywt/p/8146094.html
先说几个函数的作用
int epoll_create(int size); // 创建一个epoll对象,size是内核保证能够正确处理的最大句柄数。
int epoll_create1(int flags);// 上面的加强版本,参数只能是EPOLL_CLOEXEC
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event); // 操作epoll对象
int epoll_wait(int epfd, struct epoll_event *events,int maxevents, int timeout);// 在给定时间内,监控的所有句柄中有时间发生就返回
下面我们来看具体做了什么:
epoll在内核初始化的时候向内核注册了一个文件系统,用于存储上述被监控的socket,同时还会开辟出epoll自己的内核高速cache区,用于安置需要监控的fd。这些fd以红黑树的形式保存在内核cache里,以支持快速的查找、插入、删除。这个内核高速cache区,就是建立连续的物理内存页,然后在之上建立slab层,简单的说就是物理上分配好你想要的大小的内存对象,每次使用时都是使用空闲的已分配好的对象。
每次调用epoll_create时,会在这个虚拟的epoll文件系统里创建一个file节点,在内核cache中建立个红黑树来存储通过epoll_ctl添加进来的fd。这些fd其实已经在内核态了,当你再次调用epoll_wait时,不需要再拷贝进内核态(select需要再全部拷贝到内核态)。
同时还会建立一个list链表,用来存储已经就绪的事件。被epoll_wait调用时,就去看这个list链表是不是为空,若不为空就返回,为空就等待指定的事件再返回。
list链表是如何维护的呢:当我们执行epoll_ctl时,会把对应fd放到红黑树中,还会给内核终端处理程序注册一个回调函数。如果这个句柄的中断到了,就把它放在list链表中去。
总结一下:一棵红黑树和一个list链表就解决大并发的问题。epoll_create时创建红黑树和就绪链表,epoll_ctl时添加到红黑树中(若存在则不添加)并向内核注册回调函数。epoll_wait时返回list就绪链表里面的数据就可以了。
4.epoll的两个工作模式:
LT:只要一个句柄上的事件一次没有处理完,接着调用epoll_wait时仍然会返回这个句柄。
ET:尽在空闲状态->就绪状态返回一次。
这件事是怎么做到的呢:当有fd'发生事件时,就放到list就绪链表中去了。然后epoll_wait返回,再然后清空准备list就绪链表。
最后如果是LT模式,并且仍有未处理的事件,就把这个fd重新放回到list就绪链表中。
如果是ET,就不管了,不管有没有事件未处理完都不再添加到list就绪链表中。
就有点像下面的流程:
wait返回 -> 清空list就绪链表
if(LT模式)
{
if(存在未处理完的事件)
{
重新添加进list就绪链表中
}
}
else // ET 模式
{ }
关于触发模式详解,这里面也讲的比较详细:
http://blog.csdn.net/weiyuefei/article/details/52242778
5.ET模式被唤醒的条件:
对于读取操作:
1)buffer由不可读,变为可读的时候。
2)buffer数据变多的时候,有新的数据到来
3)当buffer不为空(有数据可读),且用户对相应fd进行epoll_mod IN 事件时。(待会用代码演示)
对于写操作:
1)由不可写,变成可写
2)buffer是数据变少的时候,也就是被读走了一部分3)buffer有可写空间,且用户对相应fd进行epoll_mod OUT 事件时。
对于LT模式:
读操作:只要缓冲区中有数据,且读完一部分之后还不空的时候,就会返回
写操作:当发送缓冲区没满,写了一下还不满的时候,epoll_wait返回读事件。
补充一个例子1:验证ET模式的读取返回的前2个:
#include<unistd.h>
#include<iostream>
#include<sys/epoll.h>
using namespace std;
int main()
{
int epfd, ret;
struct epoll_event ev, events[];
epfd = epoll_create();
ev.data.fd = STDIN_FILENO;
ev.events = EPOLLIN|EPOLLET; // 标记A,这里是ET模式
//ev.events = EPOLLIN; // 标记B。表示默认是LT模式
char buf[] = {};
epoll_ctl(epfd, EPOLL_CTL_ADD, STDIN_FILENO, &ev); //添加标准输入
while()
{
ret = epoll_wait(epfd, events, , -);
for(int i=; i < ret; i++)
{
if(events[i].data.fd == STDIN_FILENO)
{
//read(STDIN_FILENO, buf, sizeof(buf)); // 标记C
cout << "hello world, recv:" << buf << endl;
}
}
}
return ;
}
分三种情况讨论:
1)打开标记A,注释B和C:这种情况运行,虽然输入缓冲区里面还有数据,但是“hello world”也不会一直打印。
因为边沿触发,一定要等到下一次事件到来 wait才会返回。
2)打开B,注释A和C:切换成了LT模式,只要缓冲区里面还有数据吗,wait会一直返回。所以helloworld会一直打印
3)打开B和C,注释A:LT模式,但是每次wait之后把缓冲区里面的数据读完了,相当于处理完了这个事件。wait就不会返回了。除非标准输入中再输入数据。
例子2:验证ET模式的读取返回的第3个:
#include<unistd.h>
#include<iostream>
#include<sys/epoll.h>
using namespace std;
int main()
{
int epfd, ret;
struct epoll_event ev, events[];
epfd = epoll_create();
ev.data.fd = STDIN_FILENO;
ev.events = EPOLLIN|EPOLLET;
char buf[] = {};
epoll_ctl(epfd, EPOLL_CTL_ADD, STDIN_FILENO, &ev);
while()
{
ret = epoll_wait(epfd, events, , -);
for(int i=; i < ret; i++)
{
if(events[i].data.fd == STDIN_FILENO)
{
cout << "hello world << endl;
ev.data.fd = STDIN_FILENO;
ev.events = EPOLLIN|EPOLLET;
epoll_ctl(epfd, EPOLL_CTL_MOD, STDIN_FILENO, &ev); // 这里对fd进行epoll_mod IN 事件
}
}
}
return ;
}
可以看到当输入一次之后,依然会有死循环打印helloworld。
例子3:验证ET模式的写返回,前2个
#include<unistd.h>
#include<iostream>
#include<sys/epoll.h>
using namespace std;
int main()
{
int epfd, ret;
struct epoll_event ev, events[];
epfd = epoll_create();
ev.data.fd = STDIN_FILENO;
ev.events = EPOLLOUT|EPOLLET;
char buf[] = {};
epoll_ctl(epfd, EPOLL_CTL_ADD, STDIN_FILENO, &ev);
while()
{
ret = epoll_wait(epfd, events, , -);
for(int i=; i < ret; i++)
{
if(events[i].data.fd == STDIN_FILENO)
{
//cout << "hello world" << endl; // 标记A
cout << "hello world"; // 标记B
}
}
}
return ;
}
对于ET模式。
1)打开标记A,注释标记B:可以看到会死循环,因为这里有 endl 。标准输出为控制台的时候缓冲的“行缓冲”,所以换行符号导致buffer中的内容被清空。就相当于上面条件中的第二个,有数据发送走了。所以会一直循环
2)打开B,注释A:不发送endl,就相当于buffer中一直有数据存在,所以wait不会一直返回。
例子4,ET模式的写返回第三个条件。
#include<unistd.h>
#include<iostream>
#include<sys/epoll.h>
using namespace std; int main()
{
int epfd, ret;
struct epoll_event ev, events[];
epfd = epoll_create();
ev.data.fd = STDIN_FILENO;
ev.events = EPOLLOUT|EPOLLET; char buf[] = {};
epoll_ctl(epfd, EPOLL_CTL_ADD, STDIN_FILENO, &ev);
while()
{
ret = epoll_wait(epfd, events, , -);
for(int i=; i < ret; i++)
{
if(events[i].data.fd == STDIN_FILENO)
{
cout << "hello world";
ev.data.fd = STDIN_FILENO;
ev.events = EPOLLOUT;
epoll_ctl(epfd, EPOLL_CTL_MOD, STDIN_FILENO, &ev); // 这里对fd进行epoll_mod OUT 事件
}
}
} return ;
}
每次输出helloworld后重新MOD OUT 事件。也会一直循环打印。
注意:LT模式没有验证
为什么epoll会那么高效的更多相关文章
- linux下epoll如何实现高效处理百万句柄的
linux下epoll如何实现高效处理百万句柄的 分类: linux 技术分享 2012-01-06 10:29 4447人阅读 评论(5) 收藏 举报 linuxsocketcachestructl ...
- 从I/O复用谈epoll为什么高效
上一篇文章中,谈了一些网络编程的基本概念.在现实使用中,用的最多的就是I/O复用了,无非就是select,poll,epoll 很多人提到网络就说epoll,认为epoll效率是最高的.单纯的这么认为 ...
- epoll的内部实现 & 百万级别句柄监听 & lt和et模式非常好的解释
epoll是Linux高效网络的基础,比如event poll(例如nodejs),是使用libev,而libev的底层就是epoll(只不过不同的平台可能用epoll,可能用kqueue). epo ...
- 基本套接字编程(5) -- epoll篇
1. epoll技术 epoll是Linux内核为处理大批量文件描述符而作了改进的poll,是Linux下多路复用IO接口select/poll的增强版本,它能显著提高程序在大量并发连接中只有少量活跃 ...
- epoll的原理和使用方法
设想一个场景:有100万用户同一时候与一个进程保持着TCP连接,而每个时刻仅仅有几十个或几百个TCP连接时活跃的(接收到TCP包),也就是说,在每一时刻,进程值须要处理这100万连接中的一小部分连接. ...
- 什么是epoll
什么是epoll epoll是什么?按照man手册的说法:是为处理大批量句柄而作了改进的poll.当然,这不是2.6内核才有的,它是在2.5.44内核中被引进的(epoll(4) is a new A ...
- epoll详解
转自:http://blog.chinaunix.net/uid-24517549-id-4051156.html 什么是epoll epoll是什么?按照man手册的说法:是为处理大批量句柄而作了改 ...
- [转载] epoll详解
转载自http://blog.csdn.net/xiajun07061225/article/details/9250579 什么是epoll epoll是什么?按照man手册的说法:是为处理大批量句 ...
- [转]epoll详解
什么是epollepoll是什么?按照man手册的说法:是为处理大批量句柄而作了改进的poll.当然,这不是2.6内核才有的,它是在2.5.44内核中被引进的(epoll(4) is a new AP ...
随机推荐
- Python 面向对象(一) 基础
Python 中一切皆对象 什么是面向对象? 面向对象就是将一些事物的共有特征抽象成类,从类来创建实例. 类class 可以理解为模版 比如人类,都具有身高.体重.年龄.性别.籍贯...等属性,但属性 ...
- 《java.util.concurrent 包源码阅读》16 一种特别的BlockingQueue:SynchronousQueue
SynchronousQueue是一种很特别的BlockingQueue,任何一个添加元素的操作都必须等到另外一个线程拿走元素才会结束.也就是SynchronousQueue本身不会存储任何元素,相当 ...
- python利用scrapy框架爬取起点
先上自己做完之后回顾细节和思路的东西,之后代码一起上. 1.Mongodb 建立一个叫QiDian的库,然后建立了一个叫Novelclass(小说类别表)Novelclass(可以把一级类别二级类别都 ...
- QTP生成随机数字+字母
以下函数实现随机生成17位数(包括字母和数字),仍有改进的空间,可根据具体要求适当修改 Dim targetstring '调用返回函数给变量.Function过程通过函数名返回一个值 targets ...
- 04.redis集群+SSM整合使用
redis集群+SSM整合使用 首先是创建redis-cluster文件夹: 因为redis最少需要6个节点(三主三从),为了更好的理解,我这里创建了两台虚拟机(192.168.0.109 192.1 ...
- hdu 1151 Air Raid DAG最小边覆盖 最大二分匹配
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1151 题目大意: 城镇之间互相有边,但都是单向的,并且不会构成环,现在派伞兵降落去遍历城镇,问最少最少 ...
- 51Nod--1051最大子矩阵和(DP入门)
分析: 我们已经解决了一维的问题(基础篇中的最大子段和问题),现在变成二维了,我们看看能不能把这个问题转化为一维的问题.最后子矩阵一定是在某两行之间的.假设我们认为子矩阵在第i行和第j列之间,我们如何 ...
- NYOJ 138 找球号(二) bitset 二进制的妙用
找球号(二) 时间限制:1000 ms | 内存限制:65535 KB 难度:5 描述 描述 在某一国度里流行着一种游戏.游戏规则为:现有一堆球中,每个球上都有一个整数编号i(0<=i< ...
- CCF-201509-2-日期计算
问题描述 试题编号: 201509-2 试题名称: 日期计算 时间限制: 1.0s 内存限制: 256.0MB 问题描述: 问题描述 给定一个年份y和一个整数d,问这一年的第d天是几月几日? 注意闰年 ...
- 浏览器Agent大全 (含IE 11, Edge)
Edge mozilla/5.0 (windows nt 10.0; win64; x64) applewebkit/537.36 (khtml, like gecko) chrome/51.0.27 ...