IO多路复用模型之epoll实现机制

设想一下如下场景：有100万个客户端同时与一个服务器进程保持着TCP连接。而每一时刻，通常只有几百上千个TCP连接是活跃的(事实上大部分场景都是这种情况)。如何实现这样的高并发？

在select/poll时代，服务器进程每次都把这100万个连接告诉操作系统(从用户态复制句柄数据结构到内核态)，让操作系统内核去查询这些套接字上是否有事件发生，轮询完后，再将句柄数据复制到用户态，让服务器应用程序轮询处理已发生的网络事件，这一过程资源消耗较大，因此，select/poll一般只能处理几千的并发连接。

epoll的设计和实现与select完全不同。epoll通过在Linux内核中申请一个简易的文件系统(文件系统一般用什么数据结构实现？B+树)。把原先的select/poll调用分成了3个部分：

1）调用epoll_create()建立一个epoll对象(在epoll文件系统中为这个句柄对象分配资源)

2）调用epoll_ctl向epoll对象中添加这100万个连接的套接字

3）调用epoll_wait收集发生的事件的连接

如此一来，要实现上面说是的场景，只需要在进程启动时建立一个epoll对象，然后在需要的时候向这个epoll对象中添加或者删除连接。同时，epoll_wait的效率也非常高，因为调用epoll_wait时，并没有一股脑的向操作系统复制这100万个连接的句柄数据，内核也不需要去遍历全部的连接。

下面来看看Linux内核具体的epoll机制实现思路。

当某一进程调用epoll_create方法时，Linux内核会创建一个eventpoll结构体，这个结构体中有两个成员与epoll的使用方式密切相关。eventpoll结构体如下所示：

struct eventpoll{

    ....

    /*红黑树的根节点，这颗树中存储着所有添加到epoll中的需要监控的事件*/

    struct rb_root  rbr;

    /*双链表中则存放着将要通过epoll_wait返回给用户的满足条件的事件*/

    struct list_head rdlist;

    ....

};

每一个epoll对象都有一个独立的eventpoll结构体，用于存放通过epoll_ctl方法向epoll对象中添加进来的事件。这些事件都会挂载在红黑树中，如此，重复添加的事件就可以通过红黑树而高效的识别出来(红黑树的插入时间效率是lgn，其中n为树的高度)。

而所有添加到epoll中的事件都会与设备(网卡)驱动程序建立回调关系，也就是说，当相应的事件发生时会调用这个回调方法。这个回调方法在内核中叫ep_poll_callback,它会将发生的事件添加到rdlist双链表中。

在epoll中，对于每一个事件，都会建立一个epitem结构体，如下所示：

struct epitem{

    struct rb_node  rbn;//红黑树节点

    struct list_head    rdllink;//双向链表节点

    struct epoll_filefd  ffd;  //事件句柄信息

    struct eventpoll *ep;    //指向其所属的eventpoll对象

    struct epoll_event event; //期待发生的事件类型

}

　　当调用epoll_wait检查是否有事件发生时，只需要检查eventpoll对象中的rdlist双链表中是否有epitem元素即可。如果rdlist不为空，则把发生的事件复制到用户态，同时将事件数量返回给用户。

从上面的讲解可知：通过红黑树和双链表数据结构，并结合回调机制，造就了epoll的高效。

OK，讲解完了Epoll的机理，我们便能很容易掌握epoll的用法了。一句话描述就是：三步曲。

第一步：epoll_create()系统调用。此调用返回一个句柄，之后所有的使用都依靠这个句柄来标识。

第二步：epoll_ctl()系统调用。通过此调用向epoll对象中添加、删除、修改感兴趣的事件，返回0标识成功，返回-1表示失败。

第三部：epoll_wait()系统调用。通过此调用收集收集在epoll监控中已经发生的事件。

最后，附上一个epoll编程实例。

服务器端

/*************************************************************************

  File Name: tcp_s.c

Author: AlexCthon

Mail: AlexCthon@163.com

Created Time: Tue 15 May 2018 10:25:10 PM CST

 ************************************************************************/

//边沿触发

#include"fun.h"

void setnoblock(int fd)

{

    int status;

    status=fcntl(fd,F_GETFL);

    status = status|O_NONBLOCK;

    fcntl(fd,F_SETFL,status);

}

int main(int argc,char**argv)

{

    if(argc!=3)

    {

	printf("./server IPPROT\n");

	return -1;

    }

    int sfd;

    sfd = socket(AF_INET,SOCK_STREAM,0);

    if(sfd==-1)

    {

	perror("socket");

	return -1;

    }

    struct sockaddr_in ser;

    bzero(&ser,sizeof(ser));

    ser.sin_family = AF_INET;

    ser.sin_port = htons(atoi(argv[2]));//将端口号转换为网络字节序

    ser.sin_addr.s_addr = inet_addr(argv[1]);//将点分十进制转换为网络字节序

    int ret;

    ret = bind(sfd,(struct sockaddr*)&ser,sizeof(struct sockaddr));

    if(-1==ret)

    {

	perror("bind");

	close(sfd);

	return -1;

    }

    if(-1==listen(sfd,10))

    {

	perror("listen");

	close(sfd);

	return -1;

    }

    struct sockaddr_in client;

    bzero(&client,sizeof(client));

    int newfd;

    int len; 

    char buf[10]={0};

    int epfd=epoll_create(1);

    struct epoll_event event,evs[3];

    event.events=EPOLLIN;

    event.data.fd=0;

    ret = epoll_ctl(epfd,EPOLL_CTL_ADD,0,&event);

    if(-1==ret)

    {

	perror("epoll_ctl");

	return -1;

    }

    event.events=EPOLLIN;

    event.data.fd=sfd;

    epoll_ctl(epfd,EPOLL_CTL_ADD,sfd,&event);

    int ret1;

    int i=0;

    printf("before select\n");

    while(1)

    {

	ret1 = epoll_wait(epfd,evs,3,-1);

	for(i=0;i<ret1;i++)

	{

	    if(evs[i].data.fd==sfd)//sfd可读，代表有客户端连接

	    {

		len = sizeof(struct sockaddr);

		newfd = accept(sfd,(struct sockaddr*)&client , &len);

		if(newfd==-1)

		{

		    perror("accept");

		    return -1;

		}

		setnoblock(newfd);

		event.events = EPOLLIN;

		event.data.fd = newfd;

		epoll_ctl(epfd,EPOLL_CTL_ADD,newfd,&event);

		//  printf("%d\n",ret);

		printf("client ip = %s,port = %d\n",inet_ntoa(client.sin_addr),ntohs(client.sin_port));

	    }

	    if(evs[i].data.fd==newfd)

	    {

		bzero(buf,sizeof(buf));

		ret = recv(newfd,buf,sizeof(buf)-1,0);

		if(ret==0)

		{

		    printf("bye!\n");

		    event.events = EPOLLIN;

		    event.data.fd = newfd;

		    epoll_ctl(epfd,EPOLL_CTL_DEL,newfd,&event);

		    close(newfd);

		}

		printf("%s\n",buf);

		//  printf("%d\n",ret);

	    }

	    if(evs[i].data.fd==0)

	    {

		bzero(buf,sizeof(buf));

		ret=read(STDIN_FILENO,buf,sizeof(buf)-1);

		if(ret==0)

		{

	 	    printf("bye!\n");

		    event.events = EPOLLIN|EPOLLET;

		    event.data.fd = newfd;

		    epoll_ctl(epfd,EPOLL_CTL_DEL,newfd,&event);

		    close(newfd);

		}

		send(newfd,buf,strlen(buf)-1,0);//不把\n传过去

	    }

	}

    }

    close(sfd);

    printf("祝您生活愉快");

    return 0;

}

IO多路复用模型之epoll实现机制的更多相关文章

什么是IO多路复用？Nginx的处理机制
先来说一下什么是IO复用? IO复用解决的就是并发行的问题,比如多个用户并发访问一个WEB网站,对于服务端后台而言就会产生多个请求,处理多个请求对于中间件就会产生多个IO流对于系统的读写.那么对于IO ...
Linux网络通信编程（套接字模型TCP\UDP与IO多路复用模型select\poll\epoll）
Linux下测试代码: http://www.linuxhowtos.org/C_C++/socket.htm TCP模型 //TCPClient.c #include<string.h> ...
IO多路复用模型之select()函数详解
IO复用我们首先来看看服务器编程的模型,客户端发来的请求服务端会产生一个进程来对其进行服务,每当来一个客户请求就产生一个进程来服务,然而进程不可能无限制的产生,因此为了解决大量客户端访问的问题,引入 ...
IO多路复用的几种实现机制的分析
http://blog.csdn.net/zhang_shuai_2011/article/details/7675797 select,poll,epoll都是IO多路复用的机制.所谓I/O多路复用 ...
IO多路复用select/poll/epoll详解以及在Python中的应用
IO multiplexing(IO多路复用) IO多路复用,有些地方称之为event driven IO(事件驱动IO). 它的好处在于单个进程可以处理多个网络IO请求.select/epoll这两 ...
Python异步非阻塞IO多路复用Select/Poll/Epoll使用，线程，进程，协程
1.使用select模拟socketserver伪并发处理客户端请求,代码如下: import socket import select sk = socket.socket() sk.bind((' ...
转一贴，今天实在写累了，也看累了--【Python异步非阻塞IO多路复用Select/Poll/Epoll使用】
下面这篇,原理理解了, 再结合这一周来的心得体会,整个框架就差不多了... http://www.haiyun.me/archives/1056.html 有许多封装好的异步非阻塞IO多路复用框架, ...
阻塞IO,非阻塞IO,IO多路复用模型
#服务端 import socket sk = socket.socket() sk.bind(('127.0.0.1',8080)) sk.listen() while True: conn, ad ...
Linux IO多路复用 select/poll/epoll
Select -- synchronius I/O multiplexing select, FS_SET,FD_CLR,FD_ISSET,FD_ZERO #include <sys/time. ...

随机推荐

python（36）- 测试题
1.8<<2等于? 32 “<<”位运算 264 132 64 32 16 8 4 2 1 原始位置 0 0 0 0 0 1 0 0 0 想左位移2位 0 0 0 1 0 0 ...
VS2010/12多核编译
在工作中,我们的一个完整的项目肯定是由多个个解决方案组成的,我们在调试的时候就会不断的去编译修改过的解决方案,如果当修改的解决方案多了以后我们编译的速度就在很大的程度上决定了我们的工作效率.这时候我们 ...
FALSE_IT
本文讲一个实用的语法糖(suger),很不错,攻克了我实际工作中的问题. 如果你写了这样一个类: class Executor { int step1(); void step2(); int ste ...
NYOJ 905 卡片游戏
卡片游戏时间限制:1000 ms | 内存限制:65535 KB 难度:1 描写叙述小明近期宅在家里无聊.于是他发明了一种有趣的游戏.游戏道具是N张叠在一起的卡片,每张卡片上都有一个数字,数字 ...
Spring源码学习（一）资源加载
这里先从最简单的一个Spring例子开始. 下面是Spring的context的配置 <?xml version="1.0" encoding="UTF-8&quo ...
问题 “cell 出栈 selectBox 已选的图标，被释放掉，再次进入屏幕时，没有了已选图标 ” 解决方案
如何去解决列表里面的selectBox已选情况,在滑出屏幕后被清除的问题. 我来在这里详细说明一下, 在cell里面写一个方法,去专门修复滑出后,又滑进来图标被冲刷掉的cell. 在 ...
【BZOJ4668】冷战并查集
[BZOJ4668]冷战 Description 1946 年 3 月 5 日,英国前首相温斯顿·丘吉尔在美国富尔顿发表“铁幕演说”,正式拉开了冷战序幕. 美国和苏联同为世界上的“超级大国”,为了争夺 ...
ECMAscript 没有对该方法进行标准化，因此反对使用它。 es 日期格式化
JavaScript substr() 方法 http://www.w3school.com.cn/jsref/jsref_substr.asp 注释:substr() 的参数指定的是子串的开始位置和 ...
看不懂JDK8的流操作？5分钟带你入门（转）
在JDK1.8里有两个非常高级的新操作,它们分别是:Lambda 表达式和 Stream 流. Lambda表达式让我们先说说 Lambda 表达式吧,这个表达式最大的作用就是简化语法,让代码更加易 ...
关于indexOf的使用
今天项目中出现一个bug,在筛选数据的时候出现了冗余数据,查找发现在indexOf方法判断的时候找到了问题的所在. package demo; public class test { public s ...

IO多路复用模型之epoll实现机制

IO多路复用模型之epoll实现机制的更多相关文章

随机推荐

热门专题