Linux中一切皆文件，不论是我们存储在磁盘上的字符文件，可执行文件还是我们的接入电脑的I/O设备等都被VFS抽象成了文件，比如标准输入设备默认是键盘，我们在操作标准输入设备的时候，其实操作的是默认打开的一个文件描述符是0的文件，而一切软件操作硬件都需要通过OS，而OS操作一切硬件都需要相应的驱动程序，这个驱动程序里配置了这个硬件的相应配置和使用方法。Linux的I/O分为阻塞I/O,非阻塞I/O,I/O多路复用,信号驱动I/O四种。对于I/O设备的驱动，一般都会提供关于阻塞和非阻塞两种配置。我们最常见的I/O设备之一--键盘(标准输入设备)的驱动程序默认是阻塞的。

多路复用就是为了使进程能够从多个阻塞I/O中获得自己想要的数据并继续执行接下来的任务。其主要的思路就是同时监视多个文件描述符，如果有文件描述符的设定状态的被触发，就继续执行进程，如果没有任何一个文件描述符的设定状态被触发，进程进入sleep

多路复用的一个主要用途就是实现"I/O多路复用并发服务器"，和多线程并发或者多进程并发相比，这种服务器的系统开销更低，更适合做web服务器，但是由于其并没有实现真正的多任务，所以当压力大的时候，部分用户的请求响应会较慢

阻塞I/O

阻塞I/O，就是当进程试图访问这个I/O设备而这个设备并没有准备好的时候，设备的驱动程序会通过内核让这个试图访问的进程进入sleep状态。阻塞I/O的一个好处就是可以大大的节约CPU时间，因为一旦一个进程试图访问一个没有准备好的阻塞I/O，就会进入sleep状态，而进入sleep状态的进程是不在内核的进程调度链表中，直到目标I/O准备好了将其唤醒并加入调度链表，这样就可以节约CPU时间。当然阻塞I/O也有其固有的缺点，如果进程试图访问一个阻塞I/O，但是否访问成功并不对接下来的任务有决定性影响，那么直接使其进入sleep状态显然会延误其任务的完成。

典型的默认阻塞IO有标准输入设备，socket设备，管道设备等，当我们使用gets(),scanf(),read()等操作请求这些IO时而IO并没有数据流入，就会造成进程的sleep。进程会一直阻塞下去直到接收缓冲区中有数据可读，此时内核再去唤醒该进程，通过相应的函数从中获取数据。如果阻塞过程中对方发生故障，那么这个进程将会永远阻塞下去。
写操作时发生阻塞的情况要比读操作少，主要发生在要写入的缓冲区的大小小于要写入的数据量的情况下，这时写操作将不进行任何任何拷贝工作，将发生阻塞。一旦发送缓冲区内有足够的空间，内核将唤醒进程，将数据从用户缓冲区中拷贝到相应的发送数据缓冲区。udp不用等待确认，没有实际的发送缓冲区，所以udp协议中不存在发送缓冲区满的情况，在udp套接字上执行的写操作永远都不会阻塞

现假设一个进程希望通过三个管道中任意一个中读取数据并显示，伪代码如下

read(pipe_0,buf,sizeof(buf));       //sleep

print buf;

read(pipe_1,buf,sizeof(buf));

print buf;

read(pipe_2,buf,sizeof(buf));

print buf;

由于管道是阻塞I/O，所以如果pipe_0没有数据流入，进程就是在第一个read()处进入sleep状态而即使pipe_1和pipe_2有数据流入也不会被读取。

如果我们使用下述代码重新设置管道的阻塞属性，显然，如果三个管道都没有数据流入，那么进程就无法获得请求的数据而继续执行，倘若这些数据很重要(所以我们才要用阻塞I/O)，那结果就会十分的糟糕，改为轮询却又大量的占据CPU时间。

int fl = fcntl(pipe_fd, F_GETFL);

fcntl(pipe_fd, F_SETFL, fl | O_NONBLOCK);

如何让进程同时监视三个管道，其中一个有数据就继续执行而不会sleep，如果全部没有数据流入再sleep，就是多路复用技术需要解决的问题。

非阻塞I/O

非阻塞I/O就是当一个进程试图访问一个I/O设备的时候，无论是否从中获取了请求的数据都会返回并继续执行接下来的任务。，但非常适合请求是否成功对接下来的任务影响不大的I/O请求。但如果访问一个非阻塞I/O，但这个请求如果失败对进程接下来的任务有致命影响，最粗暴的就是使用while(1)｛read()｝轮询。显然，这种方式会占用大量的CPU时间。对于非阻塞IO，除了直接返回，一个更重要的应用就是利用IO多路复用机制同时监视多个非阻塞IO。

select机制

select是一种非常"古老"的同步I/O接口，但是提供了一种很好的I/O多路复用的思路

模型

fd_set      //创建fd_set对象，将来从中增减需要监视的fd

FD_ZERO()   //清空fd_set对象

FD_SET()    //将一个fd加入fd_set对象中

select()    //监视fd_set对象中的文件描述符

pselect()   //先设定信号屏蔽，再监视

FD_ISSET()  //测试fd是否属于fd_set对象

FD_CLR()    //从fd_set对象中删除fd

Note:

select的第一个参数nfds是指集合中的最大的文件描述符+1，因为select会无差别遍历整个文件描述符表直到找到目标，而文件描述符是从0开始的，所以一共是集合中的最大的文件描述符+1次。
上一条导致了这种机制的低效，如果需要监视的文件描述符是0和100那么每一次都会遍历101次
select()每次返回都会修改fd_set，如果要循环select()，需要先对初始的fd_set进行备

例子_I/O多路复用并发服务器

关于server本身的编程模型，参见tcp/ip协议服务器模型和udp/ip协议服务器模型这里仅是使用select实现伪并行的部分模型

#define BUFSIZE 100

#define MAXNFD  1024 

int main()

{

	/***********服务器的listenfd已经准本好了**************/

	fd_set readfds;

	fd_set writefds;

	FD_ZERO(&readfds);

	FD_ZERO(&writefds);

	FD_SET(listenfd, &readfds);

	fd_set temprfds = readfds;

	fd_set tempwfds = writefds;

	int maxfd = listenfd;

	int nready;

	char buf[MAXNFD][BUFSIZE] = {0};

	while(1){

		temprfds = readfds;

		tempwfds = writefds;

        nready = select(maxfd+1, &temprfds, &tempwfds, NULL, NULL)

		if(FD_ISSET(listenfd, &temprfds))｛

		    //如果监听到的是listenfd就进行accept

			int sockfd = accept(listenfd, (struct sockaddr*)&clientaddr, &len);

			//将新accept的scokfd加入监听集合，并保持maxfd为最大fd

			FD_SET(sockfd, &readfds);

			maxfd = maxfd>sockfd?maxfd:sockfd;

			//如果意见检查了nready个fd，就没有必要再等了，直接下一个循环

			if(--nready==0)

				continue;

		}

		int fd = 0;

		//遍历文件描述符表，处理接收到的消息

		for(;fd<=maxfd; fd++)｛

			if(fd == listenfd)

				continue;

			if(FD_ISSET(fd, &temprfds)){

				int ret = read(fd, buf[fd], sizeof buf[0]);

				if(0 == ret)｛    //客户端链接已经断开

					close(fd);

					FD_CLR(fd, &readfds);

					if(maxfd==fd)

					    --maxfd;

					continue;

				}

				//将fd加入监听可写的集合

				FD_SET(fd, &writefds);

			}

			//找到了接收消息的socket的fd，接下来将其加入到监视写的fd_set中

			//将在下一次while()循环开始监视

			if(FD_ISSET(fd, &tempwfds)){

				int ret = write(fd, buf[fd], sizeof buf[0]);

				printf("ret %d: %d\n", fd, ret);

				FD_CLR(fd, &writefds);

			}

		}

	}

	close(listenfd);

}

poll机制

poll是一种基于select的改良机制，其针对select的一些缺陷进行了重新设计，包括不需要备份fd_set等等，但是依然是遍历整个文件描述符表，效率较低

模型

struct pollfd   fds     //创建一个pollfd类型的数组

fds[0].fd               //向fds[0]中放入需要监视的fd

fds[0].events           //向fds[0]中放入需要监视的fd的触发事件

    POLLIN              //I/O有输入

    POLLPRI             //有紧急数据需要读取

    POLLOUT             //I/O可写

    POLLRDHUP           //流式套接字连接断开或套接字处于半关闭状态

    POLLERR             //错误条件(仅针对输出)

    POLLHUP             //挂起(仅针对输出)

    POLLNVAL            //无效的请求：fd没有被打开(仅针对输出)

例子_I/O多路复用并发服务器

/* ... */

int main()

{

	/* ... */

	struct pollfd myfds[MAXNFD] = {0};

	myfds[0].fd = listenfd;

	myfds[0].events = POLLIN;

	int maxnum = 1;

	int nready;

	//准备二维数组buf，每个fd使用buf的一行，数据干扰

	char buf[MAXNFD][BUFSIZE] = {0};

	while(1){

	    //poll直接返回event被触发的fd的个数

		nready = poll(myfds, maxnum, -1)

		int i = 0;

		for(;i<maxnum; i++){

		    //poll通过将相应的二进制位置一来表示已经设置

		    //如果下面的条件成立，表示revent[i]里的POLLIN位已经是1了

			if(myfds[i].revents & POLLIN){

				if(myfds[i].fd == listenfd){

					int sockfd = accept(listenfd, (struct sockaddr*)&clientaddr, &len);

                    //将新accept的scokfd加入监听集合

					myfds[maxnum].fd = sockfd;

					myfds[maxnum].events = POLLIN;

					maxnum++;

                    //如果意见检查了nready个fd，就直接下一个循环

					if(--nready==0)

						continue;

				}

				else{

					int ret = read(myfds[i].fd, buf[myfds[i].fd], sizeof buf[0]);

					if(0 == ret)｛    //如果连接断开了

						close(myfds[i].fd);

						 //初始化将文件描述符表所有的文件描述符标记为-1

						 //close的文件描述符也标记为-1

						 //打开新的描述符时从表中搜索第一个-1

						 //open()就是这样实现始终使用最小的fd

						 //这里为了演示并没有使用这种机制

						 myfds[i].fd = -1;

						continue;

					}

					myfds[i].events = POLLOUT;

				}

			}

			else if(myfds[i].revents & POLLOUT){

				int ret = write(myfds[i].fd, buf[myfds[i].fd], sizeof buf[0]);

				myfds[i].events = POLLIN;

			}

		}

	}

	close(listenfd);

}

epoll

epoll在poll基础上实现的更为健壮的接口，它每次只会遍历我们关心的文件描述符，也是现在主流的web服务器使用的多路复用技术，epoll一大特色就是支持EPOLLET(边沿触发)和EPOLLLT (水平触发)，前者表示如果读取之后缓冲区还有数据，那么只要读取结束，剩余的数据也会丢弃，而后者表示里面的数据不会丢弃，下次读的时候还在，默认是EPOLLLT

模型

epoll_create()          //创建epoll对象

struct epoll_event      //准备事件结构体和事件结构体数组

    event.events

	event.data.fd ...

epoll_ctl()             //配置epoll对象

epoll_wait()            //监控epoll对象中的fd及其相应的event

例子_I/O多路复用并发服务器

/* ... */

int main()

{

	/* ... */

	/* 创建epoll对象 */

	int epoll_fd = epoll_create(1024);

	//准备一个事件结构体

	struct epoll_event event = {0};

	event.events = EPOLLIN;

	event.data.fd = listenfd;   //data是一个共用体，除了fd还可以返回其他数据

	//ctl是监控listenfd是否有event被触发

	//如果发生了就把event通过wait带出。

	//所以，如果event里不标明fd，我们将来获取就不知道哪个fd

	epoll_ctl(epoll_fd, EPOLL_CTL_ADD, listenfd, &event);

	struct epoll_event revents[MAXNFD] = {0};

	int nready;

	char buf[MAXNFD][BUFSIZE] = {0};

	while(1){

		//wait返回等待的event发生的数目

		//并把相应的event放到event类型的数组中

		nready = epoll_wait(epoll_fd, revents, MAXNFD, -1)

		int i = 0;

		for(;i<nready; i++){

			//wait通过在events中设置相应的位来表示相应事件的发生

			//如果输入可用，那么下面的这个结果应该为真

			if(revents[i].events & EPOLLIN){

				//如果是listenfd有数据输入

				if(revents[i].data.fd == listenfd){

					int sockfd = accept(listenfd, (struct sockaddr*)&clientaddr, &len);

					struct epoll_event event = {0};

					event.events = EPOLLIN;

					event.data.fd = sockfd;

					epoll_ctl(epoll_fd, EPOLL_CTL_ADD, sockfd, &event);

				}

				else{

					int ret = read(revents[i].data.fd, buf[revents[i].data.fd], sizeof buf[0]);

					if(0 == ret){

						close(revents[i].data.fd);

						epoll_ctl(epoll_fd, EPOLL_CTL_DEL, revents[i].data.fd, &revents[i]);

					}

					revents[i].events = EPOLLOUT;

					epoll_ctl(epoll_fd, EPOLL_CTL_MOD, revents[i].data.fd, &revents[i]);

				}

			}

			else if(revents[i].events & EPOLLOUT){

				int ret = write(revents[i].data.fd, buf[revents[i].data.fd], sizeof buf[0]);

				revents[i].events = EPOLLIN;

				epoll_ctl(epoll_fd, EPOLL_CTL_MOD, revents[i].data.fd, &revents[i]);

			}

		}

	}

	close(listenfd);

}

Linux I/O多路复用的更多相关文章

[Linux]I/O多路复用和epoll
首先我们来定义流的概念,一个流可以是文件,socket,pipe等等可以进行I/O操作的内核对象. 不管是文件,还是套接字,还是管道,我们都可以把他们看作流. 之后我们来讨论I/O的操作,通过read ...
以python理解Linux的IO多路复用，select、poll、epoll
题外话之前在看Unix环境高级编程的时候,看完高级IO那一章,感觉自己萌萌哒,0.0 ,有点囫囵吞枣的感觉,之后翻了几篇博客,从纯系统的角度理解,稍微有了点概念,以这两篇为例,可以以后参考: htt ...
linux pinmux 引脚多路复用驱动分析与使用
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明.本文链接:https://blog.csdn.net/code_style/article/de ...
Linux网络通信编程（套接字模型TCP\UDP与IO多路复用模型select\poll\epoll）
Linux下测试代码: http://www.linuxhowtos.org/C_C++/socket.htm TCP模型 //TCPClient.c #include<string.h> ...
Linux 服务器模型小结
当我们用socket进行编程的时候,细节上都是选择一个AF_LOCAL,AF_INET再根据相应的类型填充地址,其实根据通信需求,有几种简单的服务模型可供选用,掌握了这些框架再结合socket高度的抽 ...
Linux Network Related Drive
catalog . 通过套接字通信 . 网络实现的分层模型 . 网络命名空间 . 套接字缓冲区 . 网络访问层 . 网络层 . 传输层 . 应用层 . 内核内部的网络通信 1. 通过套接字通信 Lin ...
linux epoll 学习
一.epoll介绍 epoll是linux内核为处理大批量句柄而作的改进的poll,是linux下IO多路复用select.poll的增强版,它能显著减少程序在大量并发连接中只有少量活跃的情况下的系统 ...
linux epoll模型
原文:http://yjtjh.blog.51cto.com/1060831/294119 Linux I/O多路复用技术在比较多的TCP网络服务器中有使用,即比较多的用到select函数.Linux ...
Linux驱动技术(五) _设备阻塞/非阻塞读写
等待队列是内核中实现进程调度的一个十分重要的数据结构,其任务是维护一个链表,链表中每一个节点都是一个PCB(进程控制块),内核会将PCB挂在等待队列中的所有进程都调度为睡眠状态,直到某个唤醒的条件发生 ...

随机推荐

JDBC连接MySQL数据库代码模板
下面这个例子是最简单的JDBC连接MySQL数据库的例子. 一般步骤: 1.注册驱动: 2.建立连接: 3.创建语句: 4.处理结果: 5.释放资源. 注意: 1.软件开发环境:MyEclipse 8 ...
在C#中，Json的序列化和反序列化的几种方式总结
在这篇文章中,我们将会学到如何使用C#,来序列化对象成为Json格式的数据,以及如何反序列化Json数据到对象. 什么是JSON? JSON (JavaScript Object Notation) ...
【非原创】IOS 验证文字是否是中文
从环信中找到的部分不错的代码,拿出来记录一下是否是中文 -(BOOL)isChinese{ NSString *match=@"(^[\u4e00-\u9fa5]+$)"; NS ...
ASP.Net MVC Action重定向跳出Controller和Area
1.重定向方法简介 [HttpPost] public ActionResult StudentList( string StudName, string studName, DateTime Bir ...
mysql 处理 NULL
1.如果为空返回0 select ifnull(null,0) 2.如果为空返回0,否则返回1 select if(isnull(col),0,1) as col. MYSQL 中的IFNULL函数 ...
Data type confusion: what is an int(11)?
http://everythingmysql.ning.com/profiles/blogs/data-type-confusion-what-is-an Over and over I see cu ...
luogg_java学习_05_面向对象(方法和类)
这篇总结断断续续写了2天,内容来自Oracle java8编程入门官方教程和课外搜索总结,希望自己以后返回来看的时候都懂,也希望可以起到帮助初学者的作用. 转载请注明出自 luogg的博客园 , 因 ...
js设置、获取单值cookie和多值cookie
js设置.获取单值cookie和多值cookie,代码如下: var CookieUtil = (function () { var Cookie = function () { // 获取单值coo ...
【原创-算法-实现】异步HTTP请求操作
一.说明 1) 这个类是我在真实项目中,优化解决真实问题时,不参考第三方代码,完全由自己查阅MSDN官方文档 , 完成的一个真实生产环境中使用的功能类 2) 读者在使用此类时,请尊重原创,在代码 ...
对js中this的一点点理解
1 当函数作为对象的方法被调用的时候 this就指向该对象 var o = { prop: 37, f: function() { return this.prop; } }; console.log ...

Linux I/O多路复用

阻塞I/O

非阻塞I/O

select机制

模型

例子_I/O多路复用并发服务器

poll机制

模型

例子_I/O多路复用并发服务器

epoll

模型

例子_I/O多路复用并发服务器

Linux I/O多路复用的更多相关文章

随机推荐

热门专题