UNP——第六章,多路转接IO——select
int select(int nfds, fd_set *readfds, fd_set *writefds,
fd_set *exceptfds, struct timeval *timeout);
struct timeval {
long tv_sec; /* seconds */
long tv_usec; /* microseconds */
};
1.函数介绍
nfds
最大文件描述符+1
通过告诉内核最多需要检查的文件描述符数量,以提高效率,(否则内核需要检查所有的文件描述符)
至于为什么是最大文件描述符值+1,表示 需要检查的文件描述符的数量,原因是 文件描述符从0开始,而数量从1 开始。
readfds, writefds, exceptfds
都是传入传出参数
通过位掩码的方式表示监听的文件描述符
void FD_CLR(int fd, fd_set *set);
int FD_ISSET(int fd, fd_set *set);
void FD_SET(int fd, fd_set *set);
void FD_ZERO(fd_set *set);
timeout
可以选择:
一直阻塞,直到有事件触发
阻塞一段时间,直到有事件触发
不阻塞,立即返回
阻塞可能被信号处理中断,而timeout不是传出参数,所以timeout不会记录剩余的等待时间,而是使用上次的值调用。
如果需要剩余的等待时间,可以在select调用前后记录系统时间以计算。
2. 事件触发的情况

3. 改写客户端
基于select的 str_cli
客户端套接字可能的事件如下

void
str_cli(FILE *fp, int sockfd)
{
int maxfdp1;
fd_set rset;
char sendline[MAXLINE], recvline[MAXLINE]; FD_ZERO(&rset);
for ( ; ; ) {
FD_SET(fileno(fp), &rset);
FD_SET(sockfd, &rset);
maxfdp1 = max(fileno(fp), sockfd) + 1;
Select(maxfdp1, &rset, NULL, NULL, NULL); if (FD_ISSET(sockfd, &rset)) { /* socket is readable */
if (Readline(sockfd, recvline, MAXLINE) == 0)
err_quit("str_cli: server terminated prematurely");
Fputs(recvline, stdout);
} if (FD_ISSET(fileno(fp), &rset)) { /* input is readable */
if (Fgets(sendline, MAXLINE, fp) == NULL)
return; /* all done */
Writen(sockfd, sendline, strlen(sendline));
}
}
}
改进
(1)批量输入
因为程序采用 停等方式,如果采用交互输入,一个RTT的情况如下

可见只用了管道的 1/8
如果使用文件重定向的方式运行程序,那么会批量输入程序,但运行结果出错,输出文件小于输入文件。
考虑下面情况

当运行到时刻8时,客户端已经read完了文件,所以会close,造成套接字进入半关闭,
如此服务器发送的数据,客户端就无法接受,导致数据丢失。
半关闭
单方面调用close后,
主动关闭方进入 FIN_WAIT_2, 不能进行读写操作
被动关闭方进入 CLOSE_WAIT,能进行读写操作,不过read返回0,write的数据不能传递给对端的应用层(在对端的TCP层被接受后丢弃)。
解决方法是:
发送FIN,告诉对方自己已经完成了数据发送,但是仍然保持套接字描述符打开以便读取,
使用 shutdown实现
(2)缓冲和 select
select 关于读写操作的事件触发是按照read/write的情况,即不带缓冲的情况,
如果使用 stdio或者自定义的缓冲操作容易造成错误,
如,使用 fgets,当 select 触发后,fgets会尽可能读数据到缓冲,可能读了多行输入,但是一次只返回一行,
于是select触发一次,收到多行输入,但是只处理了一行输入。
解决方法:
避免select和缓冲io合用。
shutdown函数
为了实现,客户端关闭后,仍能接受对方的输入

int shutdown(int sockfd, int how);
howto SHUT_RD
关闭读,丢弃套接字接受缓冲区所有数据,所有新来的对端数据被悄悄接受,回复,并丢弃 SHUT_WR
关闭写,套接字发送缓冲区现有数据正常发送,并发送FIN,进程不能对该套接字进行写操作 SHUT_RDWR
相当于分别调用 SHUT_RD,和SHUT_WR
修订版
void
str_cli(FILE *fp, int sockfd)
{
int maxfdp1, stdineof;
fd_set rset;
char buf[MAXLINE];
int n; stdineof = 0;
FD_ZERO(&rset);
for ( ; ; ) {
if (stdineof == 0)
FD_SET(fileno(fp), &rset);
FD_SET(sockfd, &rset);
maxfdp1 = max(fileno(fp), sockfd) + 1;
Select(maxfdp1, &rset, NULL, NULL, NULL); if (FD_ISSET(sockfd, &rset)) { /* socket is readable */
if ( (n = Read(sockfd, buf, MAXLINE)) == 0) {
if (stdineof == 1)
return; /* normal termination */
else
err_quit("str_cli: server terminated prematurely");
} Write(fileno(stdout), buf, n);
} if (FD_ISSET(fileno(fp), &rset)) { /* input is readable */
if ( (n = Read(fileno(fp), buf, MAXLINE)) == 0) {
stdineof = 1;
Shutdown(sockfd, SHUT_WR); /* send FIN */
FD_CLR(fileno(fp), &rset);
continue;
} Writen(sockfd, buf, n);
}
}
}
select 实现服务器
通过select ,实现单个进程检测多个套接字。
思考需要的数据结构,由于单进程要维护多个客户端连接,即需要区分多个客户端,客户端的区分使用对应套接字,所以需要一个维护已连接客户端的文件描述符数组。
另外,由于使用select,监控read事件,所以需要一个readfds数组。

client中,将未使用的置为-1.
rset中,前三个描述符被占用,fd3为监听套接字。
另外需要思考,添加客户端,和删除客户端,时对上面的数据结构的操作顺序。
对于添加客户端,
首先,已经知道的数据,accept获得 connfd,所以client[i] = connfd,FD_SET(connfd, &rset)
然后select需要 maxfd1 ,所以需要维护一个maxfd, if(connfd > maxfd) maxfd = connfd;
对于删除客户端
首先,已经知道的数据:FD_ISSET(fd, &rset) 获得 connfd,所以 if(client[i] == fd) client[i] = -1; FD_CLR(fd, &rset)
对于maxfd1,不方便处理,所以就不处理了,比较几乎不会影响效率。
/* include fig01 */
#include "unp.h" int
main(int argc, char **argv)
{
int i, maxi, maxfd, listenfd, connfd, sockfd;
int nready, client[FD_SETSIZE];
ssize_t n;
fd_set rset, allset;
char buf[MAXLINE];
socklen_t clilen;
struct sockaddr_in cliaddr, servaddr; listenfd = Socket(AF_INET, SOCK_STREAM, 0); bzero(&servaddr, sizeof(servaddr));
servaddr.sin_family = AF_INET;
servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
servaddr.sin_port = htons(SERV_PORT); Bind(listenfd, (SA *) &servaddr, sizeof(servaddr)); Listen(listenfd, LISTENQ); maxfd = listenfd; /* initialize */
maxi = -1; /* index into client[] array */
for (i = 0; i < FD_SETSIZE; i++)
client[i] = -1; /* -1 indicates available entry */
FD_ZERO(&allset);
FD_SET(listenfd, &allset);
/* end fig01 */ /* include fig02 */
for ( ; ; ) {
rset = allset; /* structure assignment */
nready = Select(maxfd+1, &rset, NULL, NULL, NULL); if (FD_ISSET(listenfd, &rset)) { /* new client connection */
clilen = sizeof(cliaddr);
connfd = Accept(listenfd, (SA *) &cliaddr, &clilen);
#ifdef NOTDEF
printf("new client: %s, port %d\n",
Inet_ntop(AF_INET, &cliaddr.sin_addr, 4, NULL),
ntohs(cliaddr.sin_port));
#endif for (i = 0; i < FD_SETSIZE; i++)
if (client[i] < 0) {
client[i] = connfd; /* save descriptor */
break;
}
if (i == FD_SETSIZE)
err_quit("too many clients"); FD_SET(connfd, &allset); /* add new descriptor to set */
if (connfd > maxfd)
maxfd = connfd; /* for select */
if (i > maxi)
maxi = i; /* max index in client[] array */ if (--nready <= 0)
continue; /* no more readable descriptors */
} for (i = 0; i <= maxi; i++) { /* check all clients for data */
if ( (sockfd = client[i]) < 0)
continue;
if (FD_ISSET(sockfd, &rset)) {
if ( (n = Read(sockfd, buf, MAXLINE)) == 0) {
/*4connection closed by client */
Close(sockfd);
FD_CLR(sockfd, &allset);
client[i] = -1;
} else
Writen(sockfd, buf, n); if (--nready <= 0)
break; /* no more readable descriptors */
}
}
}
}
/* end fig02 */
拒绝服务型攻击
对于上面这种单个服务进程处理多个客户端,可能由拒绝服务型攻击,
比如,如果服务器使用 ReadLine 与客户端通信,那么恶意客户端可能只输入一个字符,不输入回车,于是服务器就会阻塞在readline,导致无法为其他客户端服务。
解决方法是,(a)多进程或多线程处理客户端 (b)非阻塞IO(c)IO操作设置超时
pselect
int pselect(int nfds, fd_set *readfds, fd_set *writefds,
fd_set *exceptfds, const struct timespec *timeout,
const sigset_t *sigmask);
pselect 是select的增强版,具体增强如下:
(1)使用 timespec ,代替timeval
struct timeval {
long tv_sec; /* seconds */
long tv_usec; /* microseconds */
};
and
struct timespec {
long tv_sec; /* seconds */
long tv_nsec; /* nanoseconds */
};
timespec.tv_nsec是纳秒级。而select只能设置到微秒级。
(2)可以设置pselect阻塞期间的 sigmask。这可解决如下问题
SIGINT的回调函数只设置全局变量 intr_flag,通过检测intr_flag决定是否处理handle_intr,
但是如果 SIGINT 发生在 if(intr_flag) 之后,select阻塞之前,则程序会永远阻塞。
if (intr_flag)
handle_intr();
if ((nready = select()) < 0) {
if (errno == EINTR) {
if (intr_flag)
handle_intr();
}
}
可以使用pselect解决,在pselect之前阻塞 SIGINT,pselect阻塞时,放开 SIGINT
sigset_t newmask, oldmask, zeromask sigemptyset(&zeromask);
sigemptyset(&newmask);
sigaddset(&newmask, SIGINT); sigprocmask(SIG_BLOCK, &newmask, &oldmask); if (intr_flag)
handle_intr();
if ((nready = pselect(..., &zeromask)) < 0) {
if (errno == EINTR) {
if (intr_flag)
handle_intr();
}
}
UNP——第六章,多路转接IO——select的更多相关文章
- Linux下I/O多路转接之select --fd_set
fd_set 你终于还是来了,能看到这个标题进来的,我想,你一定是和我遇到了一样的问题,一样的疑惑,接下来几个小时,我一定竭尽全力,写出我想说的,希望也正是你所需要的: 关于Linux下I/O多路转接 ...
- UNIX环境高级编程——I/O多路转接(select、pselect和poll)
I/O多路转接:先构造一张有关描述符的列表,然后调用一个函数,直到这些描述符中的一个已准备好进行I/O时,该函数才返回.在返回时,它告诉进程哪些描述符已准备好可以进行I/O. poll.pselect ...
- 【Nginx】I/O多路转接之select、poll、epoll
当需要读两个以上的I/O的时候,如果使用阻塞式的I/O,那么可能长时间的阻塞在一个描述符上面,另外的描述符虽然有数据但是不能读出来,这样实时性不能满足要求,大概的解决方案有以下几种: 1.使用多进程或 ...
- I/O多路转接之select
系统提供select函数来实现多路复⽤用输入/输出模型.select系统调用是用来让我们的程序监视 多个文件句柄的状态变化的.程序会停在select这里等待,直到被监视的文件句柄有一个或 多个发生了状 ...
- IO多路转接select和poll
select IO多路复用的设置方法与信号的屏蔽有点相似: 信号屏蔽需要先设定一个信号集, 初始化信号集, 添加需要屏蔽的信号, 然后用sigprocmask设置 IO多路转接需要先设定一个文件描述符 ...
- select函数与I/O多路转接
select函数与I/O多路转接 相作大家都写过读写IO操作的代码,例如从socket中读取数据可以使用如下的代码: while( (n = read(socketfd, buf, BUFSIZE) ...
- 高级I/O之I/O多路转接——pool、select
当从一个描述符读,然后又写到另一个描述符时,可以在下列形式的循环中使用阻塞I/O: ) if (write(STDOUT_FILENO, buf, n) != n) err_sys("wri ...
- select 与 I/O多路转接
参考博客:http://blog.sina.com.cn/s/blog_607072980102uxcw.html I/0多路转接: 描述符表示某个I/O.构造一张有关描述符的数据表,调用select ...
- UNP学习笔记(第二十六章 线程)
线程有时称为轻权进程(lightweight process) 同一进程内的所有线程共享相同的全局内存.这使得线程之间易于共享信息,然后这样也会带来同步的问题 同一进程内的所有线程处理共享全局变量外还 ...
随机推荐
- 实现base64的编码解码,深刻理解base64
上代码 #include<stdio.h> #include<string.h> #include<stdlib.h> const char padding = ' ...
- go 接口实现
package main import ( "fmt" ) // 定义接口 type Beahavior interface { Run() string Eat(thing st ...
- 通透,23 个问题 TCP 疑难杂症全解析
每个时代,都不会亏待会学习的人. 在进入今天主题之前我先抛几个问题,这篇文章一共提出 23 个问题. TCP 握手一定是三次?TCP 挥手一定是四次? 为什么要有快速重传,超时重传不够用?为什么要有 ...
- 使用PyPdf2合并PDF文件(没有空白、报错)
使用PyPdf2合并PDF文件(没有空白.报错) 对于合并之后pdf空白,或者出现 'latin-1' codec can't encode characters in position 8-11: ...
- java: 非法字符: '\ufeff'
错误问题记录: Error:(1, 1) java: 非法字符: '\ufeff' Error:(1, 1) 错误: 需要class, interface或enum报错 问题发生时因为编码问题导致,如 ...
- String题目解析1
Java又不是C++,什么时候字符数组等于字符串了(对这句话我不负责任)? 而常量池中的字符串,只有变量名不同是可以用双等号判断是否相等的,内存都是常量池中的字符串. 但是new出来的字符串,只能用e ...
- unordered_set
用哈希表实现的 https://blog.csdn.net/dream_you_to_life/article/details/46785741
- Python opencv resize图片并保存原有的图像比例
参考链接:https://www.jianshu.com/p/3092835eab61 现有的图像是高瘦高瘦的,所以直接resize成矩形不合适.改变了整个结构. 所以采用的是先resize再padd ...
- Go之NSQ简介,原理和使用
NSQ简介 NSQ是Go语言编写的一个开源的实时分布式内存消息队列,其性能十分优异. NSQ 是实时的分布式消息处理平台,其设计的目的是用来大规模地处理每天数以十亿计级别的消息.它具有分布式和去中心化 ...
- 使用百度云服务器BCC搭建网站,过程记录
1.买了个最低端的百度云云服务器:1G内存+1核+40系统盘,获得一个静态服务IP地址,之前在阿里那边买个一个域名,在百度云备案一下,通过后就可以正常解析,把域名和IP对应起来了,主要目的是熟悉一下整 ...