int select(int nfds, fd_set *readfds, fd_set *writefds,
fd_set *exceptfds, struct timeval *timeout);

    struct timeval {
        long tv_sec; /* seconds */
        long tv_usec; /* microseconds */
        };

1.函数介绍

nfds

最大文件描述符+1

通过告诉内核最多需要检查的文件描述符数量,以提高效率,(否则内核需要检查所有的文件描述符)

至于为什么是最大文件描述符值+1,表示 需要检查的文件描述符的数量,原因是 文件描述符从0开始,而数量从1 开始。

readfds, writefds, exceptfds

都是传入传出参数

通过位掩码的方式表示监听的文件描述符

      void FD_CLR(int fd, fd_set *set);
int FD_ISSET(int fd, fd_set *set);
void FD_SET(int fd, fd_set *set);
void FD_ZERO(fd_set *set);

timeout

可以选择:

一直阻塞,直到有事件触发

阻塞一段时间,直到有事件触发

不阻塞,立即返回

阻塞可能被信号处理中断,而timeout不是传出参数,所以timeout不会记录剩余的等待时间,而是使用上次的值调用。

如果需要剩余的等待时间,可以在select调用前后记录系统时间以计算。

2. 事件触发的情况

3. 改写客户端

基于select的 str_cli

客户端套接字可能的事件如下

void
str_cli(FILE *fp, int sockfd)
{
int maxfdp1;
fd_set rset;
char sendline[MAXLINE], recvline[MAXLINE]; FD_ZERO(&rset);
for ( ; ; ) {
FD_SET(fileno(fp), &rset);
FD_SET(sockfd, &rset);
maxfdp1 = max(fileno(fp), sockfd) + 1;
Select(maxfdp1, &rset, NULL, NULL, NULL); if (FD_ISSET(sockfd, &rset)) { /* socket is readable */
if (Readline(sockfd, recvline, MAXLINE) == 0)
err_quit("str_cli: server terminated prematurely");
Fputs(recvline, stdout);
} if (FD_ISSET(fileno(fp), &rset)) { /* input is readable */
if (Fgets(sendline, MAXLINE, fp) == NULL)
return; /* all done */
Writen(sockfd, sendline, strlen(sendline));
}
}
}

改进

(1)批量输入

因为程序采用 停等方式,如果采用交互输入,一个RTT的情况如下

可见只用了管道的 1/8

如果使用文件重定向的方式运行程序,那么会批量输入程序,但运行结果出错,输出文件小于输入文件。

考虑下面情况

当运行到时刻8时,客户端已经read完了文件,所以会close,造成套接字进入半关闭,

如此服务器发送的数据,客户端就无法接受,导致数据丢失。

半关闭
单方面调用close后,
主动关闭方进入 FIN_WAIT_2, 不能进行读写操作
被动关闭方进入 CLOSE_WAIT,能进行读写操作,不过read返回0,write的数据不能传递给对端的应用层(在对端的TCP层被接受后丢弃)。

解决方法是:

发送FIN,告诉对方自己已经完成了数据发送,但是仍然保持套接字描述符打开以便读取,

使用 shutdown实现

(2)缓冲和 select

select 关于读写操作的事件触发是按照read/write的情况,即不带缓冲的情况,

如果使用 stdio或者自定义的缓冲操作容易造成错误,

如,使用 fgets,当 select 触发后,fgets会尽可能读数据到缓冲,可能读了多行输入,但是一次只返回一行,

于是select触发一次,收到多行输入,但是只处理了一行输入。

解决方法:

避免select和缓冲io合用。

shutdown函数

为了实现,客户端关闭后,仍能接受对方的输入

       int shutdown(int sockfd, int how);
howto

SHUT_RD
关闭读,丢弃套接字接受缓冲区所有数据,所有新来的对端数据被悄悄接受,回复,并丢弃 SHUT_WR
关闭写,套接字发送缓冲区现有数据正常发送,并发送FIN,进程不能对该套接字进行写操作 SHUT_RDWR
相当于分别调用 SHUT_RD,和SHUT_WR

修订版

void
str_cli(FILE *fp, int sockfd)
{
int maxfdp1, stdineof;
fd_set rset;
char buf[MAXLINE];
int n; stdineof = 0;
FD_ZERO(&rset);
for ( ; ; ) {
if (stdineof == 0)
FD_SET(fileno(fp), &rset);
FD_SET(sockfd, &rset);
maxfdp1 = max(fileno(fp), sockfd) + 1;
Select(maxfdp1, &rset, NULL, NULL, NULL); if (FD_ISSET(sockfd, &rset)) { /* socket is readable */
if ( (n = Read(sockfd, buf, MAXLINE)) == 0) {
if (stdineof == 1)
return; /* normal termination */
else
err_quit("str_cli: server terminated prematurely");
} Write(fileno(stdout), buf, n);
} if (FD_ISSET(fileno(fp), &rset)) { /* input is readable */
if ( (n = Read(fileno(fp), buf, MAXLINE)) == 0) {
stdineof = 1;
Shutdown(sockfd, SHUT_WR); /* send FIN */
FD_CLR(fileno(fp), &rset);
continue;
} Writen(sockfd, buf, n);
}
}
}

select 实现服务器

通过select ,实现单个进程检测多个套接字。

思考需要的数据结构,由于单进程要维护多个客户端连接,即需要区分多个客户端,客户端的区分使用对应套接字,所以需要一个维护已连接客户端的文件描述符数组。

另外,由于使用select,监控read事件,所以需要一个readfds数组。

client中,将未使用的置为-1.

rset中,前三个描述符被占用,fd3为监听套接字。

另外需要思考,添加客户端,和删除客户端,时对上面的数据结构的操作顺序。

对于添加客户端,

  首先,已经知道的数据,accept获得 connfd,所以client[i] = connfd,FD_SET(connfd, &rset)

  然后select需要 maxfd1 ,所以需要维护一个maxfd, if(connfd > maxfd) maxfd = connfd;

对于删除客户端

  首先,已经知道的数据:FD_ISSET(fd, &rset) 获得 connfd,所以 if(client[i] == fd) client[i] = -1; FD_CLR(fd, &rset)

  对于maxfd1,不方便处理,所以就不处理了,比较几乎不会影响效率。

/* include fig01 */
#include "unp.h" int
main(int argc, char **argv)
{
int i, maxi, maxfd, listenfd, connfd, sockfd;
int nready, client[FD_SETSIZE];
ssize_t n;
fd_set rset, allset;
char buf[MAXLINE];
socklen_t clilen;
struct sockaddr_in cliaddr, servaddr; listenfd = Socket(AF_INET, SOCK_STREAM, 0); bzero(&servaddr, sizeof(servaddr));
servaddr.sin_family = AF_INET;
servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
servaddr.sin_port = htons(SERV_PORT); Bind(listenfd, (SA *) &servaddr, sizeof(servaddr)); Listen(listenfd, LISTENQ); maxfd = listenfd; /* initialize */
maxi = -1; /* index into client[] array */
for (i = 0; i < FD_SETSIZE; i++)
client[i] = -1; /* -1 indicates available entry */
FD_ZERO(&allset);
FD_SET(listenfd, &allset);
/* end fig01 */ /* include fig02 */
for ( ; ; ) {
rset = allset; /* structure assignment */
nready = Select(maxfd+1, &rset, NULL, NULL, NULL); if (FD_ISSET(listenfd, &rset)) { /* new client connection */
clilen = sizeof(cliaddr);
connfd = Accept(listenfd, (SA *) &cliaddr, &clilen);
#ifdef NOTDEF
printf("new client: %s, port %d\n",
Inet_ntop(AF_INET, &cliaddr.sin_addr, 4, NULL),
ntohs(cliaddr.sin_port));
#endif for (i = 0; i < FD_SETSIZE; i++)
if (client[i] < 0) {
client[i] = connfd; /* save descriptor */
break;
}
if (i == FD_SETSIZE)
err_quit("too many clients"); FD_SET(connfd, &allset); /* add new descriptor to set */
if (connfd > maxfd)
maxfd = connfd; /* for select */
if (i > maxi)
maxi = i; /* max index in client[] array */ if (--nready <= 0)
continue; /* no more readable descriptors */
} for (i = 0; i <= maxi; i++) { /* check all clients for data */
if ( (sockfd = client[i]) < 0)
continue;
if (FD_ISSET(sockfd, &rset)) {
if ( (n = Read(sockfd, buf, MAXLINE)) == 0) {
/*4connection closed by client */
Close(sockfd);
FD_CLR(sockfd, &allset);
client[i] = -1;
} else
Writen(sockfd, buf, n); if (--nready <= 0)
break; /* no more readable descriptors */
}
}
}
}
/* end fig02 */

拒绝服务型攻击

  对于上面这种单个服务进程处理多个客户端,可能由拒绝服务型攻击,

  比如,如果服务器使用 ReadLine 与客户端通信,那么恶意客户端可能只输入一个字符,不输入回车,于是服务器就会阻塞在readline,导致无法为其他客户端服务。

  解决方法是,(a)多进程或多线程处理客户端 (b)非阻塞IO(c)IO操作设置超时

pselect

       int pselect(int nfds, fd_set *readfds, fd_set *writefds,
fd_set *exceptfds, const struct timespec *timeout,
const sigset_t *sigmask);

pselect 是select的增强版,具体增强如下:

  (1)使用 timespec ,代替timeval

           struct timeval {
long tv_sec; /* seconds */
long tv_usec; /* microseconds */
}; and struct timespec {
long tv_sec; /* seconds */
long tv_nsec; /* nanoseconds */
};

    timespec.tv_nsec是纳秒级。而select只能设置到微秒级。

  (2)可以设置pselect阻塞期间的 sigmask。这可解决如下问题

    SIGINT的回调函数只设置全局变量 intr_flag,通过检测intr_flag决定是否处理handle_intr,

    但是如果 SIGINT 发生在 if(intr_flag) 之后,select阻塞之前,则程序会永远阻塞。

if (intr_flag)
handle_intr();
if ((nready = select()) < 0) {
if (errno == EINTR) {
if (intr_flag)
handle_intr();
}
}

    可以使用pselect解决,在pselect之前阻塞 SIGINT,pselect阻塞时,放开 SIGINT

sigset_t newmask, oldmask, zeromask

sigemptyset(&zeromask);
sigemptyset(&newmask);
sigaddset(&newmask, SIGINT); sigprocmask(SIG_BLOCK, &newmask, &oldmask); if (intr_flag)
handle_intr();
if ((nready = pselect(..., &zeromask)) < 0) {
if (errno == EINTR) {
if (intr_flag)
handle_intr();
}
}

  

UNP——第六章,多路转接IO——select的更多相关文章

  1. Linux下I/O多路转接之select --fd_set

    fd_set 你终于还是来了,能看到这个标题进来的,我想,你一定是和我遇到了一样的问题,一样的疑惑,接下来几个小时,我一定竭尽全力,写出我想说的,希望也正是你所需要的: 关于Linux下I/O多路转接 ...

  2. UNIX环境高级编程——I/O多路转接(select、pselect和poll)

    I/O多路转接:先构造一张有关描述符的列表,然后调用一个函数,直到这些描述符中的一个已准备好进行I/O时,该函数才返回.在返回时,它告诉进程哪些描述符已准备好可以进行I/O. poll.pselect ...

  3. 【Nginx】I/O多路转接之select、poll、epoll

    当需要读两个以上的I/O的时候,如果使用阻塞式的I/O,那么可能长时间的阻塞在一个描述符上面,另外的描述符虽然有数据但是不能读出来,这样实时性不能满足要求,大概的解决方案有以下几种: 1.使用多进程或 ...

  4. I/O多路转接之select

    系统提供select函数来实现多路复⽤用输入/输出模型.select系统调用是用来让我们的程序监视 多个文件句柄的状态变化的.程序会停在select这里等待,直到被监视的文件句柄有一个或 多个发生了状 ...

  5. IO多路转接select和poll

    select IO多路复用的设置方法与信号的屏蔽有点相似: 信号屏蔽需要先设定一个信号集, 初始化信号集, 添加需要屏蔽的信号, 然后用sigprocmask设置 IO多路转接需要先设定一个文件描述符 ...

  6. select函数与I/O多路转接

    select函数与I/O多路转接 相作大家都写过读写IO操作的代码,例如从socket中读取数据可以使用如下的代码: while( (n = read(socketfd, buf, BUFSIZE) ...

  7. 高级I/O之I/O多路转接——pool、select

    当从一个描述符读,然后又写到另一个描述符时,可以在下列形式的循环中使用阻塞I/O: ) if (write(STDOUT_FILENO, buf, n) != n) err_sys("wri ...

  8. select 与 I/O多路转接

    参考博客:http://blog.sina.com.cn/s/blog_607072980102uxcw.html I/0多路转接: 描述符表示某个I/O.构造一张有关描述符的数据表,调用select ...

  9. UNP学习笔记(第二十六章 线程)

    线程有时称为轻权进程(lightweight process) 同一进程内的所有线程共享相同的全局内存.这使得线程之间易于共享信息,然后这样也会带来同步的问题 同一进程内的所有线程处理共享全局变量外还 ...

随机推荐

  1. 实现base64的编码解码,深刻理解base64

    上代码 #include<stdio.h> #include<string.h> #include<stdlib.h> const char padding = ' ...

  2. go 接口实现

    package main import ( "fmt" ) // 定义接口 type Beahavior interface { Run() string Eat(thing st ...

  3. 通透,23 个问题 TCP 疑难杂症全解析

    每个时代,都不会亏待会学习的人. 在进入今天主题之前我先抛几个问题,这篇文章一共提出 23 个问题. TCP 握手一定是三次?TCP 挥手一定是四次? 为什么要有快速重传,超时重传不够用?为什么要有 ...

  4. 使用PyPdf2合并PDF文件(没有空白、报错)

    使用PyPdf2合并PDF文件(没有空白.报错) 对于合并之后pdf空白,或者出现 'latin-1' codec can't encode characters in position 8-11: ...

  5. java: 非法字符: '\ufeff'

    错误问题记录: Error:(1, 1) java: 非法字符: '\ufeff' Error:(1, 1) 错误: 需要class, interface或enum报错 问题发生时因为编码问题导致,如 ...

  6. String题目解析1

    Java又不是C++,什么时候字符数组等于字符串了(对这句话我不负责任)? 而常量池中的字符串,只有变量名不同是可以用双等号判断是否相等的,内存都是常量池中的字符串. 但是new出来的字符串,只能用e ...

  7. unordered_set

    用哈希表实现的 https://blog.csdn.net/dream_you_to_life/article/details/46785741

  8. Python opencv resize图片并保存原有的图像比例

    参考链接:https://www.jianshu.com/p/3092835eab61 现有的图像是高瘦高瘦的,所以直接resize成矩形不合适.改变了整个结构. 所以采用的是先resize再padd ...

  9. Go之NSQ简介,原理和使用

    NSQ简介 NSQ是Go语言编写的一个开源的实时分布式内存消息队列,其性能十分优异. NSQ 是实时的分布式消息处理平台,其设计的目的是用来大规模地处理每天数以十亿计级别的消息.它具有分布式和去中心化 ...

  10. 使用百度云服务器BCC搭建网站,过程记录

    1.买了个最低端的百度云云服务器:1G内存+1核+40系统盘,获得一个静态服务IP地址,之前在阿里那边买个一个域名,在百度云备案一下,通过后就可以正常解析,把域名和IP对应起来了,主要目的是熟悉一下整 ...