int select(int nfds, fd_set *readfds, fd_set *writefds,
fd_set *exceptfds, struct timeval *timeout);

    struct timeval {
        long tv_sec; /* seconds */
        long tv_usec; /* microseconds */
        };

1.函数介绍

nfds

最大文件描述符+1

通过告诉内核最多需要检查的文件描述符数量,以提高效率,(否则内核需要检查所有的文件描述符)

至于为什么是最大文件描述符值+1,表示 需要检查的文件描述符的数量,原因是 文件描述符从0开始,而数量从1 开始。

readfds, writefds, exceptfds

都是传入传出参数

通过位掩码的方式表示监听的文件描述符

      void FD_CLR(int fd, fd_set *set);
int FD_ISSET(int fd, fd_set *set);
void FD_SET(int fd, fd_set *set);
void FD_ZERO(fd_set *set);

timeout

可以选择:

一直阻塞,直到有事件触发

阻塞一段时间,直到有事件触发

不阻塞,立即返回

阻塞可能被信号处理中断,而timeout不是传出参数,所以timeout不会记录剩余的等待时间,而是使用上次的值调用。

如果需要剩余的等待时间,可以在select调用前后记录系统时间以计算。

2. 事件触发的情况

3. 改写客户端

基于select的 str_cli

客户端套接字可能的事件如下

void
str_cli(FILE *fp, int sockfd)
{
int maxfdp1;
fd_set rset;
char sendline[MAXLINE], recvline[MAXLINE]; FD_ZERO(&rset);
for ( ; ; ) {
FD_SET(fileno(fp), &rset);
FD_SET(sockfd, &rset);
maxfdp1 = max(fileno(fp), sockfd) + 1;
Select(maxfdp1, &rset, NULL, NULL, NULL); if (FD_ISSET(sockfd, &rset)) { /* socket is readable */
if (Readline(sockfd, recvline, MAXLINE) == 0)
err_quit("str_cli: server terminated prematurely");
Fputs(recvline, stdout);
} if (FD_ISSET(fileno(fp), &rset)) { /* input is readable */
if (Fgets(sendline, MAXLINE, fp) == NULL)
return; /* all done */
Writen(sockfd, sendline, strlen(sendline));
}
}
}

改进

(1)批量输入

因为程序采用 停等方式,如果采用交互输入,一个RTT的情况如下

可见只用了管道的 1/8

如果使用文件重定向的方式运行程序,那么会批量输入程序,但运行结果出错,输出文件小于输入文件。

考虑下面情况

当运行到时刻8时,客户端已经read完了文件,所以会close,造成套接字进入半关闭,

如此服务器发送的数据,客户端就无法接受,导致数据丢失。

半关闭
单方面调用close后,
主动关闭方进入 FIN_WAIT_2, 不能进行读写操作
被动关闭方进入 CLOSE_WAIT,能进行读写操作,不过read返回0,write的数据不能传递给对端的应用层(在对端的TCP层被接受后丢弃)。

解决方法是:

发送FIN,告诉对方自己已经完成了数据发送,但是仍然保持套接字描述符打开以便读取,

使用 shutdown实现

(2)缓冲和 select

select 关于读写操作的事件触发是按照read/write的情况,即不带缓冲的情况,

如果使用 stdio或者自定义的缓冲操作容易造成错误,

如,使用 fgets,当 select 触发后,fgets会尽可能读数据到缓冲,可能读了多行输入,但是一次只返回一行,

于是select触发一次,收到多行输入,但是只处理了一行输入。

解决方法:

避免select和缓冲io合用。

shutdown函数

为了实现,客户端关闭后,仍能接受对方的输入

       int shutdown(int sockfd, int how);
howto

SHUT_RD
关闭读,丢弃套接字接受缓冲区所有数据,所有新来的对端数据被悄悄接受,回复,并丢弃 SHUT_WR
关闭写,套接字发送缓冲区现有数据正常发送,并发送FIN,进程不能对该套接字进行写操作 SHUT_RDWR
相当于分别调用 SHUT_RD,和SHUT_WR

修订版

void
str_cli(FILE *fp, int sockfd)
{
int maxfdp1, stdineof;
fd_set rset;
char buf[MAXLINE];
int n; stdineof = 0;
FD_ZERO(&rset);
for ( ; ; ) {
if (stdineof == 0)
FD_SET(fileno(fp), &rset);
FD_SET(sockfd, &rset);
maxfdp1 = max(fileno(fp), sockfd) + 1;
Select(maxfdp1, &rset, NULL, NULL, NULL); if (FD_ISSET(sockfd, &rset)) { /* socket is readable */
if ( (n = Read(sockfd, buf, MAXLINE)) == 0) {
if (stdineof == 1)
return; /* normal termination */
else
err_quit("str_cli: server terminated prematurely");
} Write(fileno(stdout), buf, n);
} if (FD_ISSET(fileno(fp), &rset)) { /* input is readable */
if ( (n = Read(fileno(fp), buf, MAXLINE)) == 0) {
stdineof = 1;
Shutdown(sockfd, SHUT_WR); /* send FIN */
FD_CLR(fileno(fp), &rset);
continue;
} Writen(sockfd, buf, n);
}
}
}

select 实现服务器

通过select ,实现单个进程检测多个套接字。

思考需要的数据结构,由于单进程要维护多个客户端连接,即需要区分多个客户端,客户端的区分使用对应套接字,所以需要一个维护已连接客户端的文件描述符数组。

另外,由于使用select,监控read事件,所以需要一个readfds数组。

client中,将未使用的置为-1.

rset中,前三个描述符被占用,fd3为监听套接字。

另外需要思考,添加客户端,和删除客户端,时对上面的数据结构的操作顺序。

对于添加客户端,

  首先,已经知道的数据,accept获得 connfd,所以client[i] = connfd,FD_SET(connfd, &rset)

  然后select需要 maxfd1 ,所以需要维护一个maxfd, if(connfd > maxfd) maxfd = connfd;

对于删除客户端

  首先,已经知道的数据:FD_ISSET(fd, &rset) 获得 connfd,所以 if(client[i] == fd) client[i] = -1; FD_CLR(fd, &rset)

  对于maxfd1,不方便处理,所以就不处理了,比较几乎不会影响效率。

/* include fig01 */
#include "unp.h" int
main(int argc, char **argv)
{
int i, maxi, maxfd, listenfd, connfd, sockfd;
int nready, client[FD_SETSIZE];
ssize_t n;
fd_set rset, allset;
char buf[MAXLINE];
socklen_t clilen;
struct sockaddr_in cliaddr, servaddr; listenfd = Socket(AF_INET, SOCK_STREAM, 0); bzero(&servaddr, sizeof(servaddr));
servaddr.sin_family = AF_INET;
servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
servaddr.sin_port = htons(SERV_PORT); Bind(listenfd, (SA *) &servaddr, sizeof(servaddr)); Listen(listenfd, LISTENQ); maxfd = listenfd; /* initialize */
maxi = -1; /* index into client[] array */
for (i = 0; i < FD_SETSIZE; i++)
client[i] = -1; /* -1 indicates available entry */
FD_ZERO(&allset);
FD_SET(listenfd, &allset);
/* end fig01 */ /* include fig02 */
for ( ; ; ) {
rset = allset; /* structure assignment */
nready = Select(maxfd+1, &rset, NULL, NULL, NULL); if (FD_ISSET(listenfd, &rset)) { /* new client connection */
clilen = sizeof(cliaddr);
connfd = Accept(listenfd, (SA *) &cliaddr, &clilen);
#ifdef NOTDEF
printf("new client: %s, port %d\n",
Inet_ntop(AF_INET, &cliaddr.sin_addr, 4, NULL),
ntohs(cliaddr.sin_port));
#endif for (i = 0; i < FD_SETSIZE; i++)
if (client[i] < 0) {
client[i] = connfd; /* save descriptor */
break;
}
if (i == FD_SETSIZE)
err_quit("too many clients"); FD_SET(connfd, &allset); /* add new descriptor to set */
if (connfd > maxfd)
maxfd = connfd; /* for select */
if (i > maxi)
maxi = i; /* max index in client[] array */ if (--nready <= 0)
continue; /* no more readable descriptors */
} for (i = 0; i <= maxi; i++) { /* check all clients for data */
if ( (sockfd = client[i]) < 0)
continue;
if (FD_ISSET(sockfd, &rset)) {
if ( (n = Read(sockfd, buf, MAXLINE)) == 0) {
/*4connection closed by client */
Close(sockfd);
FD_CLR(sockfd, &allset);
client[i] = -1;
} else
Writen(sockfd, buf, n); if (--nready <= 0)
break; /* no more readable descriptors */
}
}
}
}
/* end fig02 */

拒绝服务型攻击

  对于上面这种单个服务进程处理多个客户端,可能由拒绝服务型攻击,

  比如,如果服务器使用 ReadLine 与客户端通信,那么恶意客户端可能只输入一个字符,不输入回车,于是服务器就会阻塞在readline,导致无法为其他客户端服务。

  解决方法是,(a)多进程或多线程处理客户端 (b)非阻塞IO(c)IO操作设置超时

pselect

       int pselect(int nfds, fd_set *readfds, fd_set *writefds,
fd_set *exceptfds, const struct timespec *timeout,
const sigset_t *sigmask);

pselect 是select的增强版,具体增强如下:

  (1)使用 timespec ,代替timeval

           struct timeval {
long tv_sec; /* seconds */
long tv_usec; /* microseconds */
}; and struct timespec {
long tv_sec; /* seconds */
long tv_nsec; /* nanoseconds */
};

    timespec.tv_nsec是纳秒级。而select只能设置到微秒级。

  (2)可以设置pselect阻塞期间的 sigmask。这可解决如下问题

    SIGINT的回调函数只设置全局变量 intr_flag,通过检测intr_flag决定是否处理handle_intr,

    但是如果 SIGINT 发生在 if(intr_flag) 之后,select阻塞之前,则程序会永远阻塞。

if (intr_flag)
handle_intr();
if ((nready = select()) < 0) {
if (errno == EINTR) {
if (intr_flag)
handle_intr();
}
}

    可以使用pselect解决,在pselect之前阻塞 SIGINT,pselect阻塞时,放开 SIGINT

sigset_t newmask, oldmask, zeromask

sigemptyset(&zeromask);
sigemptyset(&newmask);
sigaddset(&newmask, SIGINT); sigprocmask(SIG_BLOCK, &newmask, &oldmask); if (intr_flag)
handle_intr();
if ((nready = pselect(..., &zeromask)) < 0) {
if (errno == EINTR) {
if (intr_flag)
handle_intr();
}
}

  

UNP——第六章,多路转接IO——select的更多相关文章

  1. Linux下I/O多路转接之select --fd_set

    fd_set 你终于还是来了,能看到这个标题进来的,我想,你一定是和我遇到了一样的问题,一样的疑惑,接下来几个小时,我一定竭尽全力,写出我想说的,希望也正是你所需要的: 关于Linux下I/O多路转接 ...

  2. UNIX环境高级编程——I/O多路转接(select、pselect和poll)

    I/O多路转接:先构造一张有关描述符的列表,然后调用一个函数,直到这些描述符中的一个已准备好进行I/O时,该函数才返回.在返回时,它告诉进程哪些描述符已准备好可以进行I/O. poll.pselect ...

  3. 【Nginx】I/O多路转接之select、poll、epoll

    当需要读两个以上的I/O的时候,如果使用阻塞式的I/O,那么可能长时间的阻塞在一个描述符上面,另外的描述符虽然有数据但是不能读出来,这样实时性不能满足要求,大概的解决方案有以下几种: 1.使用多进程或 ...

  4. I/O多路转接之select

    系统提供select函数来实现多路复⽤用输入/输出模型.select系统调用是用来让我们的程序监视 多个文件句柄的状态变化的.程序会停在select这里等待,直到被监视的文件句柄有一个或 多个发生了状 ...

  5. IO多路转接select和poll

    select IO多路复用的设置方法与信号的屏蔽有点相似: 信号屏蔽需要先设定一个信号集, 初始化信号集, 添加需要屏蔽的信号, 然后用sigprocmask设置 IO多路转接需要先设定一个文件描述符 ...

  6. select函数与I/O多路转接

    select函数与I/O多路转接 相作大家都写过读写IO操作的代码,例如从socket中读取数据可以使用如下的代码: while( (n = read(socketfd, buf, BUFSIZE) ...

  7. 高级I/O之I/O多路转接——pool、select

    当从一个描述符读,然后又写到另一个描述符时,可以在下列形式的循环中使用阻塞I/O: ) if (write(STDOUT_FILENO, buf, n) != n) err_sys("wri ...

  8. select 与 I/O多路转接

    参考博客:http://blog.sina.com.cn/s/blog_607072980102uxcw.html I/0多路转接: 描述符表示某个I/O.构造一张有关描述符的数据表,调用select ...

  9. UNP学习笔记(第二十六章 线程)

    线程有时称为轻权进程(lightweight process) 同一进程内的所有线程共享相同的全局内存.这使得线程之间易于共享信息,然后这样也会带来同步的问题 同一进程内的所有线程处理共享全局变量外还 ...

随机推荐

  1. 游戏2048的核心算法c#版本的实现

    接触游戏有一段时间了,也写了一些东西,效果还不错,今天没事,我就把2048 c# 版本的实现贴出来,代码已经测试过,可以正常.完美运行.当然了,在网上有很多有关2048的实现方法,但是没有提出到类里面 ...

  2. 【linux-centos】安装ifstat!

    1.卸载原装ifstat find / -name *ifstat* 把/usr/sbin/ifstat.ifstat的man目录的.gz文件删除 2.下载安装 wget http://gael.ro ...

  3. BOOST 条件变量使用

    代码: // boost库 条件变量 使用测试 #include <iostream> #include <boost/thread.hpp> using namespace ...

  4. 单元测试之道Java版——读书笔记

    单元测试知道Java版读书笔记 首先我们必须要知道我们所写的代码,它的功能是什么,如果我们不了解代码的行为,那么也就无从测试. 我们测试的目的,是为了我们整个程序架构的稳定,代码其实就是欧文要实现功能 ...

  5. 因果推理综述——《A Survey on Causal Inference》一文的总结和梳理

    因果推理 本文档是对<A Survey on Causal Inference>一文的总结和梳理. 论文地址 简介 关联与因果 先有的鸡,还是先有的蛋?这里研究的是因果关系,因果关系与普通 ...

  6. Django折腾日记(django2.0)

    新建项目 django-admin startproject mysite 运行 python manage.py runserver 创建一个应用 python manage.py startapp ...

  7. 异常java.lang.IllegalArgumentException: An invalid character [32] was present in the Cookie value

    通过HttpServletResponse的addCookie(Cookie cookie)向客户端写cookie信息,这里使用的tomcat版本是8.5.31,出现如下报错: java.lang.I ...

  8. 常用手册或官网的url

    1.mysql--> https://www.mysql.com/ 2.菜鸟教程--> http://www.runoob.com 3.maven官网--> https://mave ...

  9. 线程池ScheduledThreadPool

    定时线程池 public class MainActivity extends AppCompatActivity { @Override protected void onCreate(Bundle ...

  10. eclipse配置springMVC

    基础还是创建一个Dynamic web project. WEB-INF/lib中添加必需的jar. commons-logging-1.1.3.jar spring-aop-4.3.6.RELEAS ...