前言

从零单排高性能问题,这次轮到异步通信了。这个领域入门有点难,需要了解UNIX五种IO模型和 TCP协议,熟练使用三大异步通信框架:Netty、NodeJS、Tornado。目前所有标榜异步的通信框架用的都不是异步IO模型,而是IO多路复 用中的epoll。因为Python提供了对Linux内核API的友好封装,所以我选择Python来学习IO多路复用。

IO多路复用

  1. select

    举一个EchoServer的例子,客户端发送任何内容,服务端会原模原样返回。

    #!/usr/bin/env python
    # -*- coding: utf-8 -*-
    '''
    Created on Feb 16, 2016 @author: mountain
    '''
    import socket
    import select
    from Queue import Queue #AF_INET指定使用IPv4协议,如果要用更先进的IPv6,就指定为AF_INET6。
    #SOCK_STREAM指定使用面向流的TCP协议,如果要使用面向数据包的UCP协议,就指定SOCK_DGRAM。
    server = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    server.setblocking(False)
    #设置监听的ip和port
    server_address = ('localhost', 1234)
    server.bind(server_address)
    #设置backlog为5,client向server发起connect,server accept后建立长连接,
    #backlog指定排队等待server accept的连接数量,超过这个数量,server将拒绝连接。
    server.listen(5)
    #注册在socket上的读事件
    inputs = [server]
    #注册在socket上的写事件
    outputs = []
    #注册在socket上的异常事件
    exceptions = []
    #每个socket有一个发送消息的队列
    msg_queues = {}
    print "server is listening on %s:%s." % server_address
    while inputs:
    #第四个参数是timeout,可选,表示n秒内没有任何事件通知,就执行下面代码
    readable, writable, exceptional = select.select(inputs, outputs, exceptions)
    for sock in readable:
    #client向server发起connect也是读事件,server accept后产生socket加入读队列中
    if sock is server:
    conn, addr = sock.accept()
    conn.setblocking(False)
    inputs.append(conn)
    msg_queues[conn] = Queue()
    print "server accepts a conn."
    else:
    #读取client发过来的数据,最多读取1k byte。
    data = sock.recv(1024)
    #将收到的数据返回给client
    if data:
    msg_queues[sock].put(data)
    if sock not in outputs:
    #下次select的时候会触发写事件通知,写和读事件不太一样,前者是可写就会触发事件,并不一定要真的去写
    outputs.append(sock)
    else:
    #client传过来的消息为空,说明已断开连接
    print "server closes a conn."
    if sock in outputs:
    outputs.remove(sock)
    inputs.remove(sock)
    sock.close()
    del msg_queues[sock]
    for sock in writable:
    if not msg_queues[sock].empty():
    sock.send(msg_queues[sock].get_nowait())
    if msg_queues[sock].empty():
    outputs.remove(sock)
    for sock in exceptional:
    inputs.remove(sock)
    if sock in outputs:
    outputs.remove(sock)
    sock.close()
    del msg_queues[sock]
    [mountain@king ~/workspace/wire]$ telnet localhost 1234
    Trying 127.0.0.1...
    Connected to localhost.
    Escape character is '^]'.
    1
    1

    select有3个缺点:

    1. 每次调用select,都需要把fd集合从用户态拷贝到内核态,这个开销在fd很多时会很大。
    2. 每次调用select后,都需要在内核遍历传递进来的所有fd,这个开销在fd很多时也很大。
      这点从python的例子里看不出来,因为python select api更加友好,直接返回就绪的socket列表。事实上linux内核select api返回的是就绪socket数目:
      int select (int n, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);
    3. fd数量有限,默认1024。
  2. poll

    采用poll重新实现EchoServer,只要搞懂了select,poll也不难,只是api的参数不太一样而已。

    #!/usr/bin/env python
    # -*- coding: utf-8 -*-
    '''
    Created on Feb 27, 2016 @author: mountain
    '''
    import select
    import socket
    import sys
    import Queue server = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    server.setblocking(False)
    server_address = ('localhost', 1234)
    server.bind(server_address)
    server.listen(5)
    print 'server is listening on %s port %s' % server_address
    msg_queues = {}
    timeout = 1000 * 60
    #POLLIN: There is data to read
    #POLLPRI: There is urgent data to read
    #POLLOUT: Ready for output
    #POLLERR: Error condition of some sort
    #POLLHUP: Hung up
    #POLLNVAL: Invalid request: descriptor not open
    READ_ONLY = select.POLLIN | select.POLLPRI | select.POLLHUP | select.POLLERR
    READ_WRITE = READ_ONLY | select.POLLOUT
    poller = select.poll()
    #注册需要监听的事件
    poller.register(server, READ_ONLY)
    #文件描述符和socket映射
    fd_to_socket = { server.fileno(): server}
    while True:
    events = poller.poll(timeout)
    for fd, flag in events:
    sock = fd_to_socket[fd]
    if flag & (select.POLLIN | select.POLLPRI):
    if sock is server:
    conn, client_address = sock.accept()
    conn.setblocking(False)
    fd_to_socket[conn.fileno()] = conn
    poller.register(conn, READ_ONLY)
    msg_queues[conn] = Queue.Queue()
    else:
    data = sock.recv(1024)
    if data:
    msg_queues[sock].put(data)
    poller.modify(sock, READ_WRITE)
    else:
    poller.unregister(sock)
    sock.close()
    del msg_queues[sock]
    elif flag & select.POLLHUP:
    poller.unregister(sock)
    sock.close()
    del msg_queues[sock]
    elif flag & select.POLLOUT:
    if not msg_queues[sock].empty():
    msg = msg_queues[sock].get_nowait()
    sock.send(msg)
    else:
    poller.modify(sock, READ_ONLY)
    elif flag & select.POLLERR:
    poller.unregister(sock)
    sock.close()
    del msg_queues[sock]

    poll解决了select的第三个缺点,fd数量不受限制,但是失去了select的跨平台特性,它的linux内核api是这样的:

    int poll (struct pollfd *fds, unsigned int nfds, int timeout);
    struct pollfd {
    int fd; /* file descriptor */
    short events; /* requested events to watch */
    short revents; /* returned events witnessed */
    };
  3. epoll

    用法与poll几乎一样。

    #!/usr/bin/env python
    # -*- coding: utf-8 -*-
    '''
    Created on Feb 28, 2016 @author: mountain
    '''
    import select
    import socket
    import Queue server = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    server.setblocking(False)
    server_address = ('localhost', 1234)
    server.bind(server_address)
    server.listen(5)
    print 'server is listening on %s port %s' % server_address
    msg_queues = {}
    timeout = 60
    READ_ONLY = select.EPOLLIN | select.EPOLLPRI
    READ_WRITE = READ_ONLY | select.EPOLLOUT
    epoll = select.epoll()
    #注册需要监听的事件
    epoll.register(server, READ_ONLY)
    #文件描述符和socket映射
    fd_to_socket = { server.fileno(): server}
    while True:
    events = epoll.poll(timeout)
    for fd, flag in events:
    sock = fd_to_socket[fd]
    if flag & READ_ONLY:
    if sock is server:
    conn, client_address = sock.accept()
    conn.setblocking(False)
    fd_to_socket[conn.fileno()] = conn
    epoll.register(conn, READ_ONLY)
    msg_queues[conn] = Queue.Queue()
    else:
    data = sock.recv(1024)
    if data:
    msg_queues[sock].put(data)
    epoll.modify(sock, READ_WRITE)
    else:
    epoll.unregister(sock)
    sock.close()
    del msg_queues[sock]
    elif flag & select.EPOLLHUP:
    epoll.unregister(sock)
    sock.close()
    del msg_queues[sock]
    elif flag & select.EPOLLOUT:
    if not msg_queues[sock].empty():
    msg = msg_queues[sock].get_nowait()
    sock.send(msg)
    else:
    epoll.modify(sock, READ_ONLY)
    elif flag & select.EPOLLERR:
    epoll.unregister(sock)
    sock.close()
    del msg_queues[sock]

    epoll解决了select的三个缺点,是目前最好的IO多路复用解决方案。为了更好地理解epoll,我们来看一下linux内核api的用法。

    int epoll_create(int size)//创建一个epoll的句柄,size用来告诉内核这个监听的数目一共有多大。
    int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event)//注册事件,每个fd只拷贝一次。
    int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout)/*等待IO事件,事件发生时,
    内核调用回调函数,把就绪fd放入就绪链表中,并唤醒epoll_wait,epoll_wait只需要遍历就绪链表即可,
    而select和poll都是遍历所有fd,这效率高下立判。*/

IO多路复用深入浅出的更多相关文章

  1. IO模型--阻塞IO,非阻塞IO,IO多路复用,异步IO

    IO模型介绍: * blocking IO 阻塞IO * nonblocking IO 非阻塞IO * IO multiplexing IO多路复用 * signal driven IO 信号驱动IO ...

  2. python 全栈开发,Day44(IO模型介绍,阻塞IO,非阻塞IO,多路复用IO,异步IO,IO模型比较分析,selectors模块,垃圾回收机制)

    昨日内容回顾 协程实际上是一个线程,执行了多个任务,遇到IO就切换 切换,可以使用yield,greenlet 遇到IO gevent: 检测到IO,能够使用greenlet实现自动切换,规避了IO阻 ...

  3. {python之IO多路复用} IO模型介绍 阻塞IO(blocking IO) 非阻塞IO(non-blocking IO) 多路复用IO(IO multiplexing) 异步IO(Asynchronous I/O) IO模型比较分析 selectors模块

    python之IO多路复用 阅读目录 一 IO模型介绍 二 阻塞IO(blocking IO) 三 非阻塞IO(non-blocking IO) 四 多路复用IO(IO multiplexing) 五 ...

  4. 并发编程(IO多路复用)

    阅读目录 一 IO模型介绍 二 阻塞IO(blocking IO) 三 非阻塞IO(non-blocking IO) 四 多路复用IO(IO multiplexing) 五 异步IO(Asynchro ...

  5. python开发IO模型:阻塞&非阻塞&异步IO&多路复用&selectors

    一 IO模型介绍 为了更好地了解IO模型,我们需要事先回顾下:同步.异步.阻塞.非阻塞 同步(synchronous) IO和异步(asynchronous) IO,阻塞(blocking) IO和非 ...

  6. (IO模型介绍,阻塞IO,非阻塞IO,多路复用IO,异步IO,IO模型比较分析,selectors模块,垃圾回收机制)

    参考博客: https://www.cnblogs.com/xiao987334176/p/9056511.html 内容回顾 协程实际上是一个线程,执行了多个任务,遇到IO就切换 切换,可以使用yi ...

  7. 【IO多路复用】

    " 目录 一.IO模型介绍 二.阻塞IO(blocking IO) 三.非阻塞IO(non-blocking IO) 四.多路复用IO(IO multiplexing) 五.异步IO(Asy ...

  8. Python(七)Socket编程、IO多路复用、SocketServer

    本章内容: Socket IO多路复用(select) SocketServer 模块(ThreadingTCPServer源码剖析) Socket socket通常也称作"套接字" ...

  9. IO多路复用概念性

    sellect.poll.epoll三者的区别 先来了解一下什么是进程切换 为了控制进程的执行,内核必须有能力挂起正在CPU上运行的进程,并恢复以前挂起的某个进程的执行,这种行为为进程的切换,任务切换 ...

随机推荐

  1. 玩玩 Nginx 2-----给Nginx添加第三方模块(动态更新upstream)

          接上一篇,我们在初始化安装的时候添加了nginx_lua模块,然后了解到nginx不可以动态加载模块,所以当你安装第三方模块的时候需要覆盖nginx文件.接下来一起看看如何安装nginx第 ...

  2. 前端总结·基础篇·JS(四)异步请求及跨域方案

    前端总结系列 前端总结·基础篇·CSS(一)布局 前端总结·基础篇·CSS(二)视觉 前端总结·基础篇·CSS(三)补充 前端总结·基础篇·JS(一)原型.原型链.构造函数和字符串(String) 前 ...

  3. .NET中数据访问方式(一):LINQ

    语言集成查询(Language-Integrated Query),简称LINQ,.NET中的LINQ体系如下图所示:   在编程语言层次,LINQ对于不同的数据源提供了相同的查询语法,方便了程序员操 ...

  4. 使用Jersey实现图片服务器与应用服务器分离

         现在模拟一下Jersey从客户端发送图片到服务器.   1.Tomcat准备 (1)解压一个新的Tomcat作为图片服务器,然后修改端口号(有3处).                (2)然 ...

  5. WPF 杂谈——开篇简言。

    这俩年多来笔者一直在从事关于WPF的开发.虽然不能说是专家级别的.但是对于WPF的应用还是有一定的了解.论他的灵活性决对不在WinForm之下.WPF的出现更是引发一段热议.他的何去何从更是让很多人感 ...

  6. mac的终端为什么会显示git:(master),如何取消掉?

    今天在终端误操作,在主目录下执行git init命令,结果杯具了, 总是出现这个提示. 各种搜索解决方案,终于退出了. 方法如下: 删掉.git目录: rm -rf ~/.git

  7. 解决Json传输中文乱码问题

    1.如果是通过URL传递:----需要编码两次 var searchText = this.searchText(); searchText = encodeURI(searchText); sear ...

  8. iOS 关于定位你该注意的那些事

      其实现在对于一个APP来说,定位用户的位置是件很容易的事情,有三种解决方案供您选择: (1)原生 (2)高德地图 (3)百度地图 1.解决方案的选择   其实单说iOS开发来说应用哪种方案都无所谓 ...

  9. .NET插件技术-应用程序热升级

    今天说一说.NET 中的插件技术,即 应用程序热升级.在很多情况下.我们希望用户对应用程序的升级是无感知的,并且尽可能不打断用户操作的. 虽然在Web 或者 WebAPI上,由于多点的存在可以逐个停用 ...

  10. 【 js 模块加载 】深入学习模块化加载(node.js 模块源码)

    一.模块规范 说到模块化加载,就不得先说一说模块规范.模块规范是用来约束每个模块,让其必须按照一定的格式编写.AMD,CMD,CommonJS 是目前最常用的三种模块化书写规范.  1.AMD(Asy ...