本文分享自华为云社区《驾驭网络技术的未来：探索Reactor网络模型在当今应用领域的革新》，作者： Lion Long 。

本文介绍了Linux网络设计中的Reactor网络模型及其在实际应用中的重要性。Reactor模型是一种经典的事件驱动设计模式，广泛应用于构建高性能、可扩展的网络服务器。我们将探讨Reactor模型的基本原理和组成部分，并详细介绍了Reactors模型在Linux网络编程中的实现方式。

一、reactor网络模型编程介绍

reactor是将对IO的检测转换为对事件的处理，是一种异步事件机制。reactor会使用IO多路复用进行IO检测，IO多路复用器一般是：select、poll、epoll。

reactor大致逻辑：

（1）socket()创建一个套接字，listenfd；

（2）bind()、listen()配置listenfd，绑定和监听；

（3）listenfd注册读事件，交由epoll管理；

（4）读事件触发，回调accept；

（5）客户端连接clientfd组成读事件；

（6）相关事件调用相关回调函数

1.1、建立连接

接收客户端连接。

//...

int epfd=epoll_create(1);//创建epoll对象

//...

int listenfd=socket(AF_INET,SOCK_STREAM,0);//创建套接字

//...

struct epoll_event ev;

ev.events=EPOLLIN;

epoll_ctl(epfd,EPOLL_CTL_ADD,listenfd，&ev)//注册事件

//...

// 当触发listenfd的读事件，调用accept接收连接

struct sockaddr_in clientaddr;

socklen_t len=sizeof(clientaddr);

int clientfd=accept(listenfd,(struct sockaddr *)&clientaddr,&len);

struct epoll_event ev;

ev.events=EPOLLIN;

epoll_ctl(epfd,EPOLL_CTL_ADD,clientfd，&ev)//注册新连接的读事件

//...

连接第三方服务。

//...

int epfd=epoll_create(1);//创建epoll对象

//...

int fd=socket(AF_INET,SOCK_STREAM,0);//创建套接字

//...

struct sockaddr_in clientaddr;

socklen_t len=sizeof(clientaddr);

connect(fd,(struct sockaddr *)&clientaddr,&len);//连接服务

//...

struct epoll_event ev;

ev.events=EPOLLOUT;

epoll_ctl(epfd,EPOLL_CTL_ADD,fd，&ev)//注册事件

//...

// 当触发fd的写事件，连接建立成功

if(status==e_connecting && ev.events==EPOLLOUT)

{

status=e_connected;

epoll_ctl(epfd,EPOLL_CTL_DEL.fd,NULL);

}

//...

1.2、断开连接

//...

if(ev.events & EPOLLRDHUP)

{

// 关闭服务器读端

close_read(fd);

}

if(ev.events & EPOLLHUP)

{

// 关闭服务器读写端

close(fd);

}

//...

1.3、数据到达

// ...

if(ev.events & EPOLLIN)

{

while(1)

{

int n=recv(clientfd,buffer,buffer_size,0);

if(n<0)

{

if(errno==EINTR)

continue;

if(errno==EWOULDBLOCK)

break;

close(clientfd);

}

else if(n==0)

{

close_read();

}

else

{

// 处理业务

}

}

// ...

}

// ...

1.4、数据发送

// ...

if(ev.events & EPOLLOUT)

{

int n=send(clientfd,buffer,buffer_size,0);

if(n<0)

{

if(errno==EINTR)

continue;

if(errno==EWOULDBLOACK)

{

struct epoll_event e;

e.events=EPOLLOUT;

epoll_ctl(epfd,EPOLL_CTL_ADD,clientfd，&e)//注册事件

return;

// break;

}

close(clientfd);

}

else if(n==buffer_size)

{

epoll_ctl(epfd,EPOLL_CTL_DEL,clientfd,NULL);

// epoll_ctl(epfd,EPOLL_CTL_MOD,clientfd,&e);

}

// ...

}

//...

1.5、reactor常见疑问

1、epoll惊群

何为”惊群“？网络编程经常使用多线程、多进程模型，每个线程或进程中都有一个epoll对象，通过socket()、bind()、listen()生成的listenfd可能会给多个epoll对象管理，当一个accept到来时所有的epoll都收到通知，所有进程或线程同时响应这一事件，然而最终只有一个accept成功。这就是”惊群“。

2、水平触发和边沿触发

水平触发：当读缓冲区中有数据时，一直触发，直到数据被读完。

边沿触发：来一次事件触发一次。读写操作一般需要配合循环才能全部读写完成。

3、reactor为什么要搭配非阻塞IO？

主要是三方面原因：

（1）多线程环境下，一个listenfd会被多个epoll（IO多路复用器）对象管理，当一个连接到来时所有的epoll都收到通知，所有的epoll都会去响应，但最终只有一个accept成功；如果使用阻塞，那么其他的epoll将一直被阻塞着。所以最好使用非阻塞IO及时返回。

（2）边沿触发下，事件触发才会读事件，那么需要在一次事件循环中把缓冲区读空；如果使用阻塞模式，那么当读缓冲区的数据被读完后，就会一直阻塞住无法返回。

（3）select bug。当某个socket接收缓冲区有新数据分节到达，然后select报告这个socket描述符可读，但随后，协议栈检查到这个新分节检验和错误，然后丢弃了这个分节，这时调用recv/read则无数据可读；如果socket没有设置成nonblocking，此recv/read将阻塞当前线程。

4、IO多路复用一定要搭配非阻塞IO吗？

不是，也可以使用阻塞模式。比如MySQL使用select接收连接，然后一个连接使用一个线程进行处理；也可以使用一个系统调用先获取读缓冲区的字节数，然后读一次就把数据读完，但是这样就导致效率比较低。

int n=EVBUFFER_MAX_READ_DEFAULT;

ioctl(fd,FIONREAD,&n);//获取读缓冲区的数据字节数

二、reactor应用场景

使用单个reactor的场景和使用多个reactor的场景。使用多个reactor又有多线程和多进程的不同用法。

2.1、redis——使用单reactor

redis是一种key-value结构、有丰富的数据结构、对内存进行操作的网络数据库组件。redis的命令处理是单线程的。

2.1.1、redis为什么使用单reactor？

要理解redis为什么只使用单个reactor，需要明白redis的命令处理是单线程的。

redis提供丰富的数据结构，对这些数据结构进行加锁非常复杂，所以redis使用单线程进行处理；因为使用单线程进行命令处理，核心业务逻辑是单线程，那么使用再多的reactor是无法处理过来的；所以，redis使用单个reactor。

另外，redis操作具体命令的时间复杂度比较低，更加没有必要使用多个reactor。

2.1.2、redis处理reactor框图

2.1.3、redis对reactor的优化

对业务逻辑进行了优化，引入IO线程：

接收完数据后，将数据抛到IO线程进行处理；发送数据之前，将打包数据放在IO线程进行处理，再发送出去。参考上图，就是将(read+decode)放到线程中处理，将(encode+write)放在线程中处理。

原因：

对于单线程而言，当接收的数据或发送的数据过大时，会造成线程负载过大，需要引用多线程做IO数据处理。特别是解协议过程，数据庞大而且耗时，需要开一个IO线程进行处理。

场景例子：

客户端上传日志记录；客户端获取排行榜记录。

2.1.4、从reactor角度看redis源码

创建一个epoll对象：

创建套接字，绑定监听：

listenfd放到epoll管理：

监听事件：

处理事件：

为clientfd注册读事件：

2.2、memcached——多线程方式使用多个reator

memcached是一种key-value结构、对内存进行操作的网络数据库组件。memcached的命令处理是多线程的。

memcached需要libevent，libevent就是一个事件驱动库，memcached对于网络上的使用都是基于libevent的。

2.2.1、memcached为什么使用多reactor？

memcached的key-value结构不像redis支持丰富的数据结构，它的value使用的数据结构相对简单，加锁也就相对容易。因此，可以引入多线程，提高效率。

2.2.2、memcached如何处理reactor？

memcached主线程会有一个reactor，主要负责接收连接；接收完连接后，经过负载均衡，通过pipe(管道)告诉子线程的reactor，将客户端的fd交由该线程的reactor管理；每个线程处理相对应的业务逻辑。

2.2.3、从reactor角度看memcached源码

github上下载最新的memcached。

开始源码分析：

创建套接字，绑定监听：

注册listenfd读事件：

分配clientfd到具体的线程中，添加读事件：

2.3、nginx——多进程方式使用多个reator

nginx可以反向代理，利用多进程处理业务。

master会创建listenfd，并bind和listen；fork出多个进程，每个进程都有一个自己的epoll对象，listenfd交由多个epoll对象管理。这时会有惊群现象，需要处理；通过负载均衡处理事件。

2.3.1、解决"惊群"问题

加锁方式。nginx会开辟一个共享内存，把锁放在共享内存当中，多个进程去争夺这把锁，争夺到锁的才能进行接受连接。

2.3.2、负载均衡

定义一个进程最大的连接数，当连接数量超过总连接数量的7/8时，该进程就会暂停接受连接，将机会留个其他进程。

这样不会让一个进程拥有过多的连接，而其他进程连接数量过少；从而使每个进程的连接数量相对平衡。

当所有的进程接受连接的数量都达到总连接数量的7/8时，这是nginx接受连接将变得很缓慢。

总结

在本文中深入探讨了Linux Reactor网络模型，并着重介绍了其在实际应用中的重要性和优势。Reactors模型是一种高效的网络设计模式，它在处理并发连接时表现出色，使得我们能够构建高性能、可伸缩的网络应用程序。

首先，了解了Reactors模型的基本原理。它采用事件驱动的方式，通过一个主循环监听输入事件，一旦有事件发生，就会调用相应的处理程序。这种非阻塞的设计使得服务器能够高效地处理大量并发连接，而无需为每个连接创建一个线程。

接着，探讨了Reactors模型在Linux网络设计中的实际应用。还深入剖析了事件处理和回调机制，帮助读者理解如何优化网络应用的设计。

相比传统的多线程或多进程模型，Reactors模型能够更好地利用系统资源，减少上下文切换和线程创建的开销，从而提高应用的并发处理能力。

本文旨在帮助读者全面了解Linux Reactor网络模型，并鼓励他们在自己的网络应用中运用这一模型，以构建出更高性能、更可靠的网络应用。掌握Reactors模型的知识，将使读者能够更加自信地驾驭网络技术的未来，迎接不断变化的挑战。

点击关注，第一时间了解华为云新鲜技术~

探索Reactor网络模型在当今应用领域的革新的更多相关文章

从epoll构建muduo-11 单线程Reactor网络模型成型
mini-muduo版本传送门 version 0.00 从epoll构建muduo-1 mini-muduo介绍 version 0.01 从epoll构建muduo-2 最简单的epoll ver ...
从epoll构建muduo-13 Reactor + ThreadPool 成型
mini-muduo版本号传送门 version 0.00 从epoll构建muduo-1 mini-muduo介绍 version 0.01 从epoll构建muduo-2 最简单的epoll ve ...
Go netpoll I/O 多路复用构建原生网络模型之源码深度解析
导言 Go 基于 I/O multiplexing 和 goroutine 构建了一个简洁而高性能的原生网络模型(基于 Go 的I/O 多路复用 netpoll),提供了 goroutine-per- ...
Reactor And Gev 详解通俗易懂
reactor 详解在类似网关这种海量连接, 很高的并发的场景, 比如有 10W+ 连接, go 开始变得吃力. 因为频繁的 goroutine 调度和 gc 导致程序性能很差. 这个时候我们可以考 ...
CDIE2019中国数字化创新展暨首席信息官峰会上海站来袭～
China Digital Innovation Expo & CIO Summit 2019是由Dot Connector(上海华昂商务咨询有限公司)主办的第五届聚焦中国技术领袖,探索创新, ...
从epoll构建muduo-12 多线程入场
mini-muduo版本号传送门 version 0.00 从epoll构建muduo-1 mini-muduo介绍 version 0.01 从epoll构建muduo-2 最简单的epoll ve ...
探索专有领域的端到端ASR解决之道
摘要:本文从<Shallow-Fusion End-to-End Contextual Biasing>入手,探索解决专有领域的端到端ASR. 本文分享自华为云社区<语境偏移如何解决 ...
马里奥AI实现方式探索 ——神经网络+增强学习
[TOC] 马里奥AI实现方式探索 --神经网络+增强学习儿时我们都曾有过一个经典游戏的体验,就是马里奥(顶蘑菇^v^),这次里约奥运会闭幕式,日本作为2020年东京奥运会的东道主,安倍最后也已经典 ...
探索 Linux 系统的启动过程
引言之所以想到写这些东西,那是因为我确实想让大家也和我一样,把 Linux 桌面系统打造成真真正正日常使用的工具,而不是安装之后试用几把再删掉.我是真的在日常生活和工作中都使用 Linux,比如在 ...
Reactor构架模式
http://www.cnblogs.com/hzbook/archive/2012/07/19/2599698.html Reactor框架是ACE各个框架中最基础的一个框架,其他框架都或多或少地用 ...

随机推荐

采用ResNet网络+TSNE降维算法对自建图像数据集进行二维可视化显示
起因:某一天下午,我在"玩"的时候,突然接到了老板的电话,说是要对图像做可视化降维.因此,我拿到了一批图像的数据. 数据的特点: 1.数据集的图像分为4类,并且每一种类的图像多少不 ...
惊奇！Android studio内部在调用Eclipse
现在用Android studio的人越来越多,主要是说谷歌不再支持Eclipse,而力推Android studio.但是as也太不给力了,我之前写过一篇博客提到. 今天要说的是一个惊天的消息,如题 ...
ansible平台
1.ansible概念: 1)ansible和saltstck是目前互联网IT运维人员使用最多的自动化运维管理工具,主要用于对批量(并行)Linux服务器:安装.部署.配置.指令操作.任务计划.参数调 ...
Vue源码学习(十三):实现watch(一):方法,对象
好家伙, 代码出了点bug,暂时只能实现这两种形式完整代码已开源https://github.com/Fattiger4399/analytic-vue.git Vue:watch的多种使用方法 ...
[Python急救站课程]蟒蛇的绘制
Python的英文是有蟒蛇的意思,用Python画一条蟒蛇试试吧一.普通蟒蛇的绘制 import turtle # 调用turtle(海龟绘图)加as t表示将库名改命名为t,后续用t.(函数名表式 ...
mysql insert的特殊用法
1. 正常的insert语句:插入一条数据如下:INSERT INTO `testdb`.`tb_user` (`id`, `userName`) VALUES (3, '张飞'); 2. inser ...
Windows Server 2022 安装IIS 报错访问临时文件夹 C:\WINDOWS\TEMP\3C 读取/写入权限错误: 0x80070005
在windows中使用命令行方式安装IIS(Web服务器) Windows Server 2022 安装IIS 报错访问临时文件夹 C:\WINDOWS\TEMP\3C 读取/写入权限错误: 0x ...
放弃"Jenkins"的种种理由，期待更好赋能研发的持续交付平台
Jenkins 很酷,但是不完美,有历史局限性造成的问题.本文仅从"如何更好给研发团队赋能的角度",剖析Jenkins, 探讨理想的持续交付平台, 不带货无广告- 不完美的Jenk ...
空间三维模型的编码结构光方法实现：基于EinScan-S软件
本文介绍基于EinScan-S软件,实现编码结构光方法的空间三维模型重建的具体操作. 目录 1 相关原理 1.1 编码结构光成像原理 1.2 编码结构光编码方式 1.3 编码结构光与侧影轮廓方法比 ...
神经网络入门篇：详解核对矩阵的维数（Getting your matrix dimensions right）
核对矩阵的维数当实现深度神经网络的时候,其中一个常用的检查代码是否有错的方法就是拿出一张纸过一遍算法中矩阵的维数. \(w\)的维度是(下一层的维数,前一层的维数),即\({{w}^{[l]}}\) ...

探索Reactor网络模型在当今应用领域的革新