UDT中epoll对CLOSE状态的处理

epoll_wait()返回可用uid时，对uid取状态，本该是BROKEN的，却取到CLOSED，然而，不能像处理BROKEN事件那样处理CLOSED事件，这样移除不了CLOSED事件，于是epoll_wait不断返回该uid，就造成了死循环。跟踪代码至底层，寻找原因。

int CUDTUnited::epoll_remove_usock(const int eid, const UDTSOCKET u)

{

int ret = m_EPoll.remove_usock(eid, u);

CUDTSocket* s = locate(u);

if (NULL != s)

{

s->m_pUDT->removeEPoll(eid);

}

//else

//{

// throw CUDTException(5, 4);

//}

return ret;

}

CUDTSocket* CUDTUnited::locate(const UDTSOCKET u)

{

CGuard cg(m_ControlLock);

map<UDTSOCKET, CUDTSocket*>::iterator i = m_Sockets.find(u);

if ((i == m_Sockets.end()) || (i->second->m_Status == CLOSED))

return NULL;

return i->second;

}

void CUDT::removeEPoll(const int eid)

{

// clear IO events notifications;

// since this happens after the epoll ID has been removed, they cannot be set again

set<int> remove;

remove.insert(eid);

s_UDTUnited.m_EPoll.update_events(m_SocketID, remove, UDT_EPOLL_IN | UDT_EPOLL_OUT, false);

CGuard::enterCS(s_UDTUnited.m_EPoll.m_EPollLock);

m_sPollID.erase(eid);

CGuard::leaveCS(s_UDTUnited.m_EPoll.m_EPollLock);

}

CUDTUnited::epoll_remove_usock里，先locate目前uid的位置，但如果此时uid的状态是CLOSED，则返回NULL，于是，epoll_remove_usock无法再继续调用removeEPoll，所以无法移除epoll事件。

但为什么会发生CLOSED事件呢？按照作者的原意，应该是只会发生BROKEN事件，不会发生CLOSED事件的，继续查找原因。

首先看看BROKEN事件怎么发生的。

客户端疑似断开十秒以上之后， CUDT::checkTimers()做以下操作

……

m_bClosing = true;

m_bBroken = true;

m_iBrokenCounter = 30;

// update snd U list to remove this socket

m_pSndQueue->m_pSndUList->update(this);

releaseSynch();

// app can call any UDT API to learn the connection_broken error

s_UDTUnited.m_EPoll.update_events(m_SocketID, m_sPollID, UDT_EPOLL_IN | UDT_EPOLL_OUT | UDT_EPOLL_ERR, true);

CTimer::triggerEvent();

……

在这里把m_bBroken置为true，并触发epoll事件。

然而，在epoll_wait返回事件之前，还可能发生这个：

#ifndef WIN32

void* CUDTUnited::garbageCollect(void* p)

#else

DWORD WINAPI CUDTUnited::garbageCollect(LPVOID p)

#endif

{

CUDTUnited* self = (CUDTUnited*)p;

CGuard gcguard(self->m_GCStopLock);

while (!self->m_bClosing)

{

self->checkBrokenSockets();

……

void CUDTUnited::checkBrokenSockets()

{

CGuard cg(m_ControlLock);

// set of sockets To Be Closed and To Be Removed

vector<UDTSOCKET> tbc;

vector<UDTSOCKET> tbr;

for (map<UDTSOCKET, CUDTSocket*>::iterator i = m_Sockets.begin(); i != m_Sockets.end(); ++ i)

{

// check broken connection

if (i->second->m_pUDT->m_bBroken)

{

if (i->second->m_Status == LISTENING)

{

// for a listening socket, it should wait an extra 3 seconds in case a client is connecting

if (CTimer::getTime() - i->second->m_TimeStamp < 3000000)

continue;

}

else if ((i->second->m_pUDT->m_pRcvBuffer != NULL) && (i->second->m_pUDT->m_pRcvBuffer->getRcvDataSize() > 0) && (i->second->m_pUDT->m_iBrokenCounter -- > 0))

{

// if there is still data in the receiver buffer, wait longer

continue;

}

//close broken connections and start removal timer

i->second->m_Status = CLOSED;

i->second->m_TimeStamp = CTimer::getTime();

tbc.push_back(i->first);

m_ClosedSockets[i->first] = i->second;

……

GC线程是UDT的垃圾回收处理，在UDT调用cleanup()，之前，会一直处于checkBrokenSocket和阻塞的循环中。

然后在checkBrokenSocket里，当socket的m_bBroken为true时，m_Status的状态被置为CLOSED。

所以，这时候再用getsocketstate取socket的状态，就会取到CLOSED，也就是明明是BROKEN事件，硬生生变成了CLOSED事件！然后接下去epoll事件的移除就失败了。

于是，修改如下，

把

int CEPoll::remove_usock(const int eid, const UDTSOCKET& u)

{

CGuard pg(m_EPollLock);

map<int, CEPollDesc>::iterator p = m_mPolls.find(eid);

if (p == m_mPolls.end())

throw CUDTException(5, 13);

p->second.m_sUDTSocksIn.erase(u);

p->second.m_sUDTSocksOut.erase(u);

p->second.m_sUDTSocksEx.erase(u);

return 0;

}

改为

int CEPoll::remove_usock2(const int eid, const UDTSOCKET& u)

{

CGuard pg(m_EPollLock);

map<int, CEPollDesc>::iterator p = m_mPolls.find(eid);

if (p == m_mPolls.end())

throw CUDTException(5, 13);

p->second.m_sUDTSocksIn.erase(u);

p->second.m_sUDTSocksOut.erase(u);

p->second.m_sUDTSocksEx.erase(u);

p->second.m_sUDTWrites.erase(u);

p->second.m_sUDTReads.erase(u);

p->second.m_sUDTExcepts.erase(u);

return 0;

}

并去掉CUDTUnited::epoll_remove_usock()中对removeEPoll()的调用。

这是比较简单也比较粗糙的改法，应该有更方便的思路才对。

UDT中epoll对CLOSE状态的处理的更多相关文章

UDT中的epoll
epoll 是为处理大量句柄而改进的poll,在UDT中也有支持.UDT使用了内核提供的epoll,主要是epoll_create,epoll_wait,epoll_ctl,UDT定义了CEPollD ...
快来体验快速通道,netty中epoll传输协议详解
目录简介 epoll的详细使用 EpollEventLoopGroup EpollEventLoop EpollServerSocketChannel EpollSocketChannel 总结简 ...
android 自定义adapter和线程结合 + ListView中按钮滑动后状态丢失解决办法
adapter+线程 1.很多时候自定义adapter的数据都是来源于服务器的,所以在获取服务器的时候就需要异步获取,这里就需要开线程了(线程池)去获取服务器的数据了.但这样有的时候adapter的中 ...
ubuntu中vi在编辑状态下方向键不能用的解决
ubuntu中vi在编辑状态下方向键不能用,还有回格键不能删除等,我们平时习惯的一些键都不能使用. 解决办法: 可以安装vim full版本,在full版本下键盘正常,安装好后同样使用vi命令. 安装 ...
如何设置Installshield中 feature的选中状态
原文:如何设置Installshield中 feature的选中状态上一篇: 使用strtuts2的iterator标签循环输出二维数组之前一直有筒子问如何设置Installshield中 feat ...
Hibernate中的对象有三种状态
Hibernate中的对象有三种状态: 瞬时状态 (Transient),持久状态 (Persistent), 1．脱管状态 (Detached) 1． 1．瞬时状态 (Transient) 由 ...
Apache beam中的便携式有状态大数据处理
Apache beam中的便携式有状态大数据处理目标: 什么是 apache beam? 状态计时器例子&小demo 一.什么是 apache beam? 上面两个图片一个是正面切图,一 ...
Pvmove中断后恢复LV状态
Pvmove中断后恢复LV状态 pvmove执行时关闭中断窗口后,pvmove进程会被强制杀掉,从而导致lv的状态异常,无法重新进行pvmove和其他lvm镜像增加相关操作,可以通过如下方式修复: ...
Unity 2D游戏开发教程之游戏中精灵的跳跃状态
Unity 2D游戏开发教程之游戏中精灵的跳跃状态精灵的跳跃状态为了让游戏中的精灵有更大的活动范围,上一节为游戏场景添加了多个地面,于是精灵可以从高的地面移动到低的地面处,如图2-14所示.但是却 ...

随机推荐

百度eCharts体验
前言从昨天开始给项目里添加一些图表对比功能,上一个项目里使用的是Highcharts,本打算继续用Highcharts做的,昨天试了下做出来的效果不太好,主要也是因为看的多了没什么新鲜感了,于是便尝 ...
在Visual Studio 2012中使用VMSDK开发领域特定语言（二）
本文为<在Visual Studio 2012中使用VMSDK开发领域特定语言>专题文章的第二部分,在这部分内容中,将以实际应用为例,介绍开发DSL的主要步骤,包括设计.定制.调试.发布以 ...
在Visual Studio 2012中使用VMSDK开发领域特定语言（一）
前言本专题主要介绍在Visual Studio 2012中使用Visualization & Modeling SDK进行领域特定语言(DSL)的开发,包括两个部分的内容.在第一部分中,将对 ...
MySQL PXC构建一个新节点只需IST传输的方法
需求场景:原有的pxc环境数据量已经比较大,新买的服务器要加入此集群中,如何让其用IST的方式传输,而不是SST. PXC传输数据有两种方式: IST: Incremental State Trans ...
MVC学习系列14--Bundling And Minification【捆绑和压缩】--翻译国外大牛的文章
这个系列是,基础学习系列的最后一部分,这里,我打算翻译一篇国外的技术文章结束这个基础部分的学习:后面打算继续写深入学习MVC系列的文章,之所以要写博客,我个人觉得,做技术的,首先得要懂得分享,说不定你 ...
【原创】HDFS介绍
一. HDFS简介 1. HDFS全称 Hadoop Distributed FileSystem,Hadoop分布式文件系统. Hadoop有一个抽象文件系统的概念,Ha ...
使用VS Code开发调试.NET Core 多项目
使用Visual Studio Code(VS Code)开发调试.NET Core和ASP.NET Core 多项目multiple project. 之前讲解过如果使用Visual Studio ...
C#中字符串转换为计算公式,并计算结果
根据总结,大概分为以下三种: 第一种: 用DataTable中的Compute方法. 例如:" 1*2*3 " 代码如下: var a = new System.Data.Dat ...
HTTP协议详解
Author :Jeffrey 引言 HTTP 是一个属于应用层的面向对象的协议,由于其简捷.快速的方式,适用于分布式超媒体信息系统.它于1990年提出,经过几年的使用与发展,得到不断地完善和扩展. ...
Java Web 学习路线
实际上,如果时间安排合理的话,大概需要六个月左右,有些基础好,自学能力强的朋友,甚至在四个月左右就开始找工作了.大三的时候,我萌生了放弃本专业的念头,断断续续学 Java Web 累计一年半左右,总算 ...

UDT中epoll对CLOSE状态的处理

UDT中epoll对CLOSE状态的处理的更多相关文章

随机推荐

热门专题