java nio的一个严重BUG

Posted on 2009-09-28 19:27 dennis 阅读(4588) 评论(5)  编辑  收藏 所属分类: java 、源码解读 

    这个BUG会在linux上导致cpu 100%,使得nio server/client不可用,具体的详情可以看这里http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=6403933 。令人失望的是这个BUG直到jdk
6u4才解决,sun的拖沓让人难以相信。这个BUG在server端容易出现,因为server端有频繁地接入断开连接。

    

    使用jdk 6u4之前版本的nio框架都有这个隐患,除非你的框架很好地处理了这个可能的隐患。Grizzly的处理方式比较简单,也就是BUG报告里面提到的方式,在SelectionKey.cancel()之后马上进行了一次select调用将fd从poll(epoll)中移除:

this.selectionKey.cancel();

try {

            // cancel key,then select now to remove file descriptor

            this.selector.selectNow();

 } catch (IOException e) {

         onException(e);

        log.error("Selector selectNow fail", e);

}

实际上这样的解决方式还是留有隐患的,因为key的取消和这个selectNow操作很可能跟Selector.select操作并发地在进行,在两个操作之间仍然留有一个极小的时间窗口可能发生这个BUG。因此,你需要更安全地方式处理这个问题,jetty的处理方式是这样,连续的select(timeout)操作没有阻塞并返回0,并且次数超过了一个指定阀值,那么就遍历整个key set,将key仍然有效并且interestOps等于0的所有key主动取消掉;如果在这次修正后,仍然继续出现select(timeout)不阻塞并且返回0的情况,那么就重新创建一个新的Selector,并将Old
Selector的有效channel和对应的key转移到新的Selector上,

                    long before=now;

                    int selected=selector.select(wait);

                    now = System.currentTimeMillis();

                    _idleTimeout.setNow(now);

                    _timeout.setNow(now);



                    // Look for JVM bugs

                    // http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=6403933

                    if (__JVMBUG_THRESHHOLD>0 && selected==0 && wait>__JVMBUG_THRESHHOLD && (now-before)<(wait/2) )

                    {

                        _jvmBug++;

                        if (_jvmBug>=(__JVMBUG_THRESHHOLD2))

                        {

                            synchronized (this)

                            {

                                _lastJVMBug=now;

                                                    // BLOODY SUN BUG !!!  Try refreshing the entire selector.

                                final Selector new_selector = Selector.open();

                                for (SelectionKey k: selector.keys())

                                {

                                    if (!k.isValid() || k.interestOps()==0)

                                        continue;

                                    

                                    final SelectableChannel channel = k.channel();

                                    final Object attachment = k.attachment();

                                    

                                    if (attachment==null)

                                        addChange(channel);

                                    else

                                        addChange(channel,attachment);

                                }

                                _selector.close();

                                _selector=new_selector;

                                _jvmBug=0;

                                return;

                            }

                        }

                        else if (_jvmBug==__JVMBUG_THRESHHOLD || _jvmBug==__JVMBUG_THRESHHOLD1)

                        {

                            // Cancel keys with 0 interested ops

                            for (SelectionKey k: selector.keys())

                            {

                                if (k.isValid()&&k.interestOps()==0)

                                {

                                    k.cancel();

                                }

                            }

                            return;

                        }

                    }

                    else

                        _jvmBug=0;

这个方案能比较好的在jdk 6u4之前的版本上解决这个BUG可能导致的问题。Mina和Netty没有看到有处理这个BUG的代码,如果我看错了,请留言告诉我。Yanf4j一直采用的是grizzly的方式,准备加上jetty的处理方案。当然,最简单的方案就是升级你的JDK :D


评论

# re:
java nio的一个严重BUG  回复  更多评论

2009-09-28 19:59 by lizongbo

nio还有几个严重的bug,在实际运行中碰到了,sun在u18才修复,而现在u18还没正式发布。 



https://jdk6.dev.java.net/6uNea.html 

http://download.java.net/jdk6/6u18/promoted/b01/changes/JDK6u18.b01.list.html 



例如:http://bugs.sun.com/view_bug.do?bug_id=6693490 


# re:
java nio的一个严重BUG  回复  更多评论

2009-09-28 20:19 by dennis

@lizongbo



看到了,6u3这个版本似乎问题多多。

http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=6670302 这个BUG跟我这里描述的相似,解决的方法也是一样。

# re:
java nio的一个严重BUG  回复  更多评论

2009-09-28 20:49 by dennis

http://bugs.sun.com/view_bug.do?bug_id=6693490 这个BUG,一个间接影响也是关闭的channel一直有ready事件,select不阻塞并立即返回0,也就是导致CPU
100%,同样也是可以通过这里描述的方案解决的。

# re:
java nio的一个严重BUG  回复  更多评论

2009-09-29 21:32 by 喜乐递

最简单的方案就是升级你的JDK

# re:
java nio的一个严重BUG  回复  更多评论

2012-05-09 16:54 by hengyunabc

原来是nio的bug。。

以前也遇到过,在windows下测试了好久的程序,到linux下就出问题了,cpu跑满。

结果我是用每次select都用最新的SelectionKey来替换以前的SelectionKey,貌似没再出现cpu跑满的情况。

java nio的一个严重BUG的更多相关文章

  1. java nio的一个严重BUG(转)

    这个BUG会在linux上导致cpu 100%,使得nio server/client不可用,具体的详情可以看这里http://bugs.sun.com/bugdatabase/view_bug.do ...

  2. java nio 写一个完整的http服务器 支持文件上传 chunk传输 gzip 压缩 使用过程 和servlet差不多

    java nio 写一个完整的http服务器  支持文件上传   chunk传输    gzip 压缩      也仿照着 netty处理了NIO的空轮询BUG        本项目并不复杂 代码不多 ...

  3. Java多线程:Linux多路复用,Java NIO与Netty简述

    JVM的多路复用器实现原理 Linux 2.5以前:select/poll Linux 2.6以后: epoll Windows: IOCP Free BSD, OS X: kqueue 下面仅讲解L ...

  4. Java - NIO

    java.nio:NIO-2: NIO 面向流的IO体系一次只能处理一个或多个字节/字符,直至读取所有字节/符,且流中的数据不能前后移动.效率低,当数据源中没有数据时会阻塞线程.Java-4提供的新A ...

  5. java nio 与io区别

    转自:http://blog.csdn.net/keda8997110/article/details/19549493 当学习了Java NIO和IO的API后,一个问题马上涌入脑海: 我应该何时使 ...

  6. [翻译]java nio 概述

    原文地址:http://tutorials.jenkov.com/java-nio/overview.html java NIO 包含一下核心内容: Channels Buffers Selector ...

  7. Java NIO之Selector

    选择器是JavaNIO重磅推出的一个概念:在旧有的系统中为了跟踪多端口消息,需要为每一个端口配备一个线程做监听:但是有了selector就不需要了,一个Selector可以管理一众渠道(channel ...

  8. Java NIO中核心组成和IO区别

    1.Java NIO核心组件 Java NIO中有很多类和组件,包括Channel,Buffer 和 Selector 构成了核心的API.其它组件如Pipe和FileLock是与三个核心组件共同使用 ...

  9. Java NIO与IO

    当学习了Java NIO和IO的API后,一个问题立即涌入脑海: 我应该何时使用IO,何时使用NIO呢?在本文中,我会尽量清晰地解析Java NIO和IO的差异.它们的使用场景,以及它们怎样影响您的代 ...

随机推荐

  1. iOS推送的开启与关闭

    开启: 
[[UIApplication sharedApplication] registerForRemoteNotificationTypes: UIRemoteNotificationType ...

  2. 使用 ftrace 调试 Linux 内核,第 2 部分

    ftrace 操作概述 使用 ftrace 提供的跟踪器来调试或者分析内核时需要如下操作: 切换到目录 /sys/kernel/debug/tracing/ 下 查看 available_tracer ...

  3. Js 流程控制

    流程控制 顺序.分支.循环 顺序结构 代码一行一行从上往下执行并解析 分支结构 if语句 switch语句 if语句 单分支 if(条件表达式){ //语句块 } 含义:当条件表达式为真的时候就执行里 ...

  4. Struts2的验证框架简单吗?

    Struts2验证框架是基于Struts拦截器开发的,具有良好的扩展性:一般的验证都可以支持.现在我们以一个注册验证的例子进行总结: 新建一个model,User: public class User ...

  5. 打印报表以显示具有给定责任的用户-FNDSCRUR责任用户

    select --&p_hint         distinct         user_name,         decode (            greatest (u.sta ...

  6. Solidedge如何修改特征的参数

    我已经长出了60MM,现在发现不对,要改成50MM.右击这个特征,点击编辑定义   直接左键单击尺寸,修改数据,按回车,鼠标右键,即可.    

  7. linux find 命令查找 复制

    find 查找 find . -mtime -2 -a -path './.git*' -prune , -path './Cache' -prune -a -exec cp {} one \; rm ...

  8. windows服务 MVC之@Html.Raw()用法 文件流的读写 简单工厂和工厂模式对比

    windows服务   public partial class Service1 : ServiceBase{ System.Threading.Timer recordTimer;public S ...

  9. Expression Tree 学习笔记(一)

    大家可能都知道Expression Tree是.NET 3.5引入的新增功能.不少朋友们已经听说过这一特性,但还没来得及了解.看看博客园里的老赵等诸多牛人,将Expression Tree玩得眼花缭乱 ...

  10. 当电视沦为“情怀”,5G能不能拯救它?(zz)

    文|佘凯文 来源|智能相对论(aixdlun) 现阶段,智能家居行业极度期待5G的到来,甚至超过手机.行业对于颠覆性的升级的欲望极其强烈,纵观整个智能家居行业,除了像智能音箱外的偶尔单品能够“引爆”市 ...