java nio的一个严重BUG

Posted on 2009-09-28 19:27 dennis 阅读(4588) 评论(5)  编辑  收藏 所属分类: java 、源码解读 

    这个BUG会在linux上导致cpu 100%,使得nio server/client不可用,具体的详情可以看这里http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=6403933 。令人失望的是这个BUG直到jdk
6u4才解决,sun的拖沓让人难以相信。这个BUG在server端容易出现,因为server端有频繁地接入断开连接。

    

    使用jdk 6u4之前版本的nio框架都有这个隐患,除非你的框架很好地处理了这个可能的隐患。Grizzly的处理方式比较简单,也就是BUG报告里面提到的方式,在SelectionKey.cancel()之后马上进行了一次select调用将fd从poll(epoll)中移除:

this.selectionKey.cancel();

try {

            // cancel key,then select now to remove file descriptor

            this.selector.selectNow();

 } catch (IOException e) {

         onException(e);

        log.error("Selector selectNow fail", e);

}

实际上这样的解决方式还是留有隐患的,因为key的取消和这个selectNow操作很可能跟Selector.select操作并发地在进行,在两个操作之间仍然留有一个极小的时间窗口可能发生这个BUG。因此,你需要更安全地方式处理这个问题,jetty的处理方式是这样,连续的select(timeout)操作没有阻塞并返回0,并且次数超过了一个指定阀值,那么就遍历整个key set,将key仍然有效并且interestOps等于0的所有key主动取消掉;如果在这次修正后,仍然继续出现select(timeout)不阻塞并且返回0的情况,那么就重新创建一个新的Selector,并将Old
Selector的有效channel和对应的key转移到新的Selector上,

                    long before=now;

                    int selected=selector.select(wait);

                    now = System.currentTimeMillis();

                    _idleTimeout.setNow(now);

                    _timeout.setNow(now);



                    // Look for JVM bugs

                    // http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=6403933

                    if (__JVMBUG_THRESHHOLD>0 && selected==0 && wait>__JVMBUG_THRESHHOLD && (now-before)<(wait/2) )

                    {

                        _jvmBug++;

                        if (_jvmBug>=(__JVMBUG_THRESHHOLD2))

                        {

                            synchronized (this)

                            {

                                _lastJVMBug=now;

                                                    // BLOODY SUN BUG !!!  Try refreshing the entire selector.

                                final Selector new_selector = Selector.open();

                                for (SelectionKey k: selector.keys())

                                {

                                    if (!k.isValid() || k.interestOps()==0)

                                        continue;

                                    

                                    final SelectableChannel channel = k.channel();

                                    final Object attachment = k.attachment();

                                    

                                    if (attachment==null)

                                        addChange(channel);

                                    else

                                        addChange(channel,attachment);

                                }

                                _selector.close();

                                _selector=new_selector;

                                _jvmBug=0;

                                return;

                            }

                        }

                        else if (_jvmBug==__JVMBUG_THRESHHOLD || _jvmBug==__JVMBUG_THRESHHOLD1)

                        {

                            // Cancel keys with 0 interested ops

                            for (SelectionKey k: selector.keys())

                            {

                                if (k.isValid()&&k.interestOps()==0)

                                {

                                    k.cancel();

                                }

                            }

                            return;

                        }

                    }

                    else

                        _jvmBug=0;

这个方案能比较好的在jdk 6u4之前的版本上解决这个BUG可能导致的问题。Mina和Netty没有看到有处理这个BUG的代码,如果我看错了,请留言告诉我。Yanf4j一直采用的是grizzly的方式,准备加上jetty的处理方案。当然,最简单的方案就是升级你的JDK :D


评论

# re:
java nio的一个严重BUG  回复  更多评论

2009-09-28 19:59 by lizongbo

nio还有几个严重的bug,在实际运行中碰到了,sun在u18才修复,而现在u18还没正式发布。 



https://jdk6.dev.java.net/6uNea.html 

http://download.java.net/jdk6/6u18/promoted/b01/changes/JDK6u18.b01.list.html 



例如:http://bugs.sun.com/view_bug.do?bug_id=6693490 


# re:
java nio的一个严重BUG  回复  更多评论

2009-09-28 20:19 by dennis

@lizongbo



看到了,6u3这个版本似乎问题多多。

http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=6670302 这个BUG跟我这里描述的相似,解决的方法也是一样。

# re:
java nio的一个严重BUG  回复  更多评论

2009-09-28 20:49 by dennis

http://bugs.sun.com/view_bug.do?bug_id=6693490 这个BUG,一个间接影响也是关闭的channel一直有ready事件,select不阻塞并立即返回0,也就是导致CPU
100%,同样也是可以通过这里描述的方案解决的。

# re:
java nio的一个严重BUG  回复  更多评论

2009-09-29 21:32 by 喜乐递

最简单的方案就是升级你的JDK

# re:
java nio的一个严重BUG  回复  更多评论

2012-05-09 16:54 by hengyunabc

原来是nio的bug。。

以前也遇到过,在windows下测试了好久的程序,到linux下就出问题了,cpu跑满。

结果我是用每次select都用最新的SelectionKey来替换以前的SelectionKey,貌似没再出现cpu跑满的情况。

java nio的一个严重BUG的更多相关文章

  1. java nio的一个严重BUG(转)

    这个BUG会在linux上导致cpu 100%,使得nio server/client不可用,具体的详情可以看这里http://bugs.sun.com/bugdatabase/view_bug.do ...

  2. java nio 写一个完整的http服务器 支持文件上传 chunk传输 gzip 压缩 使用过程 和servlet差不多

    java nio 写一个完整的http服务器  支持文件上传   chunk传输    gzip 压缩      也仿照着 netty处理了NIO的空轮询BUG        本项目并不复杂 代码不多 ...

  3. Java多线程:Linux多路复用,Java NIO与Netty简述

    JVM的多路复用器实现原理 Linux 2.5以前:select/poll Linux 2.6以后: epoll Windows: IOCP Free BSD, OS X: kqueue 下面仅讲解L ...

  4. Java - NIO

    java.nio:NIO-2: NIO 面向流的IO体系一次只能处理一个或多个字节/字符,直至读取所有字节/符,且流中的数据不能前后移动.效率低,当数据源中没有数据时会阻塞线程.Java-4提供的新A ...

  5. java nio 与io区别

    转自:http://blog.csdn.net/keda8997110/article/details/19549493 当学习了Java NIO和IO的API后,一个问题马上涌入脑海: 我应该何时使 ...

  6. [翻译]java nio 概述

    原文地址:http://tutorials.jenkov.com/java-nio/overview.html java NIO 包含一下核心内容: Channels Buffers Selector ...

  7. Java NIO之Selector

    选择器是JavaNIO重磅推出的一个概念:在旧有的系统中为了跟踪多端口消息,需要为每一个端口配备一个线程做监听:但是有了selector就不需要了,一个Selector可以管理一众渠道(channel ...

  8. Java NIO中核心组成和IO区别

    1.Java NIO核心组件 Java NIO中有很多类和组件,包括Channel,Buffer 和 Selector 构成了核心的API.其它组件如Pipe和FileLock是与三个核心组件共同使用 ...

  9. Java NIO与IO

    当学习了Java NIO和IO的API后,一个问题立即涌入脑海: 我应该何时使用IO,何时使用NIO呢?在本文中,我会尽量清晰地解析Java NIO和IO的差异.它们的使用场景,以及它们怎样影响您的代 ...

随机推荐

  1. msp430项目编程45

    msp430综合项目---蓝牙控制系统45 1.电路工作原理 2.代码(显示部分) 3.代码(功能实现) 4.项目总结

  2. yii 之删除数据

    public function actionTest(){ //删除 //方法一 $result = Test::find()->where(['id' => 1])->all(); ...

  3. spring boot--常用配置

    spring boot 需要引用的依赖项: spring-boot-starter-parent // 所有Spring Boot组件的基础引用 spring-boot-starter-web // ...

  4. git多人协作--分支

    分支: 创建分支: git checkout -b 新分支 切换分支: git checkout 目标分支 删除分支: git branch -d 待删除分支 推送到远程分支: git checkou ...

  5. What should do in Production

    Using Compose in production https://docs.docker.com/compose/production/

  6. [转] java中volatile关键字的含义

    在java线程并发处理中,有一个关键字volatile的使用目前存在很大的混淆,以为使用这个关键字,在进行多线程并发处理的时候就可以万事大吉. Java语言是支持多线程的,为了解决线程并发的问题,在语 ...

  7. influxdb的python操作

    1.先安装依赖:pip install influxdb 2.

  8. Android PullToRefresh 下拉刷新,上拉很多其它,支持ScrollView,ListView,可方便拓展GridView,WebView等

    在写着东西之前.从网上找到非常多这方面的源代码,可是基本没有找到惬意的.包含在GitHub上的比較有名的Android-PullToRefresh-master.思来想去还是自己写吧.当然当中借鉴了一 ...

  9. js加入收藏夹

    工作需要了解了一下点击加入收藏这个功能 <script> function _addFavorite() { var url = window.location; //获取当前网页网址 v ...

  10. C++结构体中使用函数与类中使用函数小结

    #include <iostream>#include <string.h>using namespace std;struct stud//学生信息结构体{    char ...