单机百万连接调优和Netty应用级别调优

作者：Grey

原文地址：单机百万连接调优和Netty应用级别调优

说明

本文为深度解析Netty源码的学习笔记。

单机百万连接调优

准备两台Linux服务器，一个充当服务端，一个充当客户端。

服务端

操作系统：CentOS 7
配置：4核8G
IP:192.168.118.138

客户端

操作系统：CentOS 7
配置：4核8G
IP:192.168.118.139

服务端和客户端均要配置java环境，基于jdk1.8。

如何模拟百万连接

如果服务端只开一个端口，客户端连接的时候，端口号是有数量限制的（非root用户，从1024到65535，大约6w），所以服务端开启一个端口，客户端和服务端的连接最多6w个左右。

为了模拟单机百万连接，我们在服务端开启多个端口，例如8000~8100，一共100个端口，客户端还是6w的连接，但是可以连接服务端的不同端口，所以就可以模拟服务端百万连接的情况。

准备服务端程序

服务端程序的主要逻辑是：

绑定8000端口一直到8099端口，一共100个端口，每2s钟统计一下连接数。

channelActive触发的时候，连接+1, channelInactive触发的时候，连接-1。

代码见：Server.java

准备客户端程序

客户端程序的主要逻辑是：

循环连接服务端的端口（从8000一直到8099）。

代码见：Client.java

准备好客户端和服务端的代码后，打包成Client.jar和Server.jar并上传到客户端和服务端的/data/app目录下。打包配置参考pom.xml

服务端和客户端在/data/app下分别准备两个启动脚本，其中服务端准备的脚本为startServer.sh, 客户端准备的脚本为startClient.sh，内容如下：

startServer.sh

java -jar server.jar -Xms6.5g -Xmx6.5g -XX:NewSize=5.5g -XX:MaxNewSize=5.5g -XX:MaxDirectMemorySize=1g

startClient.sh

java -jar client.jar -Xms6.5g -Xmx6.5g -XX:NewSize=5.5g -XX:MaxNewSize=5.5g -XX:MaxDirectMemorySize=1g

脚本文件见：startServer.sh 和 startClient.sh

先启动服务端

cd /data/app/ 

./startServer.sh

查看日志，待服务端把100个端口都绑定好以后。

在启动客户端

cd /data/app/

./startClient.sh

然后查看服务端日志，服务端在支撑了3942个端口号以后，报了如下错误：

Caused by: java.io.IOException: Too many open files

 at sun.nio.ch.FileDispatcherImpl.init(Native Method)

 at sun.nio.ch.FileDispatcherImpl.<clinit>(FileDispatcherImpl.java:35)

突破局部文件句柄限制

使用ulimit -n命令可以查看一个jvm进程最多可以打开的文件个数，这个是局部文件句柄限制，默认是1024，我们可以修改这个值

vi /etc/security/limits.conf

增加如下两行

*               hard    nofile             1000000

*               soft    nofile             1000000

以上配置表示每个进程可以打开的最大文件数是一百万。

突破全局文件句柄限制

除了突破局部文件句柄数限制，还需要突破全局文件句柄数限制，修改如下配置文件

vi /proc/sys/fs/file-max

将这个数量修改为一百万

echo 1000000 > /proc/sys/fs/file-max

通过这种方式修改的配置在重启后失效，如果要使重启也生效，需要修改如下配置

vi /etc/sysctl.conf

在文件末尾加上

fs.file-max=1000000

服务端和客户端在调整完局部文件句柄限制和全局文件句柄限制后，再次启动服务端，待端口绑定完毕后，启动客户端。

查看服务端日志，可以看到，服务端单机连接数已经达到百万级别。

.....

connections: 434703

connections: 438238

connections: 441195

connections: 444082

connections: 447596

.....

connections: 920435

connections: 920437

connections: 920439

connections: 920442

connections: 920443

connections: 920445

.....

Netty应用级别调优

场景

服务端接受到客户端的数据，进行一些相对耗时的操作（比如数据库查询，数据处理），然后把结果返回给客户端。

模拟耗时操作

在服务端，模拟通过sleep方法来模拟耗时操作，规则如下：

在90.0%情况下，处理时间为1ms
在95.0%情况下，处理时间为10ms
在99.0%情况下，处理时间为100ms
在99.9%情况下，处理时间为1000ms

代码如下

protected Object getResult(ByteBuf data) {

    int level = ThreadLocalRandom.current().nextInt(1, 1000);

    int time;

    if (level <= 900) {

        time = 1;

    } else if (level <= 950) {

        time = 10;

    } else if (level <= 990) {

        time = 100;

    } else {

        time = 1000;

    }

    try {

        Thread.sleep(time);

    } catch (InterruptedException e) {

    }

    return data;

}

客户端统计QPS和AVG逻辑

获取当前时间戳，客户端在和服务端建立连接后，会每隔1s给服务端发送数据，发送的数据就是当前的时间戳，服务端获取到这个时间戳以后，会把这个时间戳再次返回给客户端，所以客户端会拿到发送时候的时间戳，然后客户端用当前时间减去收到的时间戳，就是这个数据包的处理时间，记录下这个时间，然后统计数据包发送的次数，根据这两个变量，可以求出QPS和AVG，其中：

QPS 等于 总的请求量除以持续到当前的时间

AVG 等于 总的响应时间除以请求总数

客户端源码参考：Client.java

服务端源码参考：Server.java

服务端在不做任何优化的情况下，关键代码如下

...

bootstrap.childHandler(new ChannelInitializer<SocketChannel>() {

            @Override

            protected void initChannel(SocketChannel ch) {

                ch.pipeline().addLast(new FixedLengthFrameDecoder(Long.BYTES));

                ch.pipeline().addLast(/*businessGroup,*/ ServerBusinessHandler.INSTANCE);

//                ch.pipeline().addLast(ServerBusinessThreadPoolHandler.INSTANCE);

            }

        });

...

@ChannelHandler.Sharable

public class ServerBusinessHandler extends SimpleChannelInboundHandler<ByteBuf> {

    public static final ChannelHandler INSTANCE = new ServerBusinessHandler();

    @Override

    protected void channelRead0(ChannelHandlerContext ctx, ByteBuf msg) {

        ByteBuf data = Unpooled.directBuffer();

        data.writeBytes(msg);

        Object result = getResult(data);

        ctx.channel().writeAndFlush(result);

    }

    protected Object getResult(ByteBuf data) {

        int level = ThreadLocalRandom.current().nextInt(1, 1000);

        int time;

        if (level <= 900) {

            time = 1;

        } else if (level <= 950) {

            time = 10;

        } else if (level <= 990) {

            time = 100;

        } else {

            time = 1000;

        }

        try {

            Thread.sleep(time);

        } catch (InterruptedException e) {

        }

        return data;

    }

    @Override

    public void exceptionCaught(ChannelHandlerContext ctx, Throwable cause) {

        // ignore

    }

}

运行服务端和客户端，查看客户端日志

.....

qps: 1466, avg response time: 35.68182

qps: 832, avg response time: 214.28384

qps: 932, avg response time: 352.59363

qps: 965, avg response time: 384.59448

qps: 957, avg response time: 403.33804

qps: 958, avg response time: 424.5246

qps: 966, avg response time: 433.35272

qps: 980, avg response time: 484.2116

qps: 986, avg response time: 478.5395

.....

优化方案一：使用自定义线程池处理耗时逻辑

将服务端代码做如下调整

bootstrap.childHandler(new ChannelInitializer<SocketChannel>() {

            @Override

            protected void initChannel(SocketChannel ch) {

                ch.pipeline().addLast(new FixedLengthFrameDecoder(Long.BYTES));

                //ch.pipeline().addLast(/*businessGroup,*/ ServerBusinessHandler.INSTANCE);

                ch.pipeline().addLast(ServerBusinessThreadPoolHandler.INSTANCE);

            }

        });

其中ServerBusinessThreadPoolHandler中，使用了自定义的线程池来处理耗时的getResult方法。关键代码如下：

private static ExecutorService threadPool = Executors.newFixedThreadPool(1000);

    @Override

    protected void channelRead0(ChannelHandlerContext ctx, ByteBuf msg) {

        ByteBuf data = Unpooled.directBuffer();

        data.writeBytes(msg);

        threadPool.submit(() -> {

            Object result = getResult(data);

            ctx.channel().writeAndFlush(result);

        });

    }

再次运行服务端和客户端，可以查看客户端日志，QPS和AVG指标都有明显的改善

....

qps: 1033, avg response time: 17.690498

qps: 1018, avg response time: 17.133448

qps: 1013, avg response time: 15.563113

qps: 1010, avg response time: 15.415672

qps: 1009, avg response time: 16.049961

qps: 1008, avg response time: 16.179882

qps: 1007, avg response time: 16.120466

qps: 1006, avg response time: 15.822202

qps: 1006, avg response time: 15.987518

....

实际生产过程中，Executors.newFixedThreadPool(1000);中配置的数量需要通过压测来验证。

优化方案二：使用Netty原生的线程池优化

我们可以通过Netty提供的线程池来处理耗时的Handler，这样的话，无需调整Handler的逻辑（对原有Handler无代码侵入），关键代码：

bootstrap.childHandler(new ChannelInitializer<SocketChannel>() {

            @Override

            protected void initChannel(SocketChannel ch) {

                ch.pipeline().addLast(new FixedLengthFrameDecoder(Long.BYTES));

                // ch.pipeline().addLast(ServerBusinessHandler.INSTANCE);

                // 使用业务线程池方式

                // ch.pipeline().addLast(ServerBusinessThreadPoolHandler.INSTANCE);

                // 使用Netty自带线程池方式

                ch.pipeline().addLast(businessGroup,ServerBusinessHandler.INSTANCE);

            }

        });

其中businessGroup是Netty自带的线程池

EventLoopGroup businessGroup = new NioEventLoopGroup(1000);

ServerBusinessHandler中的所有方法，都会在businessGroup中执行。

再次启动服务端和客户端，查看客户端日志

.....

qps: 1027, avg response time: 23.833092

qps: 1017, avg response time: 20.98855

qps: 1014, avg response time: 18.220013

qps: 1012, avg response time: 17.447332

qps: 1010, avg response time: 16.502508

qps: 1010, avg response time: 15.692251

qps: 1009, avg response time: 15.968423

qps: 1008, avg response time: 15.888149

.....

源码

Github

参考资料

深度解析Netty源码

单机百万连接调优和Netty应用级别调优的更多相关文章

高性能C++网络库libtnet实践：comet单机百万连接挂载测试
最近在用go语言做一个挂载大量长连接的推送服务器,虽然已经完成,但是内存占用情况让我不怎么满意,于是考虑使用libtnet来重新实现一个.后续我会使用comet来表明推送服务器. 对于comet来说, ...
单机c1000k连接
单机c1000k连接即单机实现百万连接,首先要注意的是连接是虚拟的逻辑的,连接最终落于网卡,清晰概念才能更深入更清晰的想出问题的解决办法. 参考 http://www.ideawu.net/blog ...
[Spark性能调优] 第一章：性能调优的本质、Spark资源使用原理和调优要点分析
本課主題大数据性能调优的本质 Spark 性能调优要点分析 Spark 资源使用原理流程 Spark 资源调优最佳实战 Spark 更高性能的算子引言我们谈大数据性能调优,到底在谈什么,它的本质 ...
spark 性能调优（一）性能调优的本质、spark资源使用原理、调优要点分析
转载:http://www.cnblogs.com/jcchoiling/p/6440709.html 一.大数据性能调优的本质编程的时候发现一个惊人的规律,软件是不存在的!所有编程高手级别的人无论 ...
架构师养成记--22.客户端与服务器端保持连接的解决方案，netty的ReadTimeoutHandler
概述保持客户端与服务器端连接的方案常用的有3种 1.长连接,也就是客户端与服务器端一直保持连接,适用于客户端比较少的情况. 2.定时段连接,比如在某一天的凌晨建立连接,适用于对实时性要求不高的情况. ...
开源libco库：单机千万连接、支撑微信8亿用户的后台框架基石
微信于2013年开源的ibco库,是微信后台大规模使用的c/c++协程库,2013年至今稳定运行在微信后台的数万台机器上.libco在2013年的时候作为腾讯六大开源项目首次开源,ibco支持后台敏捷 ...
netty百万连接跟踪记录
0. 启动客户端和服务端 # 测试环境: centos7 jdk8 2核16G# 服务端启动nohup java -Xmx8192m -Xms4096m -XX:+UseG1GC -XX:Parall ...
Netty SSL性能调优
TLS算法组合在TLS中,5类算法组合在一起,称为一个CipherSuite: 认证算法加密算法消息认证码算法简称MAC 密钥交换算法密钥衍生算法比较常见的算法组合是 TLS_ECDHE_ ...
Nginx 单机百万QPS环境搭建
一.背景最近公司在做一些物联网产品,物物通信用的是MQTT协议,内部权限与内部关系等业务逻辑准备用HTTP实现.leader要求在本地测试中要模拟出百万用户同时在线的需求.虽然该产品最后不一定有这么 ...

随机推荐

【mysql】mysql逻辑框架简介及show profile说明
1.mysql逻辑框架简介和其它数据库相比,MySQL 有点与众不同,它的架构可以在多种不同场景中应用并发挥良好作用.主要体现在存储引擎的架构上,插件式的存储引擎架构将查询处理和其它的系统任务以及数 ...
【转】Linux tar命令详解
参考:https://blog.csdn.net/kkw1992/article/details/80000653 linux下最常用的打包程序就是tar了,使用tar程序打出来的包我们常称为tar包 ...
jquery validate 如何校验多个相同name
在表单页中有如下代码 <form> <input name="zhai"/> <input ...
关于mysql的备份和恢复
备份:在登录之前(cmd中)mysqldump -u root -p [数据库名称] > c:/back.sql备份的话,肯定是DBA才能做,所以只能用root:恢复mysql -u root ...
深入Pulsar Consumer的使用方式&源码分析
原文链接 1.使用前准备引入依赖: <dependency> <groupId>org.apache.pulsar</groupId> <artifactI ...
win命令
netstat -nao | findstr "8888"taskkill /pid 15064 /f清理端口被占用win+r进入cmdcmd窗口中输入notepad进入记事本sh ...
SpringMVC IO 文件上传
1 public class FileUtil { 2 3 4 /** 5 * 读取文件内容,作为字符串返回 6 */ 7 public static String readFileAsString( ...
Linux centos7 scp命令
1. 命令简介 scp(secure copy) 是 linux 系统下基于 ssh 登陆进行安全的远程文件拷贝命令,可以在两台 Linux 主机进行复制操作 # 语法 scp [-1246BCpqr ...
JavaScript——数组——slice方法
JavaScript--数组--slice方法 JavaScript中的slice方法类似于字符串的substring方法,作用是对数组进行截取. slice方法有两个参数,indexStart 和 ...
ELK数据迁移,ES快照备份迁移
通过curl命令或者kibana快照备份,恢复的方式进行数据迁移环境介绍之前创建的ELK 因为VPC环境的问题,需要对ELK从新部署,但是还需要保留现有的数据,于是便有了这篇文档. 10.0.20 ...