[development][profile][dpdk] KK程序性能调优
KK程序:
1. 两个线程,第一个从DPDK收包,通过一个ring数据传递给第二个线程。第二个线程将数据写入共享内存。
2. 第二个内存在发现共享内存已满时,会直接丢弃数据。
3. 线程二有个选项debug,用于每一次ring_dequeue之后,都将数据写入内存。
当这个选项为on时,内存未满,也不会丢包。
现象:当内存已满的时候,可以千兆线速收包。当内存未满时,丢包率为20%。
分别做三次gprof:
1. gmon-empty-off.txt
0.08 0.42 / kk_assemble_pool_packet_process []
[] 1.8 0.08 0.42 tcp_packet_process []
0.02 0.10 / _assemble_session_find []
0.01 0.08 / kk_tcp_session_request_find []
0.01 0.07 / kk_table_entries_timeout_free []
0.04 0.04 / _three_way_handshake_process []
0.00 0.06 / _tcp_data_assemble_process []
2. gmon-full-off.txt
0.08 0.48 / kk_assemble_pool_packet_process []
[] 2.4 0.08 0.48 tcp_packet_process []
0.09 0.08 / kk_table_entries_timeout_free []
0.06 0.10 / _assemble_session_find []
0.01 0.09 / kk_tcp_session_request_find []
0.03 0.01 / _three_way_handshake_process []
0.00 0.00 / _tcp_data_assemble_process []
3. gmon-mid-on.txt
0.10 0.55 / kk_assemble_pool_packet_process []
[] 2.3 0.10 0.55 tcp_packet_process []
0.10 0.11 / _assemble_session_find []
0.06 0.09 / kk_table_entries_timeout_free []
0.02 0.11 / kk_tcp_session_request_find []
0.02 0.04 / _three_way_handshake_process []
0.00 0.00 / _tcp_data_assemble_process []
根据以上内容,对比一个关键步骤里的函数执行站比。可以发现。1中find查询的占比明确比其他两种情况更高。 而现象上也是情况1会有丢包,情况2,3不丢包。
再次测试,查看这三次的会话数。
1. gmon-empty-off.txt
name: tcp_assemble_task_1, size: , free: , pkts: , session: , hit: , drop:
name: udp_assemble_task_1, size: , free: , pkts: , session: , hit: , drop:
queue: , ipacket: , imissed: self_counter:
queue: , total_tsc: , tsc/pkt: 3399.538166
2. gmon-full-off.txt
name: tcp_assemble_task_1, size: , free: , pkts: , session: , hit: , drop:
name: udp_assemble_task_1, size: , free: , pkts: , session: , hit: , drop:
queue: , ipacket: , imissed: self_counter:
queue: , total_tsc: , tsc/pkt: 2311.996877
3. gmon-full-on.txt
name: tcp_assemble_task_1, size: , free: , pkts: , session: , hit: , drop:
name: udp_assemble_task_1, size: , free: , pkts: , session: , hit: , drop:
queue: , ipacket: , imissed: self_counter:
queue: , total_tsc: , tsc/pkt: 2333.934127
并未发现规律。
使用新数据再次做次测试:
每15个包1个http会话。共270000个会话,按顺序组装,4050000个包。
1. empty_on
name: tcp_assemble_task_1, size: , free: , pkts: , session: , hit: , drop:
name: udp_assemble_task_1, size: , free: , pkts: , session: , hit: , drop:
queue: , ipacket: , imissed: self_counter:
queue: , total_tsc: , tsc/pkt: 4318.416316
2. empty_off
name: tcp_assemble_task_1, size: , free: , pkts: , session: , hit: , drop:
name: udp_assemble_task_1, size: , free: , pkts: , session: , hit: , drop:
queue: , ipacket: , imissed: self_counter:
queue: , total_tsc: , tsc/pkt: 4842.824395
与上一组同样的测试数据,但是每5000个作为一组并发。
1. empty_on
name: tcp_assemble_task_1, size: , free: , pkts: , session: , hit: , drop:
name: udp_assemble_task_1, size: , free: , pkts: , session: , hit: , drop:
queue: , ipacket: , imissed: self_counter:
queue: , total_tsc: , tsc/pkt: 2912.590597
2. empty_off
name: tcp_assemble_task_1, size: , free: , pkts: , session: , hit: , drop:
name: udp_assemble_task_1, size: , free: , pkts: , session: , hit: , drop:
queue: , ipacket: , imissed: self_counter:
queue: , total_tsc: , tsc/pkt: 4675.433343
最后,是并发数的问题:
KK程序的最大并发数,只能处理到4000.
name: tcp_assemble_task_1, size: , free: , pkts: , session: , hit: , drop: tcp_session: max_concurrent:
name: udp_assemble_task_1, size: , free: , pkts: , session: , hit: , drop: tcp_session: max_concurrent:
queue: , max_concurrent:
queue: , ipacket: , imissed: self_counter:
queue: , total_tsc: , tsc/pkt: 4950.616718
[development][profile][dpdk] KK程序性能调优的更多相关文章
- java程序性能调优---------------性能概述
一.程序的性能通过哪几个方面表现 1.执行速度(程序反应反应是否迅速.响应时间是否足够短) 2.分配内存 (分配内存是否合理,是否过多的消耗内存或者内存溢出) 3.启动时间(程序从运行到可以正常处理业 ...
- 程序性能调优工具之gprob
1 简介改进应用程序的性能是一项非常耗时耗力的工作,但是究竟程序中是哪些函数消耗掉了大部分执行时间,这通常都不是非常明显的.GNU 编译器工具包所提供了一种剖析工具 GNU profiler(gpro ...
- BS程序性能调优
首先想到的是优化算法.改进技术.扩展设备去做优化.其实在讨论性能的时候,绕不开对业务的理解,不同的业务系统对性能的要求不同,优化方式也不一样.优化性能的前提是保证业务的正确性.我们平时关注的性能主要是 ...
- golang 性能调优分析工具 pprof (上)
一.golang 程序性能调优 在 golang 程序中,有哪些内容需要调试优化? 一般常规内容: cpu:程序对cpu的使用情况 - 使用时长,占比等 内存:程序对cpu的使用情况 - 使用时长,占 ...
- 【Java/Android性能优化1】Android性能调优
本文参考:http://www.trinea.cn/android/android-performance-demo/ 本文主要分享自己在appstore项目中的性能调优点,包括同步改异步.缓存.La ...
- Android性能调优
本文主要分享自己在appstore项目中的性能调优点,包括同步改异步.缓存.Layout优化.数据库优化.算法优化.延迟执行等.一.性能瓶颈点整个页面主要由6个Page的ViewPager,每个Pag ...
- 成为Java GC专家(5)—Java性能调优原则
并不是每个程序都需要调优.如果一个程序性能表现和预期一样,你不必付出额外的精力去提高它的性能.然而,在程序调试完成之后,很难马上就满足它的性能需求,于是就有了调优这项工作.无论哪种编程语言,对应用程序 ...
- Android性能调优实例
本文主要分享自己在appstore项目中的性能调优点,包括同步改异步.缓存.Layout优化.数据库优化.算法优化.延迟执行等. 目前性能优化专题已完成以下部分: 性能优化总纲——性能问题及性能调优方 ...
- Java程序性能优化读书笔记(一):Java性能调优概述
程序性能的主要表现点: 执行速度:程序的反映是否迅速,响应时间是否足够短 内存分配:内存分配是否合理,是否过多地消耗内存或者存在内存泄漏 启动时间:程序从运行到可以正常处理业务需要花费多少时间 负载承 ...
随机推荐
- android studio: 一个Android studio 3.3.2 无法创建新项目的问题
记录一个AS无法创建新项目的问题. 今天想写一个测试Demo,点击上面的“Start a new Android Studio Project” ,填写完包名和项目路径后,点“Finish”, AS无 ...
- [转]深刻理解Python中的元类(metaclass)以及元类实现单例模式
使用元类 深刻理解Python中的元类(metaclass)以及元类实现单例模式 在看一些框架源代码的过程中碰到很多元类的实例,看起来很吃力很晦涩:在看python cookbook中关于元类创建单例 ...
- Java四类八种数据类型
http://www.cnblogs.com/simplefrog/archive/2012/07/15/2592011.html 第一类:逻辑型boolean 第二类:文本型char 第三类:整数型 ...
- sparkR介绍及安装
sparkR介绍及安装 SparkR是AMPLab发布的一个R开发包,为Apache Spark提供了轻量的前端.SparkR提供了Spark中弹性分布式数据集(RDD)的API,用户可以在集群上通过 ...
- Private表示该属性(方法)为只有本类内部可以访问(类内部可见)。
Public表示该属性(方法)公开: (想用private还要用set和get方法供其他方法调用,这样可以保证对属性的访问方式统一,并且便于维护访问权限以及属性数据合法性) 如果没有特殊情况,属性一定 ...
- 记一个神奇的WAS问题:sibuswsgw-sibuswsgw_console.jar invalid LOC header (bad signature) 分类: WebSphere 2015-08-06 23:21 9人阅读 评论(0) 收藏
今天晚上,出现了一个神奇的WAS问题,详细问题异常信息如下: [15-8-6 22:13:29:146 CST] 00000013 ApplicationMg A WSVR0203I: 应用程序:is ...
- How to set asp.net Identity cookies expires time
If IsPersistent property of AuthenticationProperties is set to false, then the cookie expiration tim ...
- 如何使用点击事件弹出一个url的iframe选项卡
在一些前后端对接的接口中,前端需要根据后端返回进行跳转,但是有时候需要跳转的地址是不固定的,需要前端灵活的根据接口进行跳转,于是,url被放在接口中返回,而前端想打开一个新窗口的话就会比较麻烦,因为c ...
- redis如何后台启动
当安装好redis之后,运行redis-server命令之后,显示如图所示: 但是这样没有办法在这个tab下做任何操作了,因为这个时候使用Ctrl+c之后,就变成了这个样子 然后就关闭了,那么我想让r ...
- C#自定义Winform无边框窗体
C#自定义Winform无边框窗体 在实际项目中,WinForm窗体或者控件不能满足要求,所以就需要自己设计窗体等,当然设计界面可以用的东西很多,例如WPF.或者一些第三方的库等.本例中将采用WinF ...