前言

我在 Kioskcached(1)之 Memcached & Redis & Kioskcached 性能测试对比 中找到的一个问题是 malloc,对于一个内存型数据库,很容易理解,当数据量不断增大的过程中,我们势必需要大量的malloc内存,但是如果malloc不给力,性能就会受到影响。glibc中使用ptmalloc作为默认的内存分配器,但是还有一些性能更好的第三方工具,例如 TCMallocjemalloc ,本篇博客就是我使用TCMalloc替换掉ptmalloc之后做的一些测试(同样:本文不具有实际环境的参考性)。

一、为什么要使用TCMalloc?

我直接翻译gperftools的文档如下 :

TCMalloc is faster than the glibc 2.3 malloc (available as a separate library called ptmalloc2) and other mallocs that I have tested. ptmalloc2 takes approximately 300 nanoseconds to execute a malloc/free pair on a 2.8 GHz P4 (for small objects). The TCMalloc implementation takes approximately 50 nanoseconds for the same operation pair. Speed is important for a malloc implementation because if malloc is not fast enough, application writers are inclined to write their own custom free lists on top of malloc. This can lead to extra complexity, and more memory usage unless the application writer is very careful to appropriately size the free lists and scavenge idle objects out of the free list

TCMallocglibc 2.3 malloc (又名ptmalloc2)以及我测试过的其他mallocs都快。ptmalloc大概花费300ns完成一次malloc/free对在一个2.8GHz 4核的机器上(对于小对象),但是TCMalloc只花费大概50ns的时间,malloc的速度是非常重要的,程序员倾向于在malloc上自定义内存分配算法,这可能导致额外的复杂性和更多的内存使用,除非程序员非常小心的调整空闲链表的大小并清除空闲链表的空闲对象。

注意: 对于小对象

有关tcmalloc的介绍和与其它内存分配器的对比:

http://blog.csdn.net/chosen0ne/article/details/9338591

http://www.360doc.com/content/13/0915/09/8363527_314549128.shtml

二、如何使用

1: 安装方法

$ sudo yum install gperftools-*   //RHEL
$ sudo apt-get install gperftools-* //Ubuntu

如果不能安装成功,centos用户去更换下源:

http://blog.csdn.net/yangbodong22011/article/details/54175193

2:使用方法

非常简单,直接在编译的时候-ltcmalloc就会自动替换掉ptmalloc

$ gcc xxx.c xxx.c -ltcmalloc

之后可以使用ldd命令查看可执行文件需要动态链接的库

$ ldd a.out

第三行,可以看到libtcmalloc.so.4被链接。

三、测试对比

(1):当value为100字节时

使用ptmalloc

1:测试得到的 QPS=365797

2:使用gperftools测试CPU使用效率:

发现果然_int_malloc是CPU利用率最高的函数,我们看替换成tcmalloc之后会有什么效果?

使用tcmalloc

1:测试得到的 QPS=384126

2:使用gperftools测试CPU使用效率:

可以看到QPS提升了 %5,此时_int_malloc已经不是影响性能的主要因素,而是Hash函数查找定位的问题。

(2):当value为1000字节时

使用ptmalloc

1:测试得到的 QPS=212892

2:使用gperftools测试CPU使用效率:

目前read成为了CPU利用率最高的,接着是malloc

使用tcmalloc

1:测试得到的 QPS=231351

2:使用gperftools测试CPU使用效率:

虽然消耗CPU前三位的函数是一样的,但是QPS提升了8 %.

(3):当value为5000字节时

使用ptmalloc

1:测试得到的 QPS=101878

2:使用gperftools测试CPU使用效率:

使用CPU的前三位的函数已经没有变化了。

使用tcmalloc

1:测试得到的 QPS=105017

2:使用gperftools测试CPU使用效率:

这时候消耗CPU的前三个函数已经是一样的了,而且QPS也没有多大提升了。

四、总结

使用tcmalloc替换掉ptmalloc之后,对于小字节,key100字节的时候,消耗CPU最多的函数已经不是_int_malloc,说明还是非常有效果的。

当然,我的测试只是插入了100万条数据,效果不太明显,我还测试插入1000万条数据,性能提升了%16

ptmalloc:

tcmalloc:

[完]

Kioskcached(2) 之 使用tcmalloc 替换 ptmalloc的更多相关文章

  1. 使用tcmalloc替换系统的malloc

    https://blog.csdn.net/educast/article/details/79166553?utm_source=blogxgwz0 今天对服务器进行压测,模拟的请求量到4万次/分的 ...

  2. tcmalloc jemalloc 和ptmalloc 对比

    ptmalloc 是glibc的内存分配管理 tcmalloc 是google的内存分配管理模块 jemalloc 是BSD的提供的内存分配管理 三者的性能对比参考从网上的一个图如下: 自己测试了一下 ...

  3. php Allocator Jemalloc TCMalloc那个内存分配器比较好?

    php Allocator Jemalloc TCMalloc那个内存分配器比较好? php一键安装脚本可以选择是否安装内存优化 You have 3 options for your Memory ...

  4. Redis安装与调试

    Redis安装与调试 Redis安装与调试linux版本:64位CentOS 6.5 Redis版本:2.8.17  (更新到2014年10月31日) Redis官网:http://redis.io/ ...

  5. 如何节省 1TB 图片带宽?解密极致图像压缩

    欢迎大家前往云+社区,获取更多腾讯海量技术实践干货哦~ 作者:Gophery 本文由 腾讯技术工程官方号 发布在云+社区 图像已经发展成人类沟通的视觉语言.无论传统互联网还是移动互联网,图像一直占据着 ...

  6. Linux的虚拟内存管理-如何分配和释放内存,以提高服务器在高并发情况下的性能,从而降低了系统的负载

    Linux的虚拟内存管理有几个关键概念: Linux 虚拟地址空间如何分布?malloc和free是如何分配和释放内存?如何查看堆内内存的碎片情况?既然堆内内存brk和sbrk不能直接释放,为什么不全 ...

  7. 内存优化总结:ptmalloc、tcmalloc和jemalloc(转)

    转载于:http://www.cnhalo.net/2016/06/13/memory-optimize/ 概述 需求 系统的物理内存是有限的,而对内存的需求是变化的, 程序的动态性越强,内存管理就越 ...

  8. 【原创】MySQL5.7.18(ptmalloc VS tcmalloc VS jemalloc)性能测试

    ptmalloc(glibc的malloc)是Linux提供的内存分配管理模块,目前我们MySQL默认使用的内存分配模块. tcmalloc是Google提供的内存分配管理模块. jemalloc是F ...

  9. ptmalloc、tcmalloc和jemalloc

    内存优化总结:ptmalloc.tcmalloc和jemalloc 转载 2017年09月05日 18:57:12 3674 转载于:http://www.cnhalo.net/2016/06/13/ ...

随机推荐

  1. 通宵修复BUG的思考

    HYH.LXJ昨晚通宵修复11月版需求的bug,因为代码提到测试环境后,阻碍了一个分行进行验收测试,业务人员直接把问题反馈给了上级领导,压力下来,项目组就把问题重视起来. 对于通宵加班这件事,应该点赞 ...

  2. sql case when 多条件小结

    sql case when 多条件 小结 -- 第一种 格式 : 简单Case函数 : -- 格式说明 -- case 列名 -- when 条件值1 then 选择项1 -- when 条件值2 t ...

  3. Java基础(七)——多线程

    一.概述 1.介绍 Java VM 启动的时候会有一个进程Java.exe,该进程中至少有一个线程负责Java程序的执行.而且这个线程运行的代码存在于main方法中,该线程称之为主线程.其实从细节上来 ...

  4. 算法——快速排序迭代式和递归式的Java实现

    快速排序迭代式和递归式的Java实现 快速排序基于分治法的思想,在待排序表中任选一值作为中枢值 pivot,一趟快排将所有大于该值的元素置于一边,小于该值的元素置于另一边,这样一个元素在排序中的最终位 ...

  5. 一个神秘的oj2093 花园的守护之神(最小割)

    给定一张无向图,你每次可以将一条路的权值增加1,询问最少增加多少次才会使得\(s->t\)的最短路改变 QwQ一看到这个题,我就用种最小割的感觉 我们可以把最短路上的点取出来,然后做最小割呀!! ...

  6. JavaScript常用的Hook脚本

    JavaScript常用的Hook脚本 本文Hook脚本 来自 包子 页面最早加载代码Hook时机 在source里 用dom事件断点的script断点 然后刷新网页,就会断在第一个js标签,这时候就 ...

  7. easyDialog 简单、实用的弹出层组件

    easyDialog 简单.实用的弹出层组件 使用背景 在完成导师需求时,导师要求寻找比一个layer弹出层组件体积小得多的.最好能嵌入在进HTML代码中而非src引用的弹出层组件,在这个需求下,我找 ...

  8. vue 解决axios请求出现前端跨域问题

    vue 解决axios请求出现前端跨域问题 最近在写纯前端的vue项目的时候,碰到了axios请求本机的资源的时候,出现了访问报404的问题.这就让我很难受.查询了资料原来是跨域的问题. 在正常开发中 ...

  9. 第五课第四周笔记4:Transformer Network变压器网络

    Transformer Network变压器网络 你已经了解了 self attention,你已经了解了 multi headed attention.在这个视频中,让我们把它们放在一起来构建一个变 ...

  10. UltraSoft - Alpha - 测试报告

    遇到的bug bug:在vue.config.js里配置proxy,并修改请求的url后仍无法连接到后端. 解决: url最后忘了'/',导致和后端不匹配,会有404.500等错误. 后端服务未打开或 ...