Memcache架构新思考

2011年初Marc Kwiatkowski通过Memecache@Facebook介绍了Facebook的Memcache架构，现在重新审视这个架构，仍有很多方面在业界保持先进性。作为weibo内部数据处理量最大，对数据延迟最敏感的部门，基于本厂2年多来对mc的使用心得，我在本文总结对MC架构的一些新思考。

1. Memcache使用中的雷区

通常你可能考虑不到，但又隐藏在某处等着你踩的称之为“雷”。

带宽和连接数

Memcache具有很高吞吐能力，Memecache@Facebook中介绍Memcache支持8万/s读和2万/s写，在weibo内部我们通常认为单个Memcache实例支持7w/s读，2w/s写是安全的。和Facebook一样，为了充分榨取服务器性能，我们会在一台物理机上部署多个Memcache。为了确保Memcache的正常工作，我们通常会通过定期执行MC stats命令来对内存使用量，踢出率，命中率等进行监控。比如微博早期监控中就包括如图所示的这些内容，

这些监控中我们最重视的往往是内存使用量和命中率。但随着前端服务不断增加和cache层不断扩容，单台缓存物理机上的连接数，带宽都成为新的瓶颈。因此必须重视对带宽和连接数的监控。Memecache@Facebook中介绍单台MC服务器可支撑10w连接。

Hot Key

Hot Key通常不常见，但Weibo和Facebook都遇到这类问题，简单的讲就是在大并发下，有大量的请求到同一个在MC中不存在的资源，然后全部read through到后端数据库，把数据库读跨。具体方法请见TimYang的博客：http://timyang.net/programming/memcache-mutex/，同时后面的讨论也很精彩。不过我查阅大量微博代码却没有发现有使用MC mutex，也就是说Hot Key是个不常见的问题，一个不容易踩到的雷。

Memcache Client

不记得是不是在Memecache@Facebook提到过，也和淘宝的同行交流过，共同的的经验是：Memcache优化的重点和难点在客户端。这个展开起来很大，概况讲有2个重点：（1）TCP连接池（2）基于NIO的multiget；可以参考我的另一篇文章：通过NIO实现Memcached multi get （http://maoyidao.iteye.com/blog/1739282）

2. Memcache集群是否支持线性扩容？

扩容问题之一：如果不降低命中率？

扩容Memcache不降低命中率，好像在高速路上给汽车换轮胎。

我们通常从课本上学到的是，前端采用一致性Hash，逻辑节点达2^32个，物理节点扩容也不会导致大量cache命中移动。一致性Hash足以应对大多数场景，但在微博业务中，每秒超过十几万次读，及时下降1%的命中率也会直接读跨数据库，因此我们的要求是扩容不能降低命中率。为达到该目的，我们把水平扩展，变为垂直扩展，即通过多层Cache解决扩容而同时不降低命中率的问题。

另外一个好处是，新加入的cache层无需预热，当线上服务出现意外高峰时，可以立刻投入使用。

扩容问题之二：Memcache集群具备水平扩展性吗？

随着缓存层的增长，数据被分散到更多缓存服务器上，获取相同信息需要发送的网络包的数量也在不断增长。比如，只有一台缓存服务器时，由于操作系统网络层发送缓冲区的设计，get 100个key的数据可以在一个IP packet中传输，结果可以也可以在一个IP packet中获取。但当有100台缓存服务器时，获取100个key的数据就有需要向100台服务器发送100个IP packet（假设100个数据均匀的分布在100台物理机上），相应的内核中断也显著增加。

因此，我不认为Memcache集群在这个概念下具备水平扩展能力。但通常我们通过划分不同数据大小的缓存池控制Memcache集群的大小，而且随着96G或以上大内存服务器的广泛使用。即便在微博这个场景下，12台服务器一组的缓存就已经非常大规模的了。

3. Memcache其实还能更快？

如果你追求极致的Memcache访问速度，可以登录上你的Memcache服务器，检查一下CPU使用情况。我找了一台线上服务，情况如下：

显然CPU7的系统使用率比其他CPU要高。检查一下软中断：

再看看线上服务的版本：

[jichao1@yf179 ~]$ uname -a

Linux yf179 2.6.18-164.el5 #1 SMP Thu Sep 3 03:28:30 EDT 2009 x86_64 x86_64 x86_64 GNU/Linux

在kernel-2.6.18-194.3.1.el 版本以下的Redhat以及CentOS 操作系统，使用Broadcom 5709网卡芯片的服务器存在cpu软中断不均衡，只有1个cpu处理软中断。

解决方法可以是升级内核，不过也有朋友说没用，需要通过VIP绑定2块网卡的方式解决，具体方案见：http://hi.baidu.com/higkoo/item/42ba6c353bc8aed76d15e9c3

通过对比内核支持4个队列的服务器（最多只能利用到4核，无法在硬件驱动层直接配置成更多队列），只分配一个CPU的Memcache服务器在大压力下可能会慢1~2ms。

Memcache架构新思考的更多相关文章

.Net 平台下的互联网架构新思考
上一篇<互联网应用架构谈>有很多阅读量,但后来实践中发现基于WCF服务层技术用于实现网站访问的效率是有问题的. 我的本意是以WCF中间层解决商业逻辑,供各个平台调用,然而还是带来诸多的麻烦 ...
Saas系统架构的思考，多租户Saas架构设计分析
ToB Saas系统最近几年都很火.很多创业公司都在尝试创建企业级别的应用 cRM, HR,销售, Desk Saas系统.很多Saas创业公司也拿了大额风投.毕竟Saas相对传统软件的优势非常明显. ...
关于T公司的强矩阵架构的思考
我所在的T公司是强矩阵架构,关于这类公司,应该是不少大公司的主流架构,也就是说一个职员在公司内不仅在项目内有相应的级别,在其行政上也是有相应的级别,日常工作以项目的内容为主,但是同时也是属于行政的一员 ...
关于领域驱动架构DDD思考
一个高大上的概念领域驱动架构就这样展开. 开发了多年的软件,一直以来的习惯是拿到产品的需求对照UI的图纸然后就干干干碰到问题大不了找人沟通再次定义问题,最后交付.其实最后也能把一件事情完成但如果 ...
关于css的新思考
因为被派去协助别的组,有机会写了一下react,发现ICE做的那一个套件用来搭建后台系统真的太给力了(插一句必入table组件其实是可以把删除添加座位基础方法加进去的).因为看了demo的代码以及对于 ...
关于WEB三层架构的思考
1.MVC设计思想 MVC程序设计思想是眼下比較流行的WEB开发的模式,当中,M(model)是模型.即JavaBean,用来封装和保存数据:V(view)是视图,即JSP.用来显示内容:C(cont ...
.Net架构篇:思考如何设计一款实用的分布式监控系统？
前言无论从最早期的unix操作系统,还是曾经大行其道的单体式应用,还是现在日益流行的微服务架构,始终都离不开监控的身影.如windows的任务管理器,linux的top命令,都可以看作是监控的面板. ...
springcloud微服务架构的思考
在网上找到一张关于微服务体系架构的图应用组件: 首先对于整个程序的入口应该是网关,zuul部分这个组件在springcloud中的gateway服务之后,zuul可以进行网关分配,根据想应的路劲进 ...
Extjs的架构设计思考，单页面应用 or 多页面？
写在前面:不要认为 EXTJS 高版本就是一个界面改良,在项目中,仍然用 N 张页面,在 N 张页面部署 EXTJS ．这种方式不用多讲,效率问题大家都看得出来, EXTJS 是一个集成开发工具,注定 ...

随机推荐

sql中奇怪的sum(1),sum(2),count(1)，count（6）,count(*)：统计总数
sql的统计函数 sql统计函数有 count 统计条数,配合group用 sum 累加指定字段数值但注意sum(1)就特殊 sum(1)等同于count(*) sum(1)统计个数,功能和coun ...
debian 安装jdk
JDK下载http://www.oracle.com/technetwork/java/javasebusiness/downloads/java-archive-downloads-javase6- ...
解决android 大图OOM的两种方法
最近做程序中,需要用到一张大图.这张图片是2880*2180大小的,在我开发所用的华为3C手机上显示没有问题,但是给米3装的时候,一打开马上报OOM错误.给nexus5装,则是图片无法出来,DDMS中 ...
Hessian源码分析--HessianServlet
Hessian可以通过Servlet来对外暴露服务,HessianServlet继承于HttpServlet,但这仅仅是一个外壳,使用web服务器来提供对外的Http请求,在web.xml中我们会进行 ...
Linux 基于IPC机制实现进程间的共享内存处理
今天学习了相关于IPC(InterProcess Communication ,进程间通信)的相关知识.就做个笔记,一来让大家检查一下我的理解方面是不是有错误,二来也为了能让更多的博友们了解到相关的知 ...
linux的wc -l 命令统计文件少一行（一般是windows文件）
先简单介绍 wc(Word Count)命令的功能为统计指定文件中的字节数.字数.行数,并将统计结果显示输出格式:wc file 命令参数: -c 统计Bytes数(字节数),并显示文件名 -l 统 ...
Android官方命令深入分析之dmtracedump
dmtracedump是一个根据log文件生成图形化调用堆栈的工具(除了Traceview之外). dmtracedump的用法: dmtracedump [-ho] [-s sortable] [- ...
Android-获取全局Context的技巧-android学习之旅(68)
我们经常需要获取全局的Context ,比如弹出Toast,启动活动,服务,接收器,还有自定义控件,操作数据库,使用通知等通常的方法是在调用的地方传入Context参数 ,有时候这种不会奏效,教给大 ...
数据结构基础(2) --顺序查找 & 二分查找
顺序查找适用范围: 没有进行排序的数据序列缺点: 速度非常慢, 效率为O(N) //实现 template <typename Type> Type *sequenceSearch(T ...
Cocos2D物理碰撞不按预期工作的排查工作
如果该碰撞的节点不碰撞或反过来不该碰的碰撞了,你可以检查一下几个方面: 1.对应2个节点的分类和掩码必须匹配.如果它们应该碰撞则一个节点的分类应该在另一个节点的掩码中,反之亦然. 2.注意空的分类和掩 ...

Memcache架构新思考

Memcache架构新思考的更多相关文章

随机推荐

热门专题