spymemcached深入分析

author:智深

version:0.7

日志:http://my.oschina.net/astute

QQ:2548921609(技术交流)

一、简介

spymemcached 是一个 memcache 的客户端, 使用 NIO 实现。

分析 spymemcached 需要了解 NIO,memcached使用,memcached协议,参考资料中列出了有用的资源连接。

NIO是New I/O的缩写,Java里边大家一般称为异步IO,实际上对应Linux系统编程中的事件驱动IO(event-driven IO),是对 epoll 的封装。其它的IO模型还包括同步,阻塞,非阻塞,多路复用(select,poll)。阻塞/非阻塞是 fd 的属性,同步会跟阻塞配合,这样的应用会一直 sleep,直到IO完成被内核唤醒;同步非阻塞的话,第一次读取时,如果没有数据,应用线程会立刻返回,但是应用需要确定以什么样的策略进行后面的系统调用,如果是简单的while循环会导致CPU 100%,复杂的类似自旋的策略增加了应用编程的难度,因此同步非阻塞很少使用。多路复用是Linux早期的一个进程监控多个fd的方式,性能比较低,每次调用涉及3次循环遍历,具体分析见 http://my.oschina.net/astute/blog/92433 。event-driven IO,应用注册 感兴趣的socket IO事件(READ,WRITE),调用wait开始sleep,当条件成立时,如数据到达(可读),写缓冲区可用(可写),内核唤醒应用线程,应用线程根据得到的socket执行同步的调用读/写 数据。

二、协议简介

memcachded服务器和客户端之间采用 TCP 的方式通信,自定义了一套字节流的格式。本文分析的文本协议的构建和其它文本协议类似,mc里面分成命令行和数据块行,命令行里指明数据块的字节数目,命令行和数据块后都跟随\r\n。重要的一点是服务器在读取数据块时是根据命令行里指定的字节数目,因此数据块中含有\r或\n并不影响服务器读块操作。数据块后必须跟随\r\n。

存储命令

发送

<command name> <key> <flags> <exptime> <bytes> [noreply]\r\n

cas <key> <flags> <exptime> <bytes> <cas unique> [noreply]\r\n

<data block>\r\n

command name = "set", "add", "replace", "append" or "prepend"

flags - 32位整数 server并不操作这个数据 get时返回给客户端

exptime - 过期时间,可以是unix时间戳或偏移量,偏移量的话最大为30*24*60*60, 超过这个值,服务器会认为是unix时间戳

bytes - 数据块字节的个数

响应

<data block>\r\n

STORED\r\n - 成功

NOT_STORED\r\n - add或replace命令没有满足条件

EXISTS\r\n - cas命令 表明item已经被修改

NOT_FOUND\r\n - cas命令 item不存在

获取命令

发送

get <key>*\r\n

gets <key>*\r\n

<key>* - 空格分割的一个或多个字符串

响应

VALUE <key> <flags> <bytes> [<cas unique>]\r\n

<data block>\r\n

VALUE <key> <flags> <bytes> [<cas unique>]\r\n

<data block>\r\n

END\r\n

本文以 get 操作为例;key = someKey  value=abcdABC中文

以字节流的形式最终发送的数据

[103, 101, 116, 32, 115, 111, 109, 101, 75, 101, 121, 13, 10, 0]

103 101 116 - "get"

32 - "" 空格

115 111 109 101 75 101 121 - someKey

13 10 - \r\n

接收到的数据

VALUE someKey 0 13

61 62 63 64 41 42 43 E4 B8 AD E6 96 87\r\n

END\r\n

删除命令

发送

delete <key> [noreply]\r\n

响应

DELETED\r\n - 成功删除

NOT_FOUND\r\n - 删除的条目不存在

其它命令

详见参考资料 mc 协议

三、spymemcached中的重要对象

简介

spy是mc的客户端,因此spy中所有对象需要基于它要完成的 功能 和 到mc服务器的通信协议来进行设计。最重要的MemcachedClient表示mc集群的client,应用中单例即可。spy中的每一个mc节点,用MemcachedNode表示,这个对象内部含有一个channel,网络连接到mc节点。要根据key的哈希值查找某个mc节点,spy中使用NodeLocator,默认locator是ArrayModNodeLocator,这个对象内部含有所有的MemcachedNode,spy使用的hash算法都在对象DefaultHashAlgorithm中,默认使用NATIVE_HASH,也就是String.hashCode()。locator和client中间还有一个对象,叫MemcachedConnection ,它表示到mc集群的连接,内部持有locator。clent内部持有MemcachedConnection(mconn)。spy使用NIO实现,因此有一个selector,这个对象存在于mconn中。要和服务器进行各种操作的通信,协议数据发送,数据解析,spy中抽象为Operation,文本协议的get操作最终实现为net.spy.memcached.protocol.ascii.GetOperationImpl。为了实现工作线程和IO线程之间的调度,spy抽象出了一个 GetFuture,内部持有一个OperationFuture。

TranscodeService执行字节数据和对象之间的转换,spy中实现方式为任务队列+线程池,这个对象的实例在client中。

对象详解

SpyObject - spy中的基类 定义 Logger

MemcachedConnection - 表示到多台 mc 节点的连接

MemcachedConnection - 详细属性

shouldOptimize - 是否需要优化多个连续的get操作 --> gets 默认true

addedQueue - 用来记录排队到节点的操作

selector - 监控到多个 mc 服务器的读写事件

locator - 定位某个 mc 服务器

GetFuture - 前端线程和工作线程交互的对象

--> OperationFuture

ConnectionFactory - 创建 MemcachedConnection 实例;创建操作队列;创建 OperationFactory;制定 Hash 算法。

DefaultConnectionFactory - 默认连接工厂

DefaultHashAlgorithm - Hash算法的实现类

MemcachedNode - 定义到 单个memcached 服务器的连接

TCPMemcachedNodeImpl -

AsciiMemcachedNodeImpl -

BinaryMemcachedNodeImpl -

TCPMemcachedNodeImpl - 重要属性

socketAddress - 服务器地址

rbuf - 读缓冲区 默认大小 16384

wbuf - 写缓冲区 默认大小 16384

writeQ - 写队列

readQ - 读队列

inputQueue - 输入队列 memcachclient添加操作时先添加到 inputQueue中

opQueueMaxBlockTime - 操作的最大阻塞时间 默认10秒

reconnectAttempt - 重连尝试次数 volatile

channel - socket 通道

toWrite - 要向socket发送的字节数

optimizedOp - 优化后的Operation 实现类是OptimizedGetImpl

sk - channel注册到selector后的key

shouldAuth - 是否需要认证 默认 false

authLatch - 认证需要的Latch

reconnectBlocked -

defaultOpTimeout - 操作默认超时时间 默认值 2.5秒

continuousTimeout - 连续超时次数

opFact - 操作工厂

MemcachedClient - 重要属性

mconn - MemcachedConnection

opFact - 操作工厂

transcoder - 解码器

tcService - 解码线程池服务

connFactory - 连接工厂

Operation - 所有操作的基本接口

BaseOperationImpl

OperationImpl

BaseGetOpImpl - initialize 协议解析 构建缓冲区

GetOperationImpl

OperationFactory - 为协议构建操作 比如生成 GetOperation

BaseOperationFactory

AsciiOperationFactory - 文本协议的操作工厂 默认的操作工厂

BinaryOperationFactory - 二进制协议的操作工厂

OperationFactory - 根据 protocol handlers 构建操作

BaseOperationFactory

AsciiOperationFactory - 支持 ascii protocol

BinaryOperationFactory - 支持 binary operations

NodeLocator - 根据 key hash 值查找节点

ArrayModNodeLocator - hash 值和节点列表长度取模,作为下标,简单的数组查询

KetamaNodeLocator - Ketama一致性hash的实现

Transcoder - 对象和字节数组之间的转换接口

BaseSerializingTranscoder

SerializingTranscoder - 默认的transcoder

TranscodeService - 异步的解码服务,含有一个线程池

FailureMode - node失效的模式

Redistribute - 节点失效后移动到下一个有效的节点  默认模式

Retry - 重试失效节点 直至恢复

Cancel - 取消操作

四、整体流程

初始化

客户端执行new MemcachedClient(new InetSocketAddress("192.168.56.101", 11211))。初始化 MemcachedClient,内部初始化MemcachedConnection,创建selector,注册channel到selector,启动IO线程。

线程模型

初始化完成后,把监听mc节点事件的线程,也就是调用select的线程,称为IO线程;应用执行 c.get("someKey"),把应用所在的线程称为工作线程。工作线程通常由tomcat启动,负责创建操作,加入节点的操作队列,工作线程通常有多个;IO线程负责从队列中拿到操作,执行操作。

工作线程

工作线程最终会调用asyncGet,方法内部会创建CountDownLatch(1), GetFuture,GetOperationImpl(持有一个内部类,工作线程执行完成后,最终会调用 latch.countDown()),选择mc节点,操作op初始化(生成写缓冲区),把op放入节点等待队列inputQueue中,同时会把当前节点放入mc连接(mconn)的addedQueue属性中,最后唤醒selector。最终工作线程在latch上等待(默认超时2.5秒)IO线程的执行结果。

IO线程

IO线程被唤醒后

1、handleInputQueue()。移动Operation从inputQueue到writeQ中。对添加到addedQueue中的每一个MemcachedNode分别进行处理。这个函数会处理所有节点上的所有操作,全部发送到mc服务器(之前节点上就有写操作的才这么处理,否则只是注册写事件)。

2、循环过程中,如果当前node中没有写操作,则判断writeQ,readQ中有操作,在SK上注册读/写事件;如果有写操作,需要执行handleWrites函数。这个函数内部首先做的是、填充缓冲区fillWriteBuffer():从writeQ中取出一个可写的操作(remove掉取消的和超时的),改变操作的状态为WRITING,把操作的数据复制到写缓冲区(写缓冲区默认16K,操作的字节数从十几字节到1M,这个地方有复杂的处理,后面会详细分析,现在只考虑简单情况),复制完成后把操作状态变为READING,从writeQ中remove当前操作,把操作add到readQ当中,这个地方会再去复制pending的操作;‚、发送写缓冲区的内容,全部发送完成后,会再次去填充缓冲区fillWriteBuffer()(比如说一个大的命令,一个缓冲区不够)。循环,直到所有的写操作都处理完。ƒ、判断writeQ,readQ是否有操作,更新sk注册的读写事件。get操作的话,现在已经注册了读事件。

3、selector.select()

4、数据到达时,执行handleIO(sk),处理读事件;执行channel.read(rbuf);执行readFromBuffer(),解析数据,读取到END\r\n将操作状态置为COMPLETE。

五、初始化详细流程

1、默认连接工厂为 DefaultConnectionFactory。接着创建TranscodeService(解码的线程池,默认线程最多为10),创建AsciiOperationFactory(支持ascii协议的操作工厂,负责生成各种操作,比如 GetOperationImpl),创建MemcachedConnection,设置操作超时时间(默认2.5秒)。

2、DefaultConnectionFactory创建MemcachedConnection详细过程:创建reconnectQueue,addedQueue,设置shouldOptimize为true,设置maxDelay为30秒,设置opFact,设置timeoutExceptionThreshold为1000(超过这个值,关闭到 mc node 的连接),打开 Selector,创建nodesToShutdown,设置bufSize为16384字节,创建到每个node的 MemcachedNode(默认是AsciiMemcachedNodeImpl,这一步创建SocketChannel,连接到mc节点,注册到selector,设置sk为刚注册得到的SelectionKey),最后启动 MemcachedConnection 线程,进入事件处理的循环代码

while(running) handleIO()。

六、核心流程代码

1、工作线程

一切从工作线程调用 c.get("someKey") 方法开始

基本流程是:创建操作(Operation),操作初始化,查找节点,把操作加入节点的等待队列,唤醒IO线程,然后工作线程在Future上等待IO线程的执行结果

1 //
默认等待2.5秒
2 return asyncGet(key,
tc).get(
2500,
TimeUnit.MILLISECONDS)
01 //
内部类GetOperation.Callback,是工作线程和IO线程交互的类
02 //
IO线程得到所有的操作响应数据后,调用gotData方法
03 //
IO线程接收到END\r\n后,调用receivedStatus和complete方法
04 public <T>
GetFuture<T> asyncGet(
final String
key, 
final Transcoder<T>
tc) {
05     final CountDownLatch
latch = 
new CountDownLatch(1);
06     final GetFuture<T>
rv = 
new GetFuture<T>(latch,
operationTimeout, key);
07     Operation
op = opFact.get(key, 
new GetOperation.Callback()
{
08         private Future<T>
val = 
null;
09         public void receivedStatus(OperationStatus
status) {
10             rv.set(val,
status);
11         }
12         public void gotData(String
k, 
int flags, byte[]
data) {
13             val
= tcService.decode(tc, 
new CachedData(flags,
data, tc.getMaxSize()));
14         }
15         public void complete()
{
16             latch.countDown();
17         }
18     });
19     rv.setOperation(op);
20     mconn.enqueueOperation(key,
op);
21     return rv;  //
最终会在rv上调用get方法
22 }
01 //
向节点中队列中添加操作 1、查找节点 2、放入队列
02 //
查找节点,根据key的hash值,对节点数取模
03 protected void addOperation(final String
key, 
final Operation
o) {
04     MemcachedNode
placeIn = 
null;
05     MemcachedNode
primary = locator.getPrimary(key);
06     if (primary.isActive()
|| failureMode == FailureMode.Retry) {
07         placeIn
= primary;
08     else if (failureMode
== FailureMode.Cancel) {
09         o.cancel();
10     else {
11         for (Iterator<MemcachedNode>
i = locator.getSequence(key); placeIn == 
null
12         &&
i.hasNext();) {
13             MemcachedNode
n = i.next();
14             if (n.isActive())
{
15                 placeIn
= n;
16             }
17         }
18         if (placeIn
== 
null)
{
19             placeIn
= primary;
20         }
21     }
22     if (placeIn
!= 
null)
{
23         addOperation(placeIn,
o);
24     else {
25     }
26 }
1 //
最重要的方法
2 protected void addOperation(final MemcachedNode
node, 
final Operation
o) {
3     o.setHandlingNode(node);
4     o.initialize();  //
操作初始化,生成要发送的字节流数据,放到缓冲区中
5     node.addOp(o);   //
添加到节点的inputQueue中
6     addedQueue.offer(node);   //
有操作的节点放入 addedQueue中
7     Selector
s = selector.wakeup(); 
//
唤醒IO线程
8 }

工作线程和IO线程之间传递的Future对象,结构如下 

GetFuture ---> OperationFuture ---> latch 

---> 表示依赖关系

01 //
最终工作线程在 OperationFuture的get方法上等待latch
02 public T
get(
long duration,
TimeUnit units) {
03     if (!latch.await(duration,
units)) { 
//
等待2.5秒
04         MemcachedConnection.opTimedOut(op);
05         if (op
!= 
null)
{
06             op.timeOut(); //2.5秒后,操作没有执行完,设置超时(IO线程会判断,如果超时,就remove)
07         }
08         //
throw exception
09     }
10     return objRef.get(); //
objRef是一个原子引用,来保证对象的安全发布(线程安全)
11 }
12 //
objRef引用的是一个TranscodeService.Task(本身是个FutureTask)对象,如果没有压缩和序列化的话,最终工作线程会调用tc.decode方法,得到返回值。

2、IO线程

IO线程的操作循环

处理输入队列,注册写事件;执行写操作,注册读事件;处理读操作,解析结果。

1 public void run()
{
2   while (running)
{
3   handleIO();
4   }
5 }
01 public void handleIO() throws IOException
{
02     handleInputQueue();
03     int selected
= selector.select(delay);
04     Set<SelectionKey>
selectedKeys = selector.selectedKeys();
05  
06     if (selectedKeys.isEmpty()
&& !shutDown) {
07         //
some code
08     else {
09         for (SelectionKey
sk : selectedKeys) {
10             handleIO(sk);
11         }
12         selectedKeys.clear();
13     }
14 }
01 handleInputQueue
02 处理addedQueue中的所有节点,对每一个节点复制inputQueue中的操作到writeQ中。注册读写事件。
03 private void handleInputQueue()
{
04     if (!addedQueue.isEmpty())
{
05         Collection<MemcachedNode>
toAdd = 
new HashSet<MemcachedNode>();
06         Collection<MemcachedNode>
todo = 
new HashSet<MemcachedNode>();
07         MemcachedNode
qaNode = 
null;
08         while ((qaNode
= addedQueue.poll()) != 
null)
{
09             todo.add(qaNode);
10         }
11         for (MemcachedNode
qa : todo) {
12             boolean readyForIO
false;
13             if (qa.isActive())
{
14                 if (qa.getCurrentWriteOp()
!= 
null)
{
15                     readyForIO
true;
16                 }
17             else {
18                 toAdd.add(qa);
19             }
20             qa.copyInputQueue();
21             if (readyForIO)
{
22                 try {
23                     if (qa.getWbuf().hasRemaining())
{
24                         handleWrites(qa.getSk(),
qa);
25                     }
26                 catch (IOException
e) {
27                     lostConnection(qa);
28                 }
29             }
30             qa.fixupOps();
31         }
32         addedQueue.addAll(toAdd);
33     }
34 }
01 spy中注册读写事件的函数
02 readQ不为空注册读事件;writeQ不为空注册写事件;网络没有连接上注册连接事件。
03 public final void fixupOps()
{
04     SelectionKey
s = sk;
05     if (s
!= 
null &&
s.isValid()) {
06         int iops
= getSelectionOps();
07         s.interestOps(iops);
08     else {
09     }
10 }
01 public final int getSelectionOps()
{
02     int rv
0;
03     if (getChannel().isConnected())
{
04         if (hasReadOp())
{
05             rv
|= SelectionKey.OP_READ;
06         }
07         if (toWrite
0 ||
hasWriteOp()) {
08             rv
|= SelectionKey.OP_WRITE;
09         }
10     else {
11         rv
= SelectionKey.OP_CONNECT;
12     }
13     return rv;
14 }
1 public final boolean hasReadOp()
{
2     return !readQ.isEmpty();
3 }
4  
5 public final boolean hasWriteOp()
{
6     return !(optimizedOp
== 
null &&
writeQ.isEmpty());
7 }

3、handleWrites(SelectionKey sk, MemcachedNode qa) 

我能够想到的一些场景,这个状态机代码必须处理的

⑴ 当前队列中有1个操作,操作要发送的字节数目小于16K

⑵ 当前队列中有1个操作,操作要发送的字节数目大于16K(很大的set操作)

⑶ 当前队列中有多个操作,操作要发送的字节数目小于16K

⑷ 当前队列中有多个操作,操作要发送的字节数目大于16K

⑸ 任意一次写操作wrote为0



summary:处理节点中writeQ和inputQueue中的所有操作。每次循环会尽量填满发送缓冲区,然后将发送缓冲区的内容全部发送到网络上,循环往复,没有异常的情况下,直至发送完数据。操作中发送的内容只要放入到发送缓冲区后,就把操作加入到readQ(spy中根据writeQ和readQ中有没有数据,来注册读写事件)。



执行时机:IO线程在select上休眠,被工作线程唤醒后,处理输入队列,把操作复制到writeQ 中,注册写事件;再次调用select,返回后,就会调用handleWrites(),数据全部发送后,会注册读事件。处理输入队列时,如果wbuf还有东西没有发送,那么会在select调用前,调用handleWrites函数。

01 private void handleWrites(SelectionKey
sk, MemcachedNode qa) 
throws IOException
{
02     qa.fillWriteBuffer(shouldOptimize);
--->
03     boolean canWriteMore
= qa.getBytesRemainingToWrite() > 
0;
04     while (canWriteMore)
{
05         int wrote
= qa.writeSome(); --->
06         qa.fillWriteBuffer(shouldOptimize);
07         canWriteMore
= wrote > 
0 &&
qa.getBytesRemainingToWrite() > 
0;
08     }
09 }
10  
11  --
发送数据;执行一次后,wbuf可能还有数据未写完
12 public final int writeSome() throws IOException
{
13     int wrote
= channel.write(wbuf);
14     toWrite
-= wrote;
15     return wrote;
16 }
01 --
填充缓冲区
02 toWrite=0 表明
写缓冲区以前的内容已经全部写入到网络中,这样才会进行下一次的填充写缓冲区
03 操作会尽量填满16K的缓冲区(单一操作数据量很大比如500K;或多个操作数据量500K)
04 当一个操作中的数据完全写入缓冲区后,操作的状态变成READING,从writeQ中移除当前操作。
05 public final void fillWriteBuffer(boolean shouldOptimize)
{
06     if (toWrite
== 
0 &&
readQ.remainingCapacity() > 
0)
{
07         getWbuf().clear();
08         Operation
o=getNextWritableOp(); --->
09  
10         while(o
!= 
null &&
toWrite < getWbuf().capacity()) {
11             synchronized(o)
{
12                 ByteBuffer
obuf = o.getBuffer();
13                 int bytesToCopy
= Math.min(getWbuf().remaining(), obuf.remaining());
14                 byte[]
b = 
new byte[bytesToCopy];
15                 obuf.get(b);
16                 getWbuf().put(b);
17                 if (!o.getBuffer().hasRemaining())
{
18                     o.writeComplete();
19                     transitionWriteItem();
20                     preparePending();
-- copyInputQueue()
21                     if (shouldOptimize)
{
22                         optimize();
23                     }
24                     o=getNextWritableOp();
25                 }
26                 toWrite
+= bytesToCopy;
27             }
28         }
29         getWbuf().flip();
30     else {
31     }
32 }
01 --
获取节点写队列中下一个可写的操作
02 如果操作已经取消(前端线程等待超时,取消操作),或超时(IO线程没有来得及执行操作,操作超时),那么把操作从队列中移除,继续查找下一个操作。把可写的操作的状态从WRITE_QUEUED变成WRITING,同时把操作放入读队列中。
03 private Operation
getNextWritableOp() {
04     Operation
o = getCurrentWriteOp(); --->④
05     while (o
!= 
null &&
o.getState() == OperationState.WRITE_QUEUED) {
06         synchronized(o)
{
07             if (o.isCancelled())
{
08                 Operation
cancelledOp = removeCurrentWriteOp();--->⑤
09             else if (o.isTimedOut(defaultOpTimeout))
{
10                 Operation
timedOutOp = removeCurrentWriteOp();
11             else {
12                 o.writing();
13                 if (!(o instanceof TapAckOperationImpl))
{
14                     readQ.add(o);
15                 }
16                 return o;
17             }
18             o
= getCurrentWriteOp();
19         }
20     }
21     return o;
22 }
01
-- 拿到当前写操作(并不从队列中移除)
02 public final Operation
getCurrentWriteOp() {
03     return optimizedOp
== 
null ?
writeQ.peek() : optimizedOp;
04 }
05  
06
-- remove当前写操作
07 public final Operation
removeCurrentWriteOp() {
08     Operation
rv = optimizedOp;
09     if (rv
== 
null)
{
10         rv
= writeQ.remove();
11     else {
12         optimizedOp
null;
13     }
14     return rv;
15 }
01 4、handleReads
02 handleReads(SelectionKey
sk, MemcachedNode qa)
03 从网络中读取数据,放入rbuf。解析rbuf,得到结果;
04 private void handleReads(SelectionKey
sk, MemcachedNode qa) 
throws IOException
{
05     Operation
currentOp = qa.getCurrentReadOp();
06     if (currentOp instanceof TapAckOperationImpl)
//
no response
07         qa.removeCurrentReadOp();
08         return;
09     }
10     ByteBuffer
rbuf = qa.getRbuf();
11     final SocketChannel
channel = qa.getChannel();
12     int read
= channel.read(rbuf);
13     if (read
0)
{
14         //
some code
15     }
16     while (read
0)
//
从网络中读数据一直读到0为止
17         rbuf.flip();
18         while (rbuf.remaining()
0)
//
只要缓冲区有数据 就去解析操作
19             synchronized(currentOp)
{
20                 currentOp.readFromBuffer(rbuf); //
从rbuf中解析响应
21                 if (currentOp.getState()
== OperationState.COMPLETE) {
22                     Operation
op = qa.removeCurrentReadOp(); 
//
操作解析成功,移除
23                 else if (currentOp.getState()
== OperationState.RETRY) {
24                     ((VBucketAware)
currentOp).addNotMyVbucketNode(currentOp.getHandlingNode());
25                     Operation
op = qa.removeCurrentReadOp();
26                     retryOps.add(currentOp);
27                 }
28             }
29             currentOp=qa.getCurrentReadOp();
30         }
31         rbuf.clear();
32         read
= channel.read(rbuf);
33     }
34 }
01 //
解析rbuf;readType有两种取值,LINE 和 DATA,用来区分正在操作的数据是命令行还是数据块。解析过程中,分别调用工作线程传入到操作中的回调对象的三个方法,分别是:receivedStatus,gotData,complete。
02 public void readFromBuffer(ByteBuffer
data) 
throws IOException
{
03     while (getState()
!= OperationState.COMPLETE && data.remaining() > 
0)
{
04         if (readType
== OperationReadType.DATA) {
05             handleRead(data);
06         else {
07             int offset
= -
1;
08             for (int i
0;
data.remaining() > 
0;
i++) {
09                 byte b
= data.get();
10                 if (b
== 
'\r')
{
11                     foundCr
true;
12                 else if (b
== 
'\n')
{
13                     assert foundCr
"got
a \\n without a \\r"
;
14                     offset
= i;
15                     foundCr
false;
16                     break;
17                 else {
18                     assert !foundCr
"got
a \\r without a \\n"
;
19                     byteBuffer.write(b);
20                 }
21             }
22             if (offset
>= 
0)
{
23                 String
line = 
new String(byteBuffer.toByteArray(),
CHARSET);
24                 byteBuffer.reset();
25                 OperationErrorType
eType = classifyError(line);
26                 if (eType
!= 
null)
{
27                     handleError(eType,
line);
28                 else {
29                     handleLine(line); //
取到完整的一行后 调用这个函数 解析行数据
30                 }
31             }
32         }
33     }
34 }
01 //
处理命令行和END行
02 //
解析命令行时,分析各种参数 data为数据块的字节数
03 public final void handleLine(String
line) {
04     if (line.equals("END"))
{
05         if (hasValue)
{
06             getCallback().receivedStatus(END);
07         else {
08             getCallback().receivedStatus(NOT_FOUND);
09         }
10         transitionState(OperationState.COMPLETE);
11         data
null;
12     else if (line.startsWith("VALUE
"
))
{
13         String[]
stuff = line.split(
"
"
);
14         currentKey
= stuff[
1];
15         currentFlags
= Integer.parseInt(stuff[
2]);
16         data
new byte[Integer.parseInt(stuff[3])];
17         if (stuff.length
4)
{
18             casValue
= Long.parseLong(stuff[
4]);
19         }
20         readOffset
0;
21         hasValue
true;
22         setReadType(OperationReadType.DATA);
23     else if (line.equals("LOCK_ERROR"))
{
24         getCallback().receivedStatus(LOCK_ERROR);
25         transitionState(OperationState.COMPLETE);
26     else {
27         assert false "Unknown
line type: "
 +
line;
28     }
29 }

5、那个著名的bug

JAVA NIO bug 会导致 CPU 100%

http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=6403933

int selected = selector.select(delay);

Set<SelectionKey> selectedKeys = selector.selectedKeys();

if (selectedKeys.isEmpty() && !shutDown) {

if (++emptySelects > DOUBLE_CHECK_EMPTY) {

for (SelectionKey sk : selector.keys()) {

if (sk.readyOps() != 0) {

handleIO(sk);

} else {

lostConnection((MemcachedNode) sk.attachment());

}

DOUBLE_CHECK_EMPTY = 256,当连续的select返回为空时,++emptySelects,超过256,连接到当前mc节点的socket channel关闭,放入重连队列。

七、调试 spymemcached

调试 spymemcached IO线程的过程中,工作线程放入到节点队列的操作很容易超时,因此需要继承DefaultConnectionFactory 复写相关方法。

01 public class AstuteConnectionFactory extends DefaultConnectionFactory
{
02 @Override
03 public boolean shouldOptimize()
{
04 return false;
05 }
06 @Override
07 public long getOperationTimeout()
{
08 return 3000000L; //
3000S
09 }
10 }
八、参考资料

NIO:http://www.ibm.com/developerworks/cn/education/java/j-nio/index.html

memcached:http://memcached.org/

protocol:https://github.com/memcached/memcached/blob/master/doc/protocol.txt

spymemcached源码深入分析的更多相关文章

  1. AQS源码深入分析之共享模式-你知道为什么AQS中要有PROPAGATE这个状态吗?

    本文基于JDK-8u261源码分析 本篇文章为AQS系列文的第二篇,前文请看:[传送门] 第一篇:AQS源码深入分析之独占模式-ReentrantLock锁特性详解 1 Semaphore概览 共享模 ...

  2. Android之Handler源码深入分析

    闲着没事,就来看看源码,看看源码的各种原理,会用只是简单的,知道为什么才是最牛逼的. Handler源码分析那,从使用的步骤来边用边分析: 1.创建一个Handler对象:new Handler(ge ...

  3. Buffer源码深入分析

    博客园对MarkDown显示的层次感不是很好,大家可以看这里:Buffeer. 本机环境: Linux 4.4.0-21-generic #37-Ubuntu SMP Mon Apr 18 18:33 ...

  4. Spring 循环引用(三)源码深入分析版

    @ 目录 前言 正文 分析 doGetBean 为什么Prototype不可以 createBean doCreateBean getEarlyBeanReference getSingleton b ...

  5. AQS源码深入分析之独占模式-ReentrantLock锁特性详解

    本文基于JDK-8u261源码分析 相信大部分人知道AQS是因为ReentrantLock,ReentrantLock的底层是使用AQS来实现的.还有一部分人知道共享锁(Semaphore/Count ...

  6. AQS源码深入分析之条件队列-你知道Java中的阻塞队列是如何实现的吗?

    本文基于JDK-8u261源码分析 1 简介 因为CLH队列中的线程,什么线程获取到锁,什么线程进入队列排队,什么线程释放锁,这些都是不受我们控制的.所以条件队列的出现为我们提供了主动式地.只有满足指 ...

  7. STM32时钟系统配置程序源码深入分析

    一.分析程序的目的 最近我在移植实时系统是遇到了一些问题,所以决定深入了解系统时钟的配置过程,当然想要学好stm32的小伙伴也有必要学习好时钟系统的配置,所以我将学习的过程再次记录,有写得不好的地方, ...

  8. Java调度线程池ScheduledThreadPoolExecutor源码分析

    最近新接手的项目里大量使用了ScheduledThreadPoolExecutor类去执行一些定时任务,之前一直没有机会研究这个类的源码,这次趁着机会好好研读一下. 该类主要还是基于ThreadPoo ...

  9. ThreadPoolExecutor源码分析-面试问烂了的Java线程池执行流程,如果要问你具体的执行细节,你还会吗?

    Java版本:8u261. 对于Java中的线程池,面试问的最多的就是线程池中各个参数的含义,又或者是线程池执行的流程,彷佛这已成为了固定的模式与套路.但是假如我是面试官,现在我想问一些更细致的问题, ...

  10. 最简 Spring AOP 源码分析!

    前言 最近在研究 Spring 源码,Spring 最核心的功能就是 IOC 容器和 AOP.本文定位是以最简的方式,分析 Spring AOP 源码. 基本概念 上面的思维导图能够概括了 Sprin ...

随机推荐

  1. sipp模拟uas发送update

    概述 freeswitch是一款简单好用的VOIP开源软交换平台. 但是fs在处理update消息时候有BUG,为了复现问题,使用sipp模拟uas,发送update并发送DTMF码. 本文档记录si ...

  2. C语言指针进阶

    目录 字符指针 指针数组 数组指针 数组指针的定义 &数组名VS数组名 数组指针的使用 数组参数.指针参数 一维数组传参 二维数组传参 一级指针传参 二级指针传参 一级指针 二级指针 数组指针 ...

  3. BIM: From sketch to digital twin

    BIM - building information model mechanical, electrical, and plumbing (MEP) Revit - AutoDesk的建筑建模软件, ...

  4. 变“金点子”为“好应用”,合合信息智能文档处理技术助力大学生探索AI创新边界

    谈"糖"色变.追求养生.低卡生活--这些热门词汇频频在社交媒体上掀起讨论热潮.有这样一批年轻人不但捕捉到了这些词汇背后真实的用户需求,并且正在利用AI技术寻找解决之道. 近日,&q ...

  5. 项目完成小结:使用DjangoStarter v3和Taro开发的微信小程序

    前言 不知不觉已经九月了,又到了一年的开学季,我每年都想做的项目墙甚至连个影子都没有- 最近生活中的琐事太多了,导致完全没有想写文章的动力,不过再怎么拖还是得记录,随便写写吧~ 这次是7月份的一个小项 ...

  6. Identity – user login, forgot & reset password, 2fa, external login, logout 实战篇

    前言 之前写过一篇 Identity – User Login, Forgot Password, Reset Password, Logout, 当时写的比较简陋, 今天有机会就写多一篇实战版. 建 ...

  7. CSS & JS Effect – Image 倒影框

    效果 Step1: HTML 结构 <div class="image"> <img src="./images/img-2.png" /&g ...

  8. Magic Quadrant 魔力象限

    前言 在做 Web Application Firewall research 的时候看见了一张图. 这格式之前也看见过, 但没怎么上心, 现在才注意到它很好表达了行业或者产品的市场格局. 于是特地 ...

  9. mongodb 中rs.stauts()命令参数解析

    转载请注明出处: rs.status()命令用于获取MongoDB副本集的状态信息.它提供了关于副本集中各个节点的详细信息,包括节点的健康状况.角色.选举状态等. 以下是查看一个mongo集群状态返回 ...

  10. 为什么我觉得需要熟悉vim使用,难道仅仅是为了耍酷?

    实例说话: 使用vscode保存,有报提示信息,可以以超级用户身份重试,于是我授权root给vscode软件,却还提示失败! 而实际上,我使用cat命令发现已经写入成功了 终端内使用cat这条shel ...