Solr4.8.0源码分析(21)之SolrCloud的Recovery策略(二)

Solr4.8.0源码分析(21)之SolrCloud的Recovery策略(二)

题记：前文<Solr4.8.0源码分析(20)之SolrCloud的Recovery策略(一)>中提到Recovery有两种策略，一是PeerSync和Replication。本节将具体介绍下PeerSync策略。

PeeySync是Solr的优先选择策略，每当需要进行recovery了，Solr总是会先去判断是否需要进入PeerSync，只有当PeerSync被设置为跳过或者PeerSync时候发现没符合条件才会进入到Replication。这是由PeeySync的特性决定的，PeeySync是面向中断时间短，需要recovery的document个数较少时使用的策略，因此它Recovery的速度较快，对Solr的影响较小。而Replication则是对中断时间长，需要recovery数量多的情况下进行的，耗时较长。

前文已经介绍了Recovery的总体流程，那么本文就直接来介绍PeerSync的流程了，请看下图所示：

首先 Solr会向所有Replica发送getversion的请求，来获取最新的nupdate个version(默认是100个)。

     // Fire off the requests before getting our own recent updates (for better concurrency)

     // This also allows us to avoid getting updates we don't need... if we got our updates and then got their updates, they would

     // have newer stuff that we also had (assuming updates are going on and are being forwarded).

     for (String replica : replicas) {

       requestVersions(replica);

     }

   private void requestVersions(String replica) {

     SyncShardRequest sreq = new SyncShardRequest();

     sreq.purpose = 1;

     sreq.shards = new String[]{replica};

     sreq.actualShards = sreq.shards;

     sreq.params = new ModifiableSolrParams();

     sreq.params.set("qt","/get");

     sreq.params.set("distrib",false);

     sreq.params.set("getVersions",nUpdates);

     shardHandler.submit(sreq, replica, sreq.params);

   }

获取本分片最新的nupdate个version(默认是100个)，并对这些version进行排序。

     recentUpdates = ulog.getRecentUpdates();

     try {

       ourUpdates = recentUpdates.getVersions(nUpdates);

     } finally {

       recentUpdates.close();

     }

     Collections.sort(ourUpdates, absComparator);

获取recovery之前的version信息startingversions。通过比较startingversions与ourUpdates可以来比较recovery期间是否有索引更新。
检查ourUpdates和startingversions是否有交集，由于ourUpdates和startingversions的version个数是限制为nUpdates的，也就是判断索引更新的个数是否大于nUpdate。如果需要更新的索引太多即ourUpdates和startingversions无交集，则进入Replication。

       // now make sure that the starting updates overlap our updates

       // there shouldn't be reorders, so any overlap will do.

       long smallestNewUpdate = Math.abs(ourUpdates.get(ourUpdates.size()-1));

       if (Math.abs(startingVersions.get(0)) < smallestNewUpdate) {

         log.warn(msg() + "too many updates received since start - startingUpdates no longer overlaps with our currentUpdates");

         return false;

       }

如果ourUpdates和startingversions有交集，则合并两个列表，即求并集。

       // let's merge the lists

       List<Long> newList = new ArrayList<>(ourUpdates);

       for (Long ver : startingVersions) {

         if (Math.abs(ver) < smallestNewUpdate) {

           newList.add(ver);

         }

       }

       ourUpdates = newList;

本分片的version比别的分片低，则进入Replication策略。这里进行分片version的比较，并没有按version的最大或者最小值，而是比较0.8和0.2比例处的version。

     long otherHigh = percentile(otherVersions, .2f);

     long otherLow = percentile(otherVersions, .8f);

     if (ourHighThreshold < otherLow) {

       // Small overlap between version windows and ours is older

       // This means that we might miss updates if we attempted to use this method.

       // Since there exists just one replica that is so much newer, we must

       // fail the sync.

       log.info(msg() + " Our versions are too old. ourHighThreshold="+ourHighThreshold + " otherLowThreshold="+otherLow);

       return false;

     }

如果本分片的version比其他分片高，则说明不需要进行recovery直接退出peersync。

     if (ourLowThreshold > otherHigh) {

       // Small overlap between windows and ours is newer.

       // Using this list to sync would result in requesting/replaying results we don't need

       // and possibly bringing deleted docs back to life.

       log.info(msg() + " Our versions are newer. ourLowThreshold="+ourLowThreshold + " otherHigh="+otherHigh);

       return true;

     }

对本分片的version和其他分片的version求差，获取本分片缺少的version。

     for (Long otherVersion : otherVersions) {

       // stop when the entries get old enough that reorders may lead us to see updates we don't need

       if (!completeList && Math.abs(otherVersion) < ourLowThreshold) break;

       if (ourUpdateSet.contains(otherVersion) || requestedUpdateSet.contains(otherVersion)) {

         // we either have this update, or already requested it

         // TODO: what if the shard we previously requested this from returns failure (because it goes

         // down)

         continue;

       }

       toRequest.add(otherVersion);

       requestedUpdateSet.add(otherVersion);

     }

最后向其他分片发送getupdate命令，根据处理后的version获取相应的document，至此完成peersync过程

   private boolean requestUpdates(ShardResponse srsp, List<Long> toRequest) {

     String replica = srsp.getShardRequest().shards[0];

     log.info(msg() + "Requesting updates from " + replica + "n=" + toRequest.size() + " versions=" + toRequest);

     // reuse our original request object

     ShardRequest sreq = srsp.getShardRequest();

     sreq.purpose = 0;

     sreq.params = new ModifiableSolrParams();

     sreq.params.set("qt", "/get");

     sreq.params.set("distrib", false);

     sreq.params.set("getUpdates", StrUtils.join(toRequest, ','));

     sreq.params.set("onlyIfActive", onlyIfActive);

     sreq.responses.clear();  // needs to be zeroed for correct correlation to occur

     shardHandler.submit(sreq, sreq.shards[0], sreq.params);

     return true;

   }

总结：

本文具体介绍PeerSync的过程，由此可见PeerSync策略的recovery过程还是比较简单的，下一节将具体介绍Replication策略，这个较PeerSync复杂。

Solr4.8.0源码分析(21)之SolrCloud的Recovery策略(二)的更多相关文章

Solr4.8.0源码分析(24)之SolrCloud的Recovery策略(五)
Solr4.8.0源码分析(24)之SolrCloud的Recovery策略(五) 题记:关于SolrCloud的Recovery策略已经写了四篇了,这篇应该是系统介绍Recovery策略的最后一篇了 ...
Solr4.8.0源码分析(23)之SolrCloud的Recovery策略(四)
Solr4.8.0源码分析(23)之SolrCloud的Recovery策略(四) 题记:本来计划的SolrCloud的Recovery策略的文章是3篇的,但是没想到Recovery的内容蛮多的,前面 ...
Solr4.8.0源码分析(22)之SolrCloud的Recovery策略(三)
Solr4.8.0源码分析(22)之SolrCloud的Recovery策略(三) 本文是SolrCloud的Recovery策略系列的第三篇文章,前面两篇主要介绍了Recovery的总体流程,以及P ...
Solr4.8.0源码分析(20)之SolrCloud的Recovery策略(一)
Solr4.8.0源码分析(20)之SolrCloud的Recovery策略(一) 题记: 我们在使用SolrCloud中会经常发现会有备份的shard出现状态Recoverying,这就表明Solr ...
Solr4.8.0源码分析(25)之SolrCloud的Split流程
Solr4.8.0源码分析(25)之SolrCloud的Split流程(一) 题记:昨天有位网友问我SolrCloud的split的机制是如何的,这个还真不知道,所以今天抽空去看了Split的原理,大 ...
Solr4.8.0源码分析(14)之SolrCloud索引深入(1)
Solr4.8.0源码分析(14) 之 SolrCloud索引深入(1) 上一章节<Solr In Action 笔记(4) 之 SolrCloud分布式索引基础>简要学习了SolrClo ...
Solr4.8.0源码分析(15) 之 SolrCloud索引深入(2)
Solr4.8.0源码分析(15) 之 SolrCloud索引深入(2) 上一节主要介绍了SolrCloud分布式索引的整体流程图以及索引链的实现,那么本节开始将分别介绍三个索引过程即LogUpdat ...
Solr4.8.0源码分析(17)之SolrCloud索引深入(4)
Solr4.8.0源码分析(17)之SolrCloud索引深入(4) 前面几节以add为例已经介绍了solrcloud索引链建索引的三步过程,delete以及deletebyquery跟add过程大同 ...
Solr4.8.0源码分析(16)之SolrCloud索引深入(3)
Solr4.8.0源码分析(16)之SolrCloud索引深入(3) 前面两节学习了SolrCloud索引过程以及索引链的前两步,LogUpdateProcessorFactory和Distribut ...

随机推荐

oracle REPLACE 函数介绍
oracle REPLACE 函数是用另外一个值来替代串中的某个值. 例如,可以用一个匹配数字来替代字母的每一次出现.REPLACE 的格式如下所示: REPLACE ( char, search_s ...
Mina学习之Codec Filter
为何要使用Codec Filter 1. 任何一个网络应用程序接受到消息后,都需要知道消息的开头和结束. 2. 你可以把协议解析的部分放在IoHandler,但这样就会造成业务代码和协议解析代码混淆在 ...
【Android - MD】之CardView的使用
CardView是Android 5.0新特性--Material Design中的一个布局控件,可以通过属性设置显示一个圆角的类似卡片的视图. 1.CardView的属性: app:cardCorn ...
POJ3723 Conscription
http://poj.org/problem?id=3723 这题虽然简单,但是还是错了很多次. 因为这题构建的图可能是不连通的.也就是说可能有很多棵树. 所以我以前写的并查集用在这上面会出问题的. ...
js获取键盘的keyCode-------Day42
济南今天是大雨倾盆啊,这闷热一扫而空,只是有些电闪雷鸣的,原想在公司里就完毕今天的博客记录的,只是不知道为什么怎么也登不上博客,预计是CSDN当时的server出问题了吧,好在到了晚上,这雷声小了也少 ...
基于xmpp openfire smack开发之openfire介绍和部署[1]
前言 http://blog.csdn.net/shimiso/article/details/8816558 Java领域的即时通信的解决方案可以考虑openfire+spark+smack.当然也 ...
JWS-webservice 与Axis2-webservice的高速实现
在详细介绍这两种框架下的webservice之前,先跟大家交流一下SOA认识,也就是面向服务的体系结构.SOA所要解决的主要问题是在现有基础环境的前提下,通过对现有应用程序和基础结构进行又一次的组合以 ...
iOS--RunLoop原理介绍
什么是RunLoop RunLoop从字面上看是运行循环的意思,这一点也不错,它确实就是一个循环的概念,或者准确的说是线程中的循环. 本文一开始就提到有些程序是一个圈,这个圈本质上就是这里的所谓的Ru ...
IOS-AssetsLibrary(相册)框架介绍
AssetsLibrary框架介绍: AssetsLibrary框架包含了ALAssetsLibrary,ALAssetsGroup,ALAsset,ALAssetsFilter,ALAssetRep ...
剑指offer: 38 数字在排序数组中出现的次数
题目描述统计一个数字在排序数组中出现的次数.例如输入排序数组{1,2,3,3,3,3,4,5} 和数字3,输出4. 思路如下 1. 预估时间复杂度,最复杂情况是,顺序扫描,统计K出现的次数,时间复杂 ...

Solr4.8.0源码分析(21)之SolrCloud的Recovery策略(二)

Solr4.8.0源码分析(21)之SolrCloud的Recovery策略(二)

总结：

Solr4.8.0源码分析(21)之SolrCloud的Recovery策略(二)的更多相关文章

随机推荐

热门专题