Solr查询过程源码分析
原文出自:http://blog.csdn.net/flyingpig4/article/details/6305488
<pre name="code" class="java">SearchHandler.handleRequestBody():
solr搜索主流程
1.调用:RequestHandlerBase
|--handleRequest(req, rsp);
2.源码分析:
|-prepare() |前期的请求参数准备工作,QueryComponent可以在schemal文件中设置,易扩展
|-- SearchComponent c : components
|--queryComponent.prepare()
|--FQ,FL,SHARDS,Q.SHARDS.ROWS,SHARDS.START |设置查询的条件,包括分片的查询条件
|--设置fieldFlags返回的field值
|--设置defType值 |默认lucene,实际指向的是lucenePlugin,可在schema文件中扩展
|--解析QueryParser |对queryString进行解析
|--解析fq过滤值,生成filter过滤query集
|--设定shards分片信息
|--statComponent.prepare()
|--debugComponent.prepare()
|--process() |单组无shard情况处理
|--String ids = params.get(ShardParams.IDS); |获取shardDoc的id集合,不为空往下执行
|--通过ids获取文档id的集合,并为下一步获取DocList做准备
|--int id = req.getSearcher().getFirstMatch(
|--new Term(idField.getName(), idField.getType().toInternal(idArr.get(i))));
|-- luceneIds[docs++] = id;
|-- res.docList = new DocSlice(0, docs, luceneIds, null, docs, 0);
|--if (rb.isNeedDocSet()) 存在DocSet需求
|--queries.add(rb.getQuery()); |queryString的查询条件
|--queries.addAll(filters); |filter查询条件
|--res.docSet = searcher.getDocSet(queries); |通过queries条件进行DocSet查询
|--rb.setResults(res); |设置结果返回值
|--rsp.add("response",rb.getResults().docList);
|--return; |获取结果集后返回
|--SolrIndexSearcher.QueryCommand cmd = rb.getQueryCommand(); |获取查询封装的QueryCommand对象
|--searcher.search(result,cmd);
|--getDocListC(qr,cmd);
|--rb.setResult( result ); |与上同
|--rsp.add("response",rb.getResults().docList);
|--boolean fsv = req.getParams().getBool(ResponseBuilder.FIELD_SORT_VALUES,false); |设定fsv,用于排序字段处理
|--SortField[] sortFields |获取排序的域
|--Field field = new Field("dummy", "", Field.Store.YES, Field.Index.NO); // 仿冒域
|--SolrIndexReader[] readers = reader.getLeafReaders(); |获取所有的IndexReader结点
|--if (readers.length==1) subReader = readers[0]; |直接处理
|--for (SortField sortField: sortFields) |循环处理各个排序域
|--FieldComparator comparators[] = (readers==null) ? null : new FieldComparator[readers.length]; |声明域比较器
|--DocIterator it = rb.getResults().docList.iterator(); |过滤docList集合
|--while(it.hasNext())
|--int doc = it.nextDoc();
|--idx = SolrIndexReader.readerIndex(doc, offsets); |获取id所在的Indexreader
|--comparator.copy(0, doc);
|--Object val = comparator.value(0); |获取comparator的value值
|-- vals.add(val); |添加至vals当中
|--sortVals.add(fieldname, vals); |添加至排序值当中
|--rsp.add("sort_values", sortVals); |设置响应对象Response的sort_values的排序值
|--process() |多组shard处理
|--初始化操作
|-- HttpCommComponent comm = new HttpCommComponent();
|-- rb.outgoing = new LinkedList<ShardRequest>();
|-- rb.finished = new ArrayList<ShardRequest>();
|--while (nextStage != Integer.MAX_VALUE) |循环执行,设置stage状态
|-- for( SearchComponent c : components ) {
|--nextStage = Math.min(nextStage, c.distributedProcess(rb)); |distributedProcess(rb)根据rb的stage状态做处理
|-- while (rb.outgoing.size() > 0)
|--while (rb.outgoing.size() > 0)
|--ShardRequest sreq = rb.outgoing.remove(0); |取第一个请求值
|--for (String shard : sreq.actualShards)
|--ModifiableSolrParams params = new ModifiableSolrParams(sreq.params); |设置参数
|--comm.submit(sreq, shard, params); |提交http请求,执行一个Task任务,获取Response响应
|--while (rb.outgoing.size() == 0)
|--ShardResponse srsp = comm.takeCompletedOrError(); |获取响应
|--rb.finished.add(srsp.getShardRequest()); |完成此次搜索
|--for(SearchComponent c : components) |完成返回的Response的处理
|--c.handleResponses(rb, srsp.getShardRequest());
|-- for(SearchComponent c : components)
|-- c.finishStage(rb); |rb请求响应完成处理
|--SolrIndexSearcher.getDocSet(List<query>)
|--if (queries.size()==1) return getDocSet(queries.get(0)) |Query集合为1则直接处理
|--for (int i=0; i<sets.length; i++) |集合存在多个query,且query可能为not查询
|--Query q = queries.get(i); |取到第i个query
|--Query posQuery = QueryUtils.getAbs(q); |如果为negative,则为not,则返回相应的补集
|--sets[i] = getPositiveDocSet(posQuery); |查询query获取DocSet集合
|--if (q==posQuery) |判断是否为negative
|--nge[i] = false; |为后续判断
|--answer = sets[i]; |是postivi查询设置返回的answer值
|--neg[i] = true; |否则为正向
|--if(answer == null) answer = getPositiveDocSet(matchAllDocsQuery); |如果answer为空,则无positive query
|--for (int i=0; i<sets.length; i++)
|-- if (neg[i]) answer = answer.andNot(sets[i]); |合并negative查询的answer结果集,并取补集
for (int i=0; i<sets.length; i++)
|-- if (!neg[i] && i!=smallestIndex)
|--answer = answer.intersection(sets[i]); |--循环set集合,取交集生成新的DocSet,详见HashDocSet
|--return answer;
|--SolrIndexSearcher.getPositiveDocSet(Query q)
|--if (filterCache != null)
|--answer = (DocSet)filterCache.get(q);
|--else
|--answer = getDocSetNC(q,null); |normal way to get DocSet
|--if (filterCache != null) filterCache.put(q,answer);
|保存至filterCache当中
|--getDocListC(QueryResult qr, QueryCommand cmd) |通过QueryCommmand进行查找
|--if (queryResultCache != null && cmd.getFilter()==null) |从queryResultCache中进行查找
|--key = new QueryResultKey(cmd.getQuery(), cmd.getFilterList(), cmd.getSort(), cmd.getFlags()); |计算key值
|--if ((cmd.getFlags() & NO_CHECK_QCACHE)==0)
|--superset = (DocList)queryResultCache.get(key); |从cache中取出DocList集合
|--out.docList = superset.subset(cmd.getOffset(),cmd.getLen()); |如果子集合不为空
|--if (out.docSet==null && ((cmd.getFlags() & GET_DOCSET)!=0) )
|--if (cmd.getFilterList()==null) |如果filter为null,则直接查询
|--out.docSet = getDocSet(cmd.getQuery()); |获取DocSet集合
|--else
|--newList.addAll(cmd.getFilterList()); |添加filterList的Doc集合
|--out.docSet = getDocSet(newList); |获取DocSet集合
|--return ;查询完成返回
|--boolean useFilterCache=false; |检查是否需要filterCache
|--for (SortField sf : sfields) |如果存在SortField,则返回false
|--if (sf.getType() == SortField.SCORE)
|--useFilterCache=false;
|--break;
|--if(useFilterCache)
|--if (out.docSet == null) |获取真实的DocSet集合
|--out.docSet = getDocSet(cmd.getQuery(),cmd.getFilter());
|--DocSet bigFilt = getDocSet(cmd.getFilterList());
|--if (bigFilt != null) out.docSet = out.docSet.intersection(bigFilt);
|--superset = sortDocSet(out.docSet,cmd.getSort(),supersetMaxDoc); |取出子的设定的返回Doc
|--out.docList = superset.subset(cmd.getOffset(),cmd.getLen()); |设置docList
|--else |此时无任何缓存,为正常处理模式
|--if ((cmd.getFlags() & GET_DOCSET)!=0)
|--DocSet qDocSet = getDocListAndSetNC(qr,cmd);
|--else
|--getDocListNC(qr,cmd);
|--superset = out.docList;
|--out.docList = superset.subset(cmd.getOffset(),cmd.getLen());
|--if (key != null && superset.size() <= queryResultMaxDocsCached && !qr.isPartialResults()) |设置是否需要设置queryResultCache
|--queryResultCache.put(key, superset);
|--getDocListAndSetNC(QueryResult qr,QueryCommand cmd)
|--DocSet filter = cmd.getFilter()!=null ? cmd.getFilter() : getDocSet(cmd.getFilterList()); |获取filter过滤信息
|--Query query = QueryUtils.makeQueryable(cmd.getQuery()); |设定query为positive的Query条件
|--final Filter luceneFilter = filter==null ? null : filter.getTopFilter();
|--if (lastDocRequested<=0)
|--if (!needScores) |是否需要打分
|--collector = setCollector = new DocSetCollector(smallSetSize, maxDoc);
|--else
|--collector = setCollector = new DocSetDelegateCollector(smallSetSize, maxDoc, new Collector()
|--super.search(query, luceneFilter, collector); |执行查询条件,获取collector信息,前面操作均为构造查询条件,并作相应的缓存的存取处理
|--set = setCollector.getDocSet();
|--else
|--处理过程与上类似,但参数设置不同,如下
|--totalHits = topCollector.getTotalHits();
|--TopDocs topDocs = topCollector.topDocs(0, len);
|--ids[i] = scoreDoc.doc;
|--qr.setDocList(new DocSlice(0,sliceLen,ids,scores,totalHits,maxScore));
|--qr.setDocSet(set);
|--return filter==null ? qr.getDocSet() : null;
</pre><br>
Solr查询过程源码分析的更多相关文章
- Mybatis执行流程源码分析
第一部分:项目结构 user_info表:只有id和username两个字段 User实体类: public class User { private String username; private ...
- Android系统默认Home应用程序(Launcher)的启动过程源码分析
在前面一篇文章中,我们分析了Android系统在启动时安装应用程序的过程,这些应用程序安装好之后,还须要有一个Home应用程序来负责把它们在桌面上展示出来,在Android系统中,这个默认的Home应 ...
- [Android]从Launcher开始启动App流程源码分析
以下内容为原创,欢迎转载,转载请注明 来自天天博客:http://www.cnblogs.com/tiantianbyconan/p/5017056.html 从Launcher开始启动App流程源码 ...
- [Android]Android系统启动流程源码分析
以下内容为原创,欢迎转载,转载请注明 来自天天博客:http://www.cnblogs.com/tiantianbyconan/p/5013863.html Android系统启动流程源码分析 首先 ...
- Android Content Provider的启动过程源码分析
本文參考Android应用程序组件Content Provider的启动过程源码分析http://blog.csdn.net/luoshengyang/article/details/6963418和 ...
- Android应用程序绑定服务(bindService)的过程源码分析
Android应用程序组件Service与Activity一样,既能够在新的进程中启动,也能够在应用程序进程内部启动:前面我们已经分析了在新的进程中启动Service的过程,本文将要介绍在应用程序内部 ...
- Spring加载流程源码分析03【refresh】
前面两篇文章分析了super(this)和setConfigLocations(configLocations)的源代码,本文来分析下refresh的源码, Spring加载流程源码分析01[su ...
- 【高速接口-RapidIO】5、Xilinx RapidIO核例子工程源码分析
提示:本文的所有图片如果不清晰,请在浏览器的新建标签中打开或保存到本地打开 一.软件平台与硬件平台 软件平台: 操作系统:Windows 8.1 64-bit 开发套件:Vivado2015.4.2 ...
- 转:Spring与Mybatis整合的MapperScannerConfigurer处理过程源码分析
原文地址:Spring与Mybatis整合的MapperScannerConfigurer处理过程源码分析 前言 本文将分析mybatis与spring整合的MapperScannerConfigur ...
随机推荐
- Linux 下spark安装
一.安装前提: 1.java环境(jdk1.8) 2.scala环境(2.0) 3.python 环境(3.5) :注如果使用pyspark的话,这个才是必须的. 二.spark安装 在官网下载安装 ...
- 机器人研发十大热门编程语言:不死 Java、不朽 C/C ++、新贵 Python
流水的编程语言,铁打的 Java.C/C++. 进行人工智能机器人研发,应该选择哪种编程语言? 这是很多机器人专家在自身的职业生涯中都会存在的一个入门级思考.毕竟,在学习一门编程语言时,需要花费大量的 ...
- bzoj 4555 求和
求 $\sum\limits_{i=0}^n\sum\limits_{j=0}^n Stirling2(i,j) \times 2^j \times j!$ $n \leq 100000$ sol: ...
- 给UIButton设置阴影及动画组
//设置“开启旅程”按钮 UIButton *startBtn = self.startBtn; CGFloat btnW = ; CGFloat btnH = ; CGFloat btnX = (s ...
- 常用DNS列表(电信、网通)
电信 DNS 列表 -- 共 32 条 (按拼音排序) 电信 A安徽 202.102.192.68 202.102.199.68 电信 A澳门 202.175.3.8 202.175.3.3 ...
- 关于android开发环境中sdk和adt更新到22.6之后多了appcompat_v7
昨天我打开Eclipse更新了一下sdk和adt到22.6,更新一切都很顺利,很开心的样子,可以新建一个工程时发现多了一个appcompat_v7这个东西,一下子就把小编怔住了,后来才发现这是官方的一 ...
- etcd服务端和客户端安装
下载地址: 服务端:http://download.csdn.net/download/wuxun1997/9841277 客户端:http://download.csdn.net/download/ ...
- Java基础知识复习(二)
Java 重写(Override)与重载(Overload) 重写 是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变,属于编译时多态.即外壳不变,核心重写! 重写的好处在于子 ...
- Python--urllib3库
Urllib3是一个功能强大,条理清晰,用于HTTP客户端的Python库,许多Python的原生系统已经开始使用urllib3.Urllib3提供了很多python标准库里所没有的重要特性: 1 ...
- bootstrap 设置表格固定宽度 内容换行
在项目中开发的时候用的bootstrap,但是有些表格的内容 会显示的很长 那么我第一时间想到的就是 修改td或者th的width,但是我设置了 之后不起作用 于是百度找到了解决方法: 学习源头: h ...