【转载】 Searching过程粗略梳理

转载自：http://www.cnblogs.com/huangfox/archive/2012/02/09/2344686.html

solr-searching过程分析（一）

——searching过程粗略梳理

下午看了一会solr的启动过程，往细的看相当繁琐。换个头绪先看看solr的searching过程。

1.拦截请求，解析请求并构建相应的handler。

发送检索请求，例如：http://localhost:8983/solr3.5/core2/select/?q=*%3A*&version=2.2&start=0&rows=10&indent=on

首先他将被SolrDispatchFilter拦截。

doFilter(ServletRequest

 request, ServletResponse response, FilterChain chain)

通过对request的分析，获知当前request是做什么的（/select），并构造相应的handler（SearchHandler）。

2.SolrCore出面处理上层工作（具体工作交由handler处理）

将handler、SolrQueryRequest、SolrQueryResponse交由solrCore的execute方法处理

public void

execute(SolrRequestHandler

 handler, SolrQueryRequest req, SolrQueryResponse rsp)

在该方法中主要还是由handler来完成的。

SolrRequestHandler是一个接口，他主要的方法就是：

public void

handleRequest(SolrQueryRequest

 req, SolrQueryResponse rsp);

SolrRequestHandler的实现类的结构图如下：

其中RequestHandlerBase为大部分的Handler实现了部分功能，主要包括

public void

handleRequest(SolrQueryRequest

 req, SolrQueryResponse rsp){

　　......

　　handleRequestBody(

 req, rsp );

　　......

}

然而具体怎么做就交给具体的子类去执行了！（handleRequestBody( req, rsp );）

例如：这里是做检索，那么就交由SearchHandler处理。

（这里的设计方式有点类似于servlet，GenericSerlet实现了一些公用方法，而具体的则有其子类完成，例如HttpServlet）

3.SearchHandler具体的检索过程

现在的检索没有使用shards，在跟踪代码的过程中，发现以下过程是检索的主要环节。

if

(!rb.isDebug())

 {

//

 Process

for

(

 SearchComponent c : components ) {

<strong>

 c.process(rb);</strong>

}

从中可知真正的检索需要经过多个SearchComponent，在当前的实验环境下包括6个，如下：

4.各个SearchComponent配合工作完成检索

我们先重点了解QueryComponent。

获得SolrIndexSearcher，这个对象是检索的主要执行者。

同时获取SolrIndexSearcher.QueryCommand、SolrIndexSearcher.QueryResult，并将其作为查询条件和查询结果提交给SolrIndexSearcher进行检索。

searcher.search(result,cmd);

在SolrIndexSearcher中search方法如下：

public

QueryResult

 search(QueryResult qr, QueryCommand cmd)

throws

IOException

 {

<strong>getDocListC(qr,cmd);</strong>

return qr;

}

getDocListC又是一个比较复杂的方法，在这里加入的cache。

如果当前检索被缓存了（缓存也是个重点内容，后续详细分析！），那么直接返回结果，否则重新进行检索，检索的方法是：

private void

getDocListNC(QueryResult

 qr,QueryCommand cmd)

在该方法中，和我们使用lucene进行检索十分相似，采用的具体方法是：

super

.search(query,

 luceneFilter, collector);

检索完成将结果进行封装，放入QueryResult当中。

qr.setDocList(new DocSlice(0,sliceLen,ids,scores,totalHits,maxScore));

检索完成后，将结果放入缓存中，“造福后人”！

至此QueryComponent的工作就算完成了。

如果做简单查询（如：http://localhost:8983/solr3.5/core2/select/?q=*%3A*&version=2.2&start=0&rows=10&indent=on）

那么后面5个Component就直接过了（没有真正被执行）。

5.收尾工作

将结果封装好，写入相应的ResponseHeaders，关闭SolrQueryRequest、solrCore。

-----------------------------------------------------

以上是solr-searching最粗略的过程，本着先脉络后细节的思想，以后再对各个重要环节做深入分析。

searching主要执行方法如下：

SolrDispatchFilter（doFilter,execute）

->SolrCore(execute)

->RequestHandlerBase(handleRequest)

->SearchHandler(handleRequestBody) //有可能执行多个Component

->QueryComponent(process)

->SolrIndexSearcher(search,getDocListC)

【转载】 Searching过程粗略梳理的更多相关文章

【转载】 Searching过程粗略梳理分类： H4_SOLR/LUCENCE 2014-07-25 22:59 316人阅读评论(0) 收藏
转载自:http://www.cnblogs.com/huangfox/archive/2012/02/09/2344686.html solr-searching过程分析(一) --searchin ...
OPRNGL之渲染过程大概梳理
将OPENGL绘制对象的过程类比为摄像机拍摄物体的过程视图变换:对摄像机位置与朝向(还有朝上朝下)进行定义模型变换:对物体的位置,旋转,缩放进行定义以上是对摄像机和物体的两个基础定义投影:对摄 ...
转载：XGBOOST算法梳理
学习内容: CART树算法原理损失函数分裂结点算法正则化对缺失值处理优缺点应用场景 sklearn参数转自:https://zhuanlan.zhihu.com/p/58221959 ...
转载：GBDT算法梳理
学习内容: 前向分布算法负梯度拟合损失函数回归二分类,多分类正则化优缺点 sklearn参数应用场景转自:https://zhuanlan.zhihu.com/p/58105824 G ...
elasticsearch-1.3.0 之索引代码粗略梳理
elasticsearch-1.3.0 发送请求创建 [root@centos ~]# curl -XPUT 172.16.136.159:9200/customer?pretty { " ...
Zookeeper 3.4.6 Client端流程粗略梳理
首先从Zookeeper入手,Zookeeper-->ClientCnxn-->sendThread/eventThread public ZooKeeper(String connect ...
zookeeper 3.4.6启动流程粗略梳理
zookeeper 3.4.6 启动脚本里面 nohup "$JAVA" "-Dzookeeper.log.dir=${ZOO_LOG_DIR}" " ...
IPsec传输模式下ESP报文的装包和拆包过程
原创文章,拒绝转载装包过程总体流程图过程描述在原IP报文中找到TCP报文部分,在其后添加相应的ESP trailer信息. ESP trailer 包含三部分:Padding,Pad leng ...
Hadoop2.5.2+HA+zookeeper3.4.6详细配置过程
心血之作,在熟悉hadoop2架构的过程耽误了太长时间,在搭建环境过程遇到一些问题,这些问题一直卡在那儿,不得以解决,耽误了时间.最后,千寻万寻,把问题解决,多谢在过程提供帮助的大侠.这篇文章中,我也 ...

随机推荐

【Nutch基础教程之七】Nutch的2种运行模式：local及deploy
在对nutch源代码运行ant runtime后,会创建一个runtime的目录,在runtime目录下有deploy和local 2个目录. [jediael@jediael runtime]$ l ...
在js中使用json
在js中使用json var obj = { "1" : "value1", "2" : "value2" ...
简单说pyglet.event
emitter,就是pyglet.event.EventDispatcher的子类, 负责发出事件的消息,并且规定了响应消息的函数名. class Consumer(pyglet.event.Even ...
Scala学习笔记--xml
http://blog.csdn.net/beautygao/article/details/38497065 https://github.com/scala/scala-xml http://st ...
js 实现音乐播放
<html><head><title>这种方式支持任何浏览器</title></head><body><div id=&q ...
$(function(){})与(function($){....})(jQuery)的区别
$(function(){}); 全写为 $(docunemt).ready(function(){ }); 意义为在DOM加载完毕后执行ready()方法 (function($){....})(j ...
java.lang.NoSuchMethodError: main Exception in thread "main"
java.lang.NoSuchMethodError: main Exception in thread "main" 一般是主函数出问题检查核对一下 public stati ...
mysql 命令行自动补全
配置文件中默认关闭自动补全: [mysql] #no-auto-rehash # faster start of mysql but no tab completition 改为: [mysql] ...
ps2keyboard demo code for 8052
#pragma code symbols debug objectextend #include <reg51.h> /* special function register declar ...
《Programming WPF》翻译第6章 4.应用程序全球化
原文:<Programming WPF>翻译第6章 4.应用程序全球化如果你打算发布你的应用程序到全球各地,你可能需要为不同地区的用户界面准备不同的版本.至少,这需要解决将文本翻译成适 ...

【转载】 Searching过程粗略梳理

【转载】 Searching过程粗略梳理的更多相关文章

随机推荐

热门专题