Solr实现Low Level查询解析（QParser）

Solr基于Lucene提供了方便的查询解析和搜索服务器的功能，可以以插件的方式集成，非常容易的扩展我们自己需要的查询解析方式。其中，Solr内置了一些QParser，对一些没有特殊要求的应用来说，可以直接使用这些查询解析组件，而无需做任何修改，只需要了解这些查询解析组件提供的基本参数（Local Params），就可以实现强大的搜索功能。

对于Solr来说，它的设计目标就是尽可能屏蔽底层Lucene的复杂度和难点，而是通过提供可配置的方式来实现全文检索。我们标题所说的Low Level是指，在Solr里面直接使用Lucene的查询语法，来构造满足需要的查询，例如：+(title:solr) +(+(title:lucene content:Hadoop) (title:search))，这样的话，你应该了解Lucene的查询语法。因为在实际应用中，完全使用Solr自带一些QParser可能不能够达到我们的目的，比如，你在对数据进行索引，索引时使用了词典的方式进行分词，词典中出现的一些关键词很可能是与用户交互设计中内容相关的（如搜索某个关键词，向用户推荐一些向关键词），那么，在前端需要将某些关键词进行某种组合，提交到后端进行解析搜索。在后端，就会存在一个专门的查询解析组件（在Solr中成为QParser，可以扩展），最终将解析成Lucene识别的“语言”，从而进行索引搜索，返回搜索结果。

下面是一个简单的例子：

用户搜索“北京”，我需要提供相关的一组同义关键词：“北平”、”首都“、”京城“、”京都“；而此时，与”北京“相关的一组关键词：”首都博物馆“、”故宫“、”天坛“、”八达岭长城“，其中”首博“是”首都博物馆“的同义词；我们需要实现的是，当用户搜索”北京“时，对其进行同义词扩展搜索（这个在Solr里面可以直接使用同义词Analyzer），但是当用户点击这组相关关键词时，需要进行扩展，比如点击”首都博物馆“进行搜索，这时扩展搜索Lucene能够解析的形式为：

+((title:北京 content:北京) (title:北平 content:北平) (title:首都 content:首都) (title:京城 content:京城) (title:京都 content:京都)) +((title:首都博物馆 content:首都博物馆) (title:首博 content:首博))

实际上，如果直接使用Lucene，可能会比较容易的多，只需要根据分词词典中具有的Term（存在于索引中），构造满足实际需要的Query即可实现搜索。但是，在Solr里面，将构造查询解析的逻辑移到了QParser中，基于QParserPlugin可以很好地使用Solr提供的一些基础组件和附加组件，并且，这些自定义组件都是基于solrconfig.xml来进行配置的，比较灵活。

当然，Solr提供了一个QParserPlugin插件，核心查询解析在LuceneQParser中实现，是一个相对Low Level的组件，只需要在solrconfig.xml中配置好相应的requestHandler即可，实例如下：

    <queryParser name="lucene" class="org.apache.solr.search.LuceneQParserPlugin"/>

    <requestHandler name="/lucene" class="solr.SearchHandler">

      <lst name="defaults">

        <str name="defType">lucene</str>

        <str name="bf">recip(ms(NOW,publishDate),3.16e-13,1,1)</str>

        <str name="qf">title^1.50 content</str>  

        <bool name="hl">true</bool>

        <str name="hl.fl">title content</str>

        <int name="hl.fragsize">100</int>

        <int name="hl.snippets">3</int>  

        <str name="fl">*,score</str>

        <str name="qt">standard</str>

        <str name="wt">standard</str>

        <str name="version">2.2</str>

        <str name="echoParams">explicit</str>

        <str name="indent">true</str>

        <str name="debugQuery">on</str>

        <str name="explainOther">on</str>

      </lst>

    </requestHandler>

启动Solr搜索服务器（如，部署在tomcat容器中），如果你直接输入上述Lucene能够识别的Query字符串：

http://192.168.9.171:8080/solr/core3/lucene/?q=+((title:北京 content:北京) (title:北平 content:北平) (title:首都 content:首都) (title:京城 content:京城) (title:京都 content:京都)) +((title:首都博物馆 content:首都博物馆) (title:首博 content:首博))&start=&rows=

查询的各个关键词会解析为OR运算，并非我们的设计意图，如果需要的话，可以修改LuceneQParser，将其中的”+“解析成MUST，才能按实际需要搜索。

Solr实现Low Level查询解析（QParser）的更多相关文章

Solr Dismax查询解析器-深入分析
Solr 支持多种查询解析,给搜索引擎开发人员提供灵活的查询解析.Solr 中主要包含这几个查询解析器:标准查询解析器.DisMax 查询解析器,扩展 DisMax 查询解析器(eDisMax) Di ...
solr 查询解析器
定义查询解析器用于将查询语句(q参数)解析成搜索语法. 默认解析器:lucene Solr在查询的时候,用到了QueryParser对用户输入做解析,solr默认使用的解析器是lucene,被称之为 ...
Solr搜索解析及查询解析器用法概述
一.简介大多数查询都使用了标准的Solr语法.这种语法是Solr最常见的,由默认查询解析器负责处理.Solr的默认查询解析器是Lucene查询解析器[LuceneQParserPlugin类实现] ...
Solr查询配置及优化【eDisMax查询解析器】
一.简介 Lucene查询解析器语法支持创建任意复杂的布尔查询,但还有一些缺点,它不是用户查询处理的理想解决方案.这里面最大的问题是Lucene查询解析器的语法要求严格,一旦破坏就会抛出异常.指望用户 ...
使用Java Low Level REST Client操作elasticsearch
Java REST客户端有两种风格: Java低级别REST客户端(Java Low Level REST Client,以后都简称低级客户端算了,难得码字):Elasticsearch的官方low- ...
Elasticsearch java api操作（一）（Java Low Level Rest Client）
一.说明: 一.Elasticsearch提供了两个JAVA REST Client版本: 1.java low level rest client: 低级别的rest客户端,通过http与集群交互, ...
C++ Low level performance optimize 2
C++ Low level performance optimize 2 上一篇文章讨论了一些底层代码的优化技巧,本文继续讨论一些相关的内容. 首先,上一篇文章讨论cache missing的重要性 ...
C++ Low level performance optimize
C++ Low level performance optimize 1. May I have 1 bit ? 下面两段代码,哪一个占用空间更少,那个速度更快?思考10秒再继续往下看:) //v1 ...
zabbix监控redis多实例（low level discovery）
对于多实例部署的tomcat.redis等应用,可以利用zabbix的low level discovery功能来实现监控,减少重复操作. 注:Zabbix版本: Zabbix 3.0.2 一.服务 ...

随机推荐

jQuery源码 Ajax模块分析
写在前面: 先讲讲ajax中的相关函数,然后结合函数功能来具体分析源代码. 相关函数: >>ajax全局事件处理程序 .ajaxStart(handler) 注册一个ajaxStart事件 ...
MySQL学习笔记八：日期/时间的处理
MySQL日期时间的处理,在其官网文档上都有详细的阐述,想了解更多的同学可自行查阅. 1.查询当前日期时间:函数有now(),localtime(),current_timestamp(),sysda ...
MySQL学习笔记五：数据类型
MySQL支持多种数据类型,大致可以分为数值,日期/时间和字符类型. 数值类型 MySQL支持所有标准SQL数值数据类型,包括严格数值数据类型(INTEGER.SMALLINT.DECIMAL和NUM ...
ORM开发之解析lambda实现group查询(附测试例子)
目的:以编程方式实现group查询,在开发ORM时,需要达到这样的效果先看一个简单的group语句 select BarCode,ProductName,COUNT(BarCode) as tota ...
IDDD 实现领域驱动设计－CQRS（命令查询职责分离）和 EDA（事件驱动架构）
上一篇:<IDDD 实现领域驱动设计-SOA.REST 和六边形架构> 阅读目录: CQRS-命令查询职责分离 EDA-事件驱动架构 Domin Event-领域事件 Long-Runni ...
构建自己的PHP框架--实现Model类(3)
在之前的博客中,我们实现并完善了Model类的findOne方法,下面我们来实现其中的其他方法. 先来看findAll方法,这个方法和findOne很相似. public static functio ...
jdk8中java.util.concurrent包分析
并发框架分类 1. Executor相关类 Interfaces. Executor is a simple standardized interface for defining custom th ...
安装最新版本的PHPUnit后，不能使用
我使用的是widows系统.本来3.7.8版本的Phpunit用的是非常顺畅的,最近重新安装phpunit,安装了最小版本,然后在使用的时候就会报很多各种错误.无奈之下只能降版本到3.7.8 首先要卸 ...
C#中DataTable转化为List<T>解析
在.net项目中使用到DataTable和List<T>集合的地方较多, 泛型的好处: 它为使用c#语言编写面向对象程序增加了极大的效力和灵活性.不会强行对值类型进行装箱和拆箱,或对引用类 ...
CompoundButton.OnCheckedChangeListener与RadioGroup.OnCheckedChangeListener冲突
当RadioGroup与CompoundButton同时存在且都要监听事件时CompoundButton.OnCheckedChangeListener与RadioGroup.OnCheckedCha ...

Solr实现Low Level查询解析（QParser）

Solr实现Low Level查询解析（QParser）

Solr实现Low Level查询解析（QParser）的更多相关文章

随机推荐

热门专题