solr 查询解析器
定义
查询解析器用于将查询语句(q参数)解析成搜索语法。
默认解析器:lucene
Solr在查询的时候,用到了QueryParser对用户输入做解析,solr默认使用的解析器是lucene,被称之为Standard Query Parser。Standard Query Parser支持原生的查询语法,使你可以方便地构造结构化查询语句。当然,它还有不好的,就是容错比较差,总是把错误抛出来,而不是像dismax一样消化掉。
DisMax解析器
DisMax query parser接口很像Solr的standard request handler,这使得它能轻松适应大多数应用场景。它有简单的语法规则,很少抛出异常给用户。
DisMax query parser支持一部分Lucene QueryParser语法,在Lucene中,双引号表示短语查询,+/-表示必须出现和不要出现。DisMax查询能自动优化用户的输入,作为一个Solr管理员,你还可以设置boosting函数,进行boosting查询,通过一些过滤方法人工干预查询结果。你可以在solrconfig.xml中指定,也可以在URL中指定来覆盖solrconfig.xml中的配置。
DisMax 参数
除了通用的查询参数,DisMax还有一些自有的查询参数,你可以在solrconfig.xml中配置这些参数,或者在查询的时候指定,这样会覆盖之前配置的值。
|
参数 |
描述 |
|
q |
查询参数q |
|
q.alt |
如果参数q没有指定,就使用standard query parser并代替参数q |
|
qf |
Query Fields:在哪些字段上去检索数据。如果不指定的话,使用df |
|
mm |
Minimum Match:指定最小匹配因子 |
|
pf |
Phrase Fields:增加文档的得分如果q参数值离的很近 |
|
ps |
Phrase Slop:指定q参数中两个词可以距离多远 |
|
qs |
Query Phrase Slop:指定q参数中两个词可以距离多远,与qf搭配使用 |
|
tie |
Tie Breaker:使用一个0到1之间的浮点数 |
|
bq |
Boost Query:指定一个额外因素来增加匹配到的文档的得分 |
|
bf |
Boost Functions:指定boosts使用的函数 |
使用StandardRequestHandler查询"video"
http://localhost:8983/solr/select?q=video&fl=name+score
已经配置了查询字段:text、features、name、id、manu、cat。而且匹配上name和cat会有更高的得分
http://localhost:8983/solr/select?defType=dismax&q=video
可以将score显示出来,看一下各个文档的得分
http://localhost:8983/solr/select?defType=dismax&q=video&fl=*,score
现在想设置features有更高的得分,而text有较低的得分
http://localhost:8983/solr/select?defType=dismax&q=video&qf=features^20.0+text^0.3
现在希望某一字段在满足某一情况下有更高的得分
http://localhost:8983/solr/select?defType=dismax&q=video&bq=cat:electronics^5.0
现在想使用有另外一个为instock的handler,它配置了一个过滤器:inStock:true
http://localhost:8983/solr/select?defType=dismax&q=video&qt=instock&fl=name,score,inStock
如果查询短语的单词是一个或者两个,原则上返回的结果中必须包含全部单词,但是你的查询短语很长,solr允许有单词不匹配。你可以通过mm参数设置最多有多少单词不匹配。
http://localhost:8983/solr/select?defType=dismax&q=belkin+ipod+gibberish
可以通过调试功能验证你的想法。
http://localhost:8983/solr/select?defType=dismax&q=belkin+ipod+gibberish&debugQuery=true
eDisMax
Extended DisMax
|
参数 |
说明 |
|
mm.autoRelax |
如果设置为true,可以使mm参数暂时失效:比如stopwords和fq可能会使查询结果为空 |
|
boost |
对于匹配的文档,越多的字符串匹配将会取得更高的得分 |
|
lowercaseOperators |
这个参数可以用来指示是否把or和and当做OR和AND处理 |
|
ps |
短语查询时,默认的溢出量amount of slop,用来影响boosting |
|
pf2 |
指定多值的字段可选的权重 |
|
ps2 |
与pf2搭配使用,没有指定的话,使用ps |
|
pf3 |
指定多值的字段可选的权重 |
|
ps3 |
与pf3搭配使用,没有指定的话,使用ps |
|
stopwords |
布尔值,设置是否StopFilterFactory生效,设为false,则stopwords停词不起作用 |
|
uf |
设置用户可以使用那些字段检索,默认是所有字段,也就是uf=*;设置为uf=title,就是只让查询title字段;设置为uf=*-title,就是禁止查询title字段;设置为uf=-*屏蔽所有字段的检索 |
solr 查询解析器的更多相关文章
- Solr Dismax查询解析器-深入分析
Solr 支持多种查询解析,给搜索引擎开发人员提供灵活的查询解析.Solr 中主要包含这几个查询解析器:标准查询解析器.DisMax 查询解析器,扩展 DisMax 查询解析器(eDisMax) Di ...
- Solr搜索解析及查询解析器用法概述
一.简介 大多数查询都使用 了标准的Solr语法.这种语法是Solr最常见的,由默认查询解析器负责处理.Solr的默认查询解析器是Lucene查询解析器[LuceneQParserPlugin类实现] ...
- Solr查询配置及优化【eDisMax查询解析器】
一.简介 Lucene查询解析器语法支持创建任意复杂的布尔查询,但还有一些缺点,它不是用户查询处理的理想解决方案.这里面最大的问题是Lucene查询解析器的语法要求严格,一旦破坏就会抛出异常.指望用户 ...
- lucene查询解析器语法
注意:使用QueryParser查询,关键词是会被分词的,如果不需要分词,可以选择使用Lucene提供的API查询类. Lucene提供了丰富的API来组合定制你所需要的查询器,同时也可以利用Quer ...
- kotlin 写的一个简单 sql 查询解析器
package com.dx.efuwu.core import org.apache.commons.lang.StringUtils import java.sql.PreparedStateme ...
- Solr系列五:solr搜索详解(solr搜索流程介绍、查询语法及解析器详解)
一.solr搜索流程介绍 1. 前面我们已经学习过Lucene搜索的流程,让我们再来回顾一下 流程说明: 首先获取用户输入的查询串,使用查询解析器QueryParser解析查询串生成查询对象Query ...
- Solr查询语法
基于solr版本:6.0.0 当配置好本地的环境之后,就访问http://localhost:8080/solr/index.html.或者是访问已经放在服务器上的solr环境,例如http://10 ...
- Solr -- 查询语法/参数
1. 常用查询参数 参数 描述 defType 指定用于处理查询语句(参数q的内容)的查询解析器,eg:defType=lucene sort 指定响应的排序方式:升序asc或降序desc.同时需要指 ...
- Solr实现Low Level查询解析(QParser)
Solr实现Low Level查询解析(QParser) Solr基于Lucene提供了方便的查询解析和搜索服务器的功能,可以以插件的方式集成,非常容易的扩展我们自己需要的查询解析方式.其中,Solr ...
随机推荐
- 【C/C++开发】try-cache-finnally捕获异常
在c++中,可以直接抛出异常之后自己进行捕捉处理,如:(这样就可以在任何自己得到不想要的结果的时候进行中断,比如在进行数据库事务操作的时候,如果某一个语句返回SQL_ERROR则直接抛出异常,在cat ...
- hbase数据导出和恢复 设置双master + 查看hbase表占用磁盘大小
1.备份TETST111hbase org.apache.hadoop.hbase.mapreduce.Export TEST111 /do1/hh2.drop 掉test111表 -- 只能dro ...
- idea spring+springmvc+mybatis环境配置整合详解
idea spring+springmvc+mybatis环境配置整合详解 1.配置整合前所需准备的环境: 1.1:jdk1.8 1.2:idea2017.1.5 1.3:Maven 3.5.2 2. ...
- nginx 增加认证
1.检查工具是否安装,如果未安装则使用yum安装 #htpasswd 有以上输出表示已经安装,如果没有按装,使用如下命令安装: #yum -y install httpd-tools 2.htpass ...
- 改变core文件名称和生成路径
echo "/mnt/nfs/core-%e-%p-%t" > /proc/sys/kernel/core_pattern core-函数名-pid-时间戳
- [转帖]SOCKS5代理与HTTP代理
SOCKS5代理与HTTP代理 https://blog.csdn.net/watson2017/article/details/79897693 [1]什么是SOCKS5协议. SOCKS是一种网络 ...
- hdu 4471 区间条件统计 区间 不超过 x 的元素的个数
题目传送门//res tp hdu 目的 对长度为n的区间,m次询问,每次提供一个区间两端点与一个值x,求区间内不超过x的元素个数 n 1e5 m 1e5 ai [1,1e9] (i∈[1,n]) 多 ...
- 单元操作和仓储模式 repository+unitOfWork
仓储和工作单元模式是用来在数据访问层和业务逻辑层之间创建一个抽象层.应用这些模式,可以帮助用来隔离你的程序在数据存储变化. 在数据源层和业务层之间增加一个repository层进行协调,有如下作用:1 ...
- Java8 常用Function、Predicate、Consumer、Supplier接口
1.常用函数是接口: (1)Function<T, R> => R apply(T t) ———— 接受一个T类型的参数,返回R类型结果. Function<Integer, ...
- JS中数组与对象的遍历方法实例小结
一.数组的遍历: 首先定义一个数组 1 arr=['snow','bran','king','nightking']; 1.for循环,需要知道数组的长度; 2.foreach,没有返回值,可以不知道 ...