Solr 学习(5) —- Solr查询语法和参数
1、查询地址
建立好solr的索引后,可以通过管理界面进行查询。http://127.0.0.1:8983/solr/admin/form.jsp
要尝试多个查询方法的话,可以进入full interface模式,并勾选debug选项,像下面这样
随便进行一个查询,如输入 hi ,通过返回的页面的debug项中,就可以看到solr进行查询的很多相关信息
- <lst name="debug">
- <str name="rawquerystring">hi</str>
- <str name="querystring">hi</str>
- <str name="parsedquery">text:hi</str>
- <str name="parsedquery_toString">text:hi</str>
- <lst name="explain">
- <str name="1474002">
- 8.481748 = (MATCH) fieldWeight(text:hi in 207626), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336, maxDocs=2373631) 1.0 = fieldNorm(field=text, doc=207626)
- </str>
- <str name="556830">
- 8.481748 = (MATCH) fieldWeight(text:hi in 794169), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336, maxDocs=2373631) 1.0 = fieldNorm(field=text, doc=794169)
- </str>
- <str name="735197">
- 8.481748 = (MATCH) fieldWeight(text:hi in 901810), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336, maxDocs=2373631) 1.0 = fieldNorm(field=text, doc=901810)
- </str>
- <str name="2142779">
- 8.481748 = (MATCH) fieldWeight(text:hi in 1584789), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336, maxDocs=2373631) 1.0 = fieldNorm(field=text, doc=1584789)
- </str>
- <str name="182950">
- 8.481748 = (MATCH) fieldWeight(text:hi in 1862408), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336, maxDocs=2373631) 1.0 = fieldNorm(field=text, doc=1862408)
- </str>
- <str name="155112">
- 8.481748 = (MATCH) fieldWeight(text:hi in 1967709), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336, maxDocs=2373631) 1.0 = fieldNorm(field=text, doc=1967709)
- </str>
- <str name="2223440">
- 8.481748 = (MATCH) fieldWeight(text:hi in 2181479), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336, maxDocs=2373631) 1.0 = fieldNorm(field=text, doc=2181479)
- </str>
- <str name="2236992">
- 8.481748 = (MATCH) fieldWeight(text:hi in 2199957), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336, maxDocs=2373631) 1.0 = fieldNorm(field=text, doc=2199957)
- </str>
- <str name="2231513">
- 7.4968767 = (MATCH) fieldWeight(text:hi in 2179538), product of: 1.4142135 = tf(termFreq(text:hi)=2) 8.481748 = idf(docFreq=1336, maxDocs=2373631) 0.625 = fieldNorm(field=text, doc=2179538)
- </str>
- <str name="17885">
- 5.9975014 = (MATCH) fieldWeight(text:hi in 2009670), product of: 1.4142135 = tf(termFreq(text:hi)=2) 8.481748 = idf(docFreq=1336, maxDocs=2373631) 0.5 = fieldNorm(field=text, doc=2009670)
- </str>
- </lst>
- <str name="QParser">LuceneQParser</str>
- <lst name="timing">
- <double name="time">8.0</double>
- <lst name="prepare">
- <double name="time">1.0</double>
- <lst name="org.apache.solr.handler.component.QueryComponent">
- <double name="time">1.0</double>
- </lst>
- <lst name="org.apache.solr.handler.component.FacetComponent">
- <double name="time">0.0</double>
- </lst>
- <lst name="org.apache.solr.handler.component.MoreLikeThisComponent">
- <double name="time">0.0</double>
- </lst>
- <lst name="org.apache.solr.handler.component.HighlightComponent">
- <double name="time">0.0</double>
- </lst>
- <lst name="org.apache.solr.handler.component.StatsComponent">
- <double name="time">0.0</double>
- </lst>
- <lst name="org.apache.solr.handler.component.DebugComponent">
- <double name="time">0.0</double>
- </lst>
- </lst>
- <lst name="process">
- <double name="time">7.0</double>
- <lst name="org.apache.solr.handler.component.QueryComponent">
- <double name="time">5.0</double>
- </lst>
- <lst name="org.apache.solr.handler.component.FacetComponent">
- <double name="time">0.0</double>
- </lst>
- <lst name="org.apache.solr.handler.component.MoreLikeThisComponent">
- <double name="time">0.0</double>
- </lst>
- <lst name="org.apache.solr.handler.component.HighlightComponent">
- <double name="time">0.0</double>
- </lst>
- <lst name="org.apache.solr.handler.component.StatsComponent">
- <double name="time">0.0</double>
- </lst>
- <lst name="org.apache.solr.handler.component.DebugComponent">
- <double name="time">2.0</double>
- </lst>
- </lst>
- </lst>
- </lst>
同时 在查询的头部信息中,也可以看到查询语法和参数是否被正确解析
- <lst name="responseHeader">
- <int name="status">0</int>
- <int name="QTime">8</int>
- <lst name="params">
- <str name="explainOther"/>
- <str name="fl">*,score</str>
- <str name="debugQuery">on</str>
- <str name="indent">on</str>
- <str name="start">0</str>
- <str name="q">hi</str>
- <str name="hl.fl"/>
- <str name="qt"/>
- <str name="wt"/>
- <str name="fq"/>
- <str name="rows">10</str>
- <str name="version">2.2</str>
- </lst>
- </lst>
具体命中的文档数可以在respose标签里找到,如下说明找到1328个包含查询词的文档
- <result name="response" numFound="1328" start="0" maxScore="8.481748">
以上这些地方对分析解决查询中出现的问题都很有帮助
2、查询语法
solr的一些查询语法
1.1. 首先假设我的数据里fields有:name, tel, address 预设的搜寻是name这个字段, 如果要搜寻的数据刚好就是 name 这个字段,就不需要指定搜寻字段名称.
1.2. 查询规则:
如欲查询特定字段(非预设字段),请在查询词前加上该字段名称加 “:” (不包含”号) 符号,
例如: address:北京市海淀区上地软件园 tel:88xxxxx1
1>. q代表query input
2>. version代表solr版本(建议不要变动此变量)
3>. start代表显示结果从哪一笔结果资料开始,预设为0代表第一笔, rows是说要显示几笔数据,预设为10笔
(因为有时查询结果可能有几百笔,但不需要显示所有结果,所以预设是从第一笔开始到第十笔)
所以若要显示第10到30笔就改为:
http: //localhost:8080/solr/select/?indent=on&version=2.2&q=address:北京 市海淀区上地软件园+tel:88xxxxx1&version=2.2&start=10&rows= 20&indent=on
(indent代表输出的xml要不要缩行.预设为开启 on)
1.3. 另外,要限定输出结果的内容可用 “fl=” 加上你要的字段名称,如以下这个范例:
http: //localhost:8080/solr/select/?indent=on&version=2.2&q=text:北京+ OR+text:亿度&start=0&rows=10&fl=name,address,tel
在fl=之后加上了name,adress,tel
所以结果会如下:
3、查询参数
常用
- q - 查询字符串,必须的。
- fl - 指定返回那些字段内容,用逗号或空格分隔多个。
- start - 返回第一条记录在完整找到结果中的偏移位置,0开始,一般分页用。
- rows - 指定返回结果最多有多少条记录,配合start来实现分页。
- sort - 排序,格式:sort=<field name>+<desc|asc>[,<field name>+<desc|asc>]… 。示例:(inStock desc, price asc)表示先 “inStock” 降序, 再 “price” 升序,默认是相关性降序。
- wt - (writer type)指定输出格式,可以有 xml, json, php, phps, 后面 solr 1.3增加的,要用通知我们,因为默认没有打开。
- fq - (filter query)过虑查询,作用:在q查询符合结果中同时是fq查询符合的,例如:q=mm&fq=date_time:[20081001 TO 20091031],找关键字mm,并且date_time是20081001到20091031之间的。官方文档:http://wiki.apache.org/solr/CommonQueryParameters
不常用
- q.op - 覆盖schema.xml的defaultOperator(有空格时用"AND"还是用"OR"操作逻辑),一般默认指定
- df - 默认的查询字段,一般默认指定
- qt - (query type)指定那个类型来处理查询请求,一般不用指定,默认是standard。
其它
- indent - 返回的结果是否缩进,默认关闭,用 indent=true|on 开启,一般调试json,php,phps,ruby输出才有必要用这个参数。
- version - 查询语法的版本,建议不使用它,由服务器指定默认值。
[Solr的检索运算符]
“:” 指定字段查指定值,如返回所有值*:*²
“?”²表示单个任意字符的通配
“*” 表示多个任意字符的通配(不能在检索的项开始使用*或者?符号)²
“~”²表示模糊检索,如检索拼写类似于”roam”的项这样写:roam~将找到形如foam和roams的单词;roam~0.8,检索返回相似度在0.8以上的记录。
²邻近检索,如检索相隔10个单词的”apache”和”jakarta”,”jakarta apache”~10
“^”²控制相关度检索,如检索jakarta apache,同时希望去让”jakarta”的相关度更加好,那么在其后加上”^”符号和增量值,即jakarta^4 apache
布尔操作符AND、||²
布尔操作符OR、²&&
布尔操作符NOT、!、-²(排除操作符不能单独与项使用构成查询)
“+” 存在操作符,要求符号”+”后的项必须在文档相应的域中存在²
( ) 用于构成子查询²
² [] 包含范围检索,如检索某时间段记录,包含头尾,date:[200707 TO 200710]
{}²不包含范围检索,如检索某时间段记录,不包含头尾
date:{200707 TO 200710}
" 转义操作符,特殊字符包括+ -² && || ! ( ) { } [ ] ^ ” ~ * ? : "
Solr 学习(5) —- Solr查询语法和参数的更多相关文章
- lucene&solr学习——创建和查询索引(理论)
1.Lucene基础 (1) 简介 Lucene是apache下的一个开放源代码的全文检索引擎工具包.提供完整的查询引擎和索引引擎:部分文本分析引擎. Lucene的目的是为软件开发人员提供一个简单易 ...
- Solr学习之四-Solr配置说明之二
上一篇的配置说明主要是说明solrconfig.xml配置中的查询部分配置,在solr的功能中另外一个重要的功能是建索引,这是提供快速查询的核心. 按照Solr学习之一所述关于搜索引擎的原理中说明了建 ...
- Solr学习总结 Solr的安装与配置
接着前一篇,这里总结下Solr的安装与配置 1.准备 1.安装Java8 和 Tomcat9 ,java和tomcat 的安装这里不再重复.需要注意的是这两个的版本兼容问题.貌似java8 不支持,t ...
- lucene&solr学习——创建和查询索引(代码篇)
1. Lucene的下载 Lucene是开发全文检索功能的工具包,从官网下载Lucene4.10.3并解压. 官网:http://lucene.apache.org/ 版本:lucene7.7.0 ( ...
- Solr学习之三 solr配置说明之一
严格来说,我这篇内容,主要是根据Solr in Action关于配置的说明,以及参考Solr的wiki写的算是读书笔记吧,所有的图片默认来自Solr in Action这本书. 这本书我觉得对学习So ...
- 我的solr学习笔记--solr admin 页面 检索调试
前言 Solr/Lucene是一个全文检索引擎,全文引擎和SQL引擎所不同的是强调部分相关度高的内容返回,而不是所有内容返回,所以部分内容包含在索引库中却无法命中是正常现象. 多数情况下我们 ...
- lucene&solr学习——solr学习(二) Solr管理索引库
1.什么是solrJ solrj是访问Solr服务的java客户端,提供索引和搜索的请求方法,SolrJ通常在嵌入在业务系统中,通过SolrJ的API接口操作Solr服务,如下图: 依赖jar包: 2 ...
- 02——Solr学习之Solr安装与配置(linux上的安装)
借鉴博客:https://www.jianshu.com/p/1100f54fcbd8 https://www.cnblogs.com/jepson6669/p/9134652.html 1.准备一个 ...
- 03——Solr学习之Solr的使用(不会用)
1.先放上次在linux搭建成功的solr管理UI界面 2.有个很蛋疼的问题我就要吐槽一下了 由于没接触过solr这玩意,在百度上一顿操作搜索怎么用,怎么导入数据,建索引库什么的,看了一大片别人的博客 ...
- Solr学习总结(四)Solr查询参数
今天还是不会涉及到.Net和数据库操作,主要还是总结Solr 的查询参数,还是那句话,只有先明白了solr的基础内容和查询语法,后续学习solr 的C#和数据库操作,都是水到渠成的事.这里先列出sol ...
随机推荐
- centos上yum无法使用的问题以及无法用yum安装screen,iftop,nethogs等的解决办法
大家可能都发现了centos8已经不在更新了.当我们使用yum安装某些工具的时候,会提示安装源失败 解决方案:删除repo文件 然后重新下载即可修复yum安装报错问题1.进入/etc/yum.repo ...
- AWS 认证
Data Analytics: 准备先Fundamental, 然后Udemy 上买课程,在看Exam Readiness, 然后小测试一下水平,看白皮书,最后不行就 Guru上再买课程 https: ...
- mysql 和 sqlalchemy 的一个测试环境
Mysql: docker run -itd --name mysql-test -p 3306:3306 -e MYSQL_ROOT_PASSWORD=123456 mysqldocker exec ...
- spark 新建一个column并用另一column的最大值赋值
finalDF.withColumn("NEW_COLUMN", max("start_date").over()).show() Ref: https:/ ...
- RedisCluster集群架构原理与通信原理
redis 参考目录: 生产级Redis 高并发分布式锁实战1:高并发分布式锁如何实现 https://www.cnblogs.com/yizhiamumu/p/16556153.html 生产级Re ...
- Openstack-删除卷:您被禁止执行 删除卷 (僵尸卷)
您被禁止执行 删除卷 (僵尸卷) 您被禁止执行 删除卷: 7f23a26a-27f2-4504-9191-0f5630a5bff5, 卷一直在创建,但实例已经被删除了 [root@controller ...
- JavaScript – Sort
前言 排序是很常见的需求. 虽然看似简单, 但其实暗藏杀机. 一不小心就会搞出 Bug 哦. 这篇就来聊聊 JS 的排序. 参考 原生JS数组sort()排序方法内部原理探究 值的比较 js中的loc ...
- Java获取Object中Value的方法
在Java中,获取对象(Object)中的值通常依赖于对象的类型以及我们希望访问的属性.由于Java是一种静态类型语言,直接从一个Object类型中访问属性是不可能的,因为Object是所有类的超类, ...
- LoRaWAN网关价格干穿地板了
废话不多说,不要998,不要688,以太网版本只要398,4G版本只要498. 先上图片 1.1 产品特点 ◆ 高性能嵌入式硬件平台 ◆ 使用工业级 Cat.1 4G 模块 ◆ 宽压输入 DC 9-2 ...
- 多表查询 —— 内连接&外连接&子查询
连接查询 内连接 1.查询语法 -- 隐式内连接 select 字段列表 from 表1, 表2... where 条件; -- 显式内连接 select 字段列表 from 表1 [INNER] j ...