搜索总体有:term 查询, phrase查询, boolean 查询

1. SOLR搜索覆盖度和准确度保证的三个搜索方式:

保证准确率: AND: Search for two different terms, new and house, requiring both to match 。完全相同逻辑的两种写法:(+new +house           new AND house )

保证覆盖率:OR : Search for two different terms, new and house, requiring only one to match 。solr默认的是OR搜索,所以(new or house,  new  house)结果一样

保证精准度: "":   Search for the exact phrase "new house" ,查询full phrase,则solr会考虑在 new AND house的结果集基础上,考虑new 和house之间的position。

保证覆盖率:Fuzzy matching 模糊搜索(包含:wildcard searching通配符搜索, range searching范围搜索, edit-distance searching编辑距离搜索, and proximity searching邻近搜索. )

其中,

(1)范围搜索例子如下:•  Query: yearsOld:[18 TO 21] Matches 18, 19, 20, 21 ;•  Query: title:[boat TO boulder] Matches boat, boil, book, boulder, etc. ;•  Query: price:[12.99 TO 14.99] Matches 12.99, 13.000009, 14.99, etc. ,范围用{}或[]或者[}或者{],同集合区间表示一样。

(2)编辑距离搜索中:编辑距离定义是An edit distance is defined as an insertion插入, a deletion删除, a substitution置换替换, ora transposition互换 of characters.

 例子如下:Query: administrator~1 Matches within one edit distance. •  Query: administrator~2 Matches within two edit distances. (T his is the default if no edit distance is provided.) •  Query: administrator~N Matches within N edit distances

(3)邻近搜索指的是搜索两个term之间的term:Query: "chief of ficer"~1 ,当你只记得短语的第一个和最后一个词的时候可以采用邻近搜索。邻近搜索的例子:Query: "chief of ficer"~N ---  Meaning: Finds chief within N positions of off icer.

2. SOLR提供的排除搜索:

NOT或者 -,都表示否定;如 中国  NOT 北京====中国  - 北京

3. SOLR支持野蛮查询:增加了搜索的灵活性

New AND (house OR (home NOT improvement NOT depot NOT grown)) 

(+(buying purchasing -renting) +(home house residence –(+property -bedroom)))

不论用什么逻辑来搜索,solr都是先搜索每个term的结果集,然后进行逻辑操作返回真实结果

备注:为了和+   等符号区分,solr中将AND , OR描述为 binary operator

总体来说:越复杂的搜索越影响效率,所以采用哪种搜索以及设置的参数都需要经过分析,否则保证了业务搜索的效果而影响了性能。

solr :term 查询, phrase查询, boolean 查询的更多相关文章

  1. Solr 使用自定义 Query Parser(短语查询,精准查询)

    原文出处:http://blog.chenlb.com/2010/08/solr-use-custom-query-parser.html 由于 Solr 默认的 Query Parser 生成的 Q ...

  2. Solr基础理论【倒排索引,模糊查询】

    一.简介 现有的许多不同类型 的技术系统,如关系型数据库.键值存储.操作磁盘文件的map-reduce[映射-规约]引擎.图数据库等,都是为了帮助用户解决颇具挑战性的数据存储与检索问题而设计的.而搜索 ...

  3. 获取文档版本版本值 滚动标识符 游标 控制查询如何执行 控制查询在哪些分片执行 boost加权

    映射mapping.json{ "book": { "_index": { "enabled": true }, "_id&quo ...

  4. ElasticSearch的高级复杂查询:非聚合查询和聚合查询

    一.非聚合复杂查询(这儿展示了非聚合复杂查询的常用流程) 查询条件QueryBuilder的构建方法 1.1 精确查询(必须完全匹配上,相当于SQL语句中的“=”) ① 单个匹配 termQuery ...

  5. 通讯服务类API调用的代码示例合集:短信服务、手机号归属地查询、电信基站查询等

    以下示例代码适用于 www.apishop.net 网站下的API,使用本文提及的接口调用代码示例前,您需要先申请相应的API服务. 短信服务:通知类和验证码短信,全国三网合一通道,5秒内到达,费用低 ...

  6. 生活常用类API调用的代码示例合集:邮编查询、今日热门新闻查询、区号查询等

    以下示例代码适用于 www.apishop.net 网站下的API,使用本文提及的接口调用代码示例前,您需要先申请相应的API服务. 邮编查询:通过邮编查询地名:通过地名查询邮编 今日热门新闻查询:提 ...

  7. SpringData JPA进阶查询—JPQL/原生SQL查询、分页处理、部分字段映射查询

    上一篇介绍了入门基础篇SpringDataJPA访问数据库.本篇介绍SpringDataJPA进一步的定制化查询,使用JPQL或者SQL进行查询.部分字段映射.分页等.本文尽量以简单的建模与代码进行展 ...

  8. 013.子查询和分页子查询(sql实例)

    --1 子查询 如果子查询和表连接都实现的时候,推荐用表连接实现( 一般:能用表连接实现的就用表连接,有些情况用表连接不能 或者不易实现的再选择子查询) 系统:缓存,执行计划技术手段 --1 wher ...

  9. 015-elasticsearch5.4.3【五】-搜索API【四】Joining 多文档查询、GEO查询、moreLikeThisQuery、script脚本查询、span跨度查询

    一.Joining 多文档查询 joining query 像Elasticsearch这样的分布式系统中执行完整的SQL样式连接非常昂贵.相反,Elasticsearch提供两种形式的连接,旨在水平 ...

随机推荐

  1. 解决:SyntaxError: Non-ASCII character in file

    今天尝试用monkeyrunner脚本在夜神模拟器上安装并截图QQ,但是遇到了一些问题: from com.android.monkeyrunner import MonkeyRunner, Monk ...

  2. 性能差异 ASP.NET WebForm与ASP.NET MVC

    一.为什么说 ASP.NET WebForm 比 ASP.NET MVC 要差? WebForm 顾名思义,微软一向主打简单化,窗体模式,拖拽控件就能做网站了, 然而这也引发了许多 Java 和 .N ...

  3. Shell编程-运算符

    1.declare命令 declare声明变量类型:declare [+/-][选项] 变量名 -:给变量设定类型属性 +:取消变量的类型属性 -a:将变量声明为数组型 -i:整数型 -x:环境变量 ...

  4. python2和python3 print输出不换行

    python2 print不换行 在print最后加上一个逗号,会把两个输出打印在同一行,不过两个输出之间有一个空格的间隔,例如:print '{0}'.format(123),print '{0}' ...

  5. MySQL实战 | 01-当执行一条 select 语句时,MySQL 到底做了啥?

    原文链接:当执行一条 select 语句时,MySQL 到底做了啥? 也许,你也跟我一样,在遇到数据库问题时,总时茫然失措,想重启解决问题,又怕导致数据丢失,更怕重启失败,影响业务. 就算重启成功了, ...

  6. The Suspects (并查集)

    个人心得:最基础的并查集经典题.借此去了解了一下加深版的即加权并查集,比如食物链的题目,这种题目实行起来还是有 一定的难度,不仅要找出与父节点的关系,还要在路径压缩的时候进行更新,这一点现在还是没那么 ...

  7. 利用sort对数组快速排序

    // sort内部使用快速排序,每次比较两个元素大小的时候如果没有参数,则直接判断字母表,如果有参数,则把正在比较的两个参数传入自定义方法并调用(正在比较的两个数会传给自定义方法的v1.v2),如果返 ...

  8. C#检查网络是否可以连接互联网

    添加引用: using System.Runtime.InteropServices; using System.Net.NetworkInformation; [DllImport("wi ...

  9. (转)C# 特性(Attribute)详细介绍

    本文转载自:http://www.cnblogs.com/luckdv/articles/1682488.html 1.什么是Atrribute 首先,我们肯定Attribute是一个类,下面是msd ...

  10. H264码流结构分析和rtp打包结构详解

    网络抽象层单元类型 (NALU): NALU头由一个字节组成,它的语法如下: +---------------+      |0|1|2|3|4|5|6|7|      +-+-+-+-+-+-+-+ ...