Solr 6.7学习笔记(05)-- highlighter
搜索结果高亮显示是搜索引擎中的常用功能,在Solr中,我们可以如下配置:
<requestHandler name="/select" class="solr.SearchHandler">
<lst name="defaults">
<str name="echoParams">explicit</str>
<str name="rows">10</str>
<str name="df">text</str> <!-- Highlighting defaults -->
<str name="hl">true</str>
<str name="hl.method">original</str>
<str name="hl.fl">content filename filepath</str>
<str name="hl.preserveMulti">true</str>
<str name="hl.encoder">html</str>
<str name="hl.simple.pre"><b></str>
<str name="hl.simple.post"></b></str>
<str name="f.filename.hl.fragsize">0</str>
<str name="f.filename.hl.alternateField">filename</str>
<str name="f.filepath.hl.fragsize">0</str>
<str name="f.filepath.hl.alternateField">filepath</str>
<str name="f.content.hl.snippets">3</str>
<str name="f.content.hl.fragsize">200</str>
<str name="f.content.hl.alternateField">content</str>
<str name="f.content.hl.maxAlternateFieldLength">750</str> </lst>
</requestHandler>
常用的一些属性:
参数 | 默认值 | 描述 |
hl | false | 如需启用highlighting,设置为true |
hl.method | original | highlighting的实现方式。有四个值可选:unified, original, fastVector, postings |
hl.fl | (df=) | 指定需要高亮的一些字段。字段之间用空格或逗号分隔。可以使用*号(e.g. text_*), 使用*号时,建议把hl.requireFieldMatch设为TRUE |
hl.q | (q=) | 高亮的查询语句,默认值等于查询语句。一般都是查询什么,结果集中就高亮什么,还没看到需要另外设置的情况 |
hl.qparser | (defType) | hl.q的分析器 |
hl.requireFieldMatch | false | 默认情况下,如果查询中指定了查询哪个field,但是还是会高亮所有hl.fl中指定的field。如果设置为true, 将会只高亮查询中的field。 |
hl.usePhraseHighlighter | true | 为true时,短语做为一个整体被高亮。为false时,短语中的每个单词都会被单独高亮。 |
hl.highlightMultiTerm | true | 为true时,高亮通配符查询 |
hl.snippets | 1 | 指定每个字段中,最多高亮的片断。 |
hl.fragsize | 100 | 返回搜索结果的最大长度。如常见的搜索引擎中,搜索结果只展示了部分文本,不可能把整篇文章都显示出来。需要点击进去才会显示全部 |
hl.tag.pre | <em> | 如果hl.method为original,此参数应该是hl.simple.pre。此值通常是HTML或XML标签 |
hl.tag.post | </em> | 如果hl.method为original,此参数应该是hl.simple.post。 |
hl.encoder | (blank) | 如果为空,返回的文本不会被编码。如果设置为html,则返回的文本中如果包含html/xml的特殊字符的话,将会被转化 (e.g. & --> &) |
hl.maxAnalyzedChars | 51200 | 高亮匹配的最大长度。如果某个文本符合搜索条件,但是搜索结果的前51200里面不包含搜索的内容,则不会继续往后去高亮匹配的内容。 |
不同的hl.method,还会有不同的参数。需要用到的时候再去查询文档。
当我们输入多个单词,希望在搜索结果里不同的单词用不同的背景色显示。在Solr的样例配置中,发现<searchComponent name="highlight">下面有一段
<fragmentsBuilder name="colored">的配置。查看文档,发现当hl.method=fastVector时,才会有hl.fragmentsBuilder的配置。文档中也有提到,如果hl.method=original的话,只要设置f.yourTermVectorField.hl.method=fastVector,也可以使用fastVector的属性。最后更改后的设置如下:
<requestHandler name="/select" class="solr.SearchHandler">
<lst name="defaults">
<str name="echoParams">explicit</str>
<str name="rows">10</str>
<str name="df">text</str> <!-- Highlighting defaults -->
<str name="hl">true</str>
<str name="hl.method">original</str>
<str name="hl.fl">content filename</str>
<str name="hl.preserveMulti">true</str>
<str name="hl.encoder">html</str>
<str name="hl.fragmentsBuilder">colored</str> <str name="f.filename.hl.fragsize">100</str>
<str name="f.filename.hl.alternateField">filename</str>
<str name="f.filename.hl.method">fastVector</str>
<str name="f.content.hl.snippets">3</str>
<str name="f.content.hl.fragsize">200</str>
<str name="f.content.hl.alternateField">content</str>
<str name="f.content.hl.maxAlternateFieldLength">750</str>
<str name="f.content.hl.method">fastVector</str> </lst>
</requestHandler>
注意:1. 使用 fastVector的字段,四个属性(termVectors, termPositions, termOffsets, termPayloads)必须都为true,且indexed必须也是true。
2. 另外,f.field.hl.fragsize必须设置一个>=18的数,要不然会报如下的exception:
org.apache.solr.client.solrj.impl.HttpSolrClient$RemoteSolrException: Error from server at http://localhost:8983/solr/fileSearch: fragCharSize(0) is too small. It must be 18 or higher.
3. <fragmentsBuilder name="colored"> 中配置一个 “background:lawgreen”的背景色,可是在Chrome里无法显示。导致我一开始以为是设置有问题。
Solr 6.7学习笔记(05)-- highlighter的更多相关文章
- 机器学习实战(Machine Learning in Action)学习笔记————05.Logistic回归
机器学习实战(Machine Learning in Action)学习笔记————05.Logistic回归 关键字:Logistic回归.python.源码解析.测试作者:米仓山下时间:2018- ...
- Solr 6.7学习笔记(02)-- 配置文件 managed-schema (schema.xml) -- 样例(6)
managed-schema 样例: <?xml version="1.0" encoding="UTF-8" ?> <!-- License ...
- Solr 6.7学习笔记(02)-- 配置文件 managed-schema (schema.xml)(3)
5. <fieldType> fieldType主要定义了一些字段类型,其name属性值用于前面<field>中的type属性的值.e.g. <fieldTyp ...
- Solr 6.7学习笔记(04)-- Suggest
当我们使用baidu或者Google时,你输入很少的字符,就会自动跳出来一些建议选项,在Solr里,我们称之为Suggest,在solrconfig.xml里做一些简单的配置,即可实现这一功能.配置如 ...
- Solr 6.7学习笔记(02)-- 配置文件 managed-schema (schema.xml) - filter(5)
自定义fieldType时,通常还会用到filter.filter必须跟在tokenizer或其它filter之后.如: <fieldType> <analyzer> < ...
- C++ GUI Qt4学习笔记05
C++ GUI Qt4学习笔记05 qtc++正则表达式 QIntValidator -- 只让用户输入整数 QDoubleValidator -- 只让用户输入浮 ...
- Solr 6.7学习笔记(02)-- 配置文件 managed-schema (schema.xml)(1)
刚学Solr(版本6.7.0),新建一个core时,提示要求schema.xml文件,我找了半天也没在源码包中找到名为schema.xml的文件.这个版本其实用的是managed-schema文件,没 ...
- [Golang学习笔记] 05 程序实体2 作用域访问权限和变量重声明
作用域访问权限: 程序实体访问权限(作用域)有三种:1. 包级私有(代码包)2. 模块级私有(代码包)3. 公开(全域). 一个函数是一个代码块.一个程序实体的作用域总是会被限制在某个代码块中.好处: ...
- stm32寄存器版学习笔记05 PWM
STM32除TIM6和TIM7外都可以产生PWM输出.高级定时器TIM1和TIM8可以同时产生7路PWM,通用定时器可以产生4路PWM输出. 1.TIM1 CH1输出PWM配置步骤 ①开启TIM1时钟 ...
- [原创]java WEB学习笔记05:Servlet中的ServletConfig对象
本博客为原创:综合 尚硅谷(http://www.atguigu.com)的系统教程(深表感谢)和 网络上的现有资源(博客,文档,图书等),资源的出处我会标明 本博客的目的:①总结自己的学习过程,相当 ...
随机推荐
- oracle 11g ocr 冗余配置
版权声明:本文为博主原创文章.未经博主同意不得转载. https://blog.csdn.net/royjj/article/details/30506343 oracle 11g ocr 冗余 ...
- Android学习之——优化篇(2)
一.高级优化 上篇主要从0基础优化的方式,本篇主要将从程序执行性能的角度出发,分析各种经常使用方案的不足.并给出对象池技术.基础数据类型替换法.屏蔽函数计算三种能够节省资源开销和处理器时间的优 ...
- SlopeOne推荐算法
Slope One 算法 是一种基于评分的预测算法, 本质上也是一种基于项目的算法.与一般的基于项目的算法不同, 该算法不计算项目之间的相似度, 而是用一种简单的线性回归模型进行预测(可 ...
- STemWin显示汉字 — SD卡外挂XBF字库
转载注明出处 方法来自安福莱教程 1: 使用emWin自带小工具生成字库 (1)启动软件 选择4位抗锯齿 (2)根据需求选择字体类型和字体大小 (3)另存为XBF格式 2: 创建XBF字体 #inc ...
- 排序List集合
这两天写代码过程中遇到一个需求,需要按照某个字段排序List集合,自己实现了一半,发现网上有个更好的版本,就采用了这个,记录下来. 使用这个工具类要注意一个就是 如果你按照age 字段排序,那么age ...
- PHP之面向对象PHP之面向对象(面向对象是什么)
PHP之面向对象(面向对象是什么) 一.总结 一句话总结: 面向对象就是类:类都要 属性 和 方法 比如人:属性比如身高体重,方法比如吃饭喝水 面向对象中 ,方法即是函数 : 属性即是变量 ,只是面相 ...
- Servlet传递数据方式
Servlet传递数据方式 基本概述 Servlet传递数据的方式有很多,这里提供五种方式: 1.静态变量 2.HttpServletResponse的sendRedirect()方法 3.HttpS ...
- linux应用之apache的源码安装(centos)
第一部分:前期准备 需要下载的东西 下载 Apache 源码包 下载地址: http://httpd.apache.org/download.cgi ...
- 【HDU 4807】Lunch Time 最小费用最大流
题意 在一个有向图当中,现在每一条边带有一个容量,现在有K个人在起点,需要到终点去吃饭,询问这K个人最后一个人到达食堂的最小时间是多少 贴一篇题解:http://blog.csdn.net/u0137 ...
- ACM学习历程—HDU 1272 小希的迷宫(并查集)
Description 上次Gardon的迷宫城堡小希玩了很久(见Problem B),现在她也想设计一个迷宫让Gardon来走.但是她设计迷宫的思路不一样,首先她认为所有的通道都应该是双向连通的,就 ...