搜索结果高亮显示是搜索引擎中的常用功能,在Solr中,我们可以如下配置:

<requestHandler name="/select" class="solr.SearchHandler">
<lst name="defaults">
<str name="echoParams">explicit</str>
<str name="rows">10</str>
<str name="df">text</str> <!-- Highlighting defaults -->
<str name="hl">true</str>
<str name="hl.method">original</str>
<str name="hl.fl">content filename filepath</str>
<str name="hl.preserveMulti">true</str>
<str name="hl.encoder">html</str>
<str name="hl.simple.pre">&lt;b&gt;</str>
<str name="hl.simple.post">&lt;/b&gt;</str>
<str name="f.filename.hl.fragsize">0</str>
<str name="f.filename.hl.alternateField">filename</str>
<str name="f.filepath.hl.fragsize">0</str>
<str name="f.filepath.hl.alternateField">filepath</str>
<str name="f.content.hl.snippets">3</str>
<str name="f.content.hl.fragsize">200</str>
<str name="f.content.hl.alternateField">content</str>
<str name="f.content.hl.maxAlternateFieldLength">750</str> </lst>
</requestHandler>

常用的一些属性:

参数 默认值 描述
hl false 如需启用highlighting,设置为true
hl.method original highlighting的实现方式。有四个值可选:unified, original, fastVector, postings
hl.fl (df=) 指定需要高亮的一些字段。字段之间用空格或逗号分隔。可以使用*号(e.g. text_*), 使用*号时,建议把hl.requireFieldMatch设为TRUE
hl.q (q=) 高亮的查询语句,默认值等于查询语句。一般都是查询什么,结果集中就高亮什么,还没看到需要另外设置的情况
hl.qparser (defType) hl.q的分析器
hl.requireFieldMatch false 默认情况下,如果查询中指定了查询哪个field,但是还是会高亮所有hl.fl中指定的field。如果设置为true, 将会只高亮查询中的field。
hl.usePhraseHighlighter true 为true时,短语做为一个整体被高亮。为false时,短语中的每个单词都会被单独高亮。
hl.highlightMultiTerm true 为true时,高亮通配符查询
hl.snippets 1 指定每个字段中,最多高亮的片断。
hl.fragsize 100 返回搜索结果的最大长度。如常见的搜索引擎中,搜索结果只展示了部分文本,不可能把整篇文章都显示出来。需要点击进去才会显示全部
hl.tag.pre <em> 如果hl.method为original,此参数应该是hl.simple.pre。此值通常是HTML或XML标签
hl.tag.post </em> 如果hl.method为original,此参数应该是hl.simple.post。
hl.encoder (blank) 如果为空,返回的文本不会被编码。如果设置为html,则返回的文本中如果包含html/xml的特殊字符的话,将会被转化 (e.g.  & --> &amp;)
hl.maxAnalyzedChars 51200 高亮匹配的最大长度。如果某个文本符合搜索条件,但是搜索结果的前51200里面不包含搜索的内容,则不会继续往后去高亮匹配的内容。

不同的hl.method,还会有不同的参数。需要用到的时候再去查询文档。

当我们输入多个单词,希望在搜索结果里不同的单词用不同的背景色显示。在Solr的样例配置中,发现<searchComponent name="highlight">下面有一段

<fragmentsBuilder name="colored">的配置。查看文档,发现当hl.method=fastVector时,才会有hl.fragmentsBuilder的配置。文档中也有提到,如果hl.method=original的话,只要设置f.yourTermVectorField.hl.method=fastVector,也可以使用fastVector的属性。最后更改后的设置如下:

<requestHandler name="/select" class="solr.SearchHandler">
<lst name="defaults">
<str name="echoParams">explicit</str>
<str name="rows">10</str>
<str name="df">text</str> <!-- Highlighting defaults -->
<str name="hl">true</str>
<str name="hl.method">original</str>
<str name="hl.fl">content filename</str>
<str name="hl.preserveMulti">true</str>
<str name="hl.encoder">html</str>
<str name="hl.fragmentsBuilder">colored</str> <str name="f.filename.hl.fragsize">100</str>
<str name="f.filename.hl.alternateField">filename</str>
<str name="f.filename.hl.method">fastVector</str>
<str name="f.content.hl.snippets">3</str>
<str name="f.content.hl.fragsize">200</str>
<str name="f.content.hl.alternateField">content</str>
<str name="f.content.hl.maxAlternateFieldLength">750</str>
<str name="f.content.hl.method">fastVector</str> </lst>
</requestHandler>

注意:1. 使用 fastVector的字段,四个属性(termVectors, termPositions, termOffsets, termPayloads)必须都为true,且indexed必须也是true。

2. 另外,f.field.hl.fragsize必须设置一个>=18的数,要不然会报如下的exception:

org.apache.solr.client.solrj.impl.HttpSolrClient$RemoteSolrException: Error from server at http://localhost:8983/solr/fileSearch: fragCharSize(0) is too small. It must be 18 or higher.

3. <fragmentsBuilder name="colored"> 中配置一个 “background:lawgreen”的背景色,可是在Chrome里无法显示。导致我一开始以为是设置有问题。

Solr 6.7学习笔记(05)-- highlighter的更多相关文章

  1. 机器学习实战(Machine Learning in Action)学习笔记————05.Logistic回归

    机器学习实战(Machine Learning in Action)学习笔记————05.Logistic回归 关键字:Logistic回归.python.源码解析.测试作者:米仓山下时间:2018- ...

  2. Solr 6.7学习笔记(02)-- 配置文件 managed-schema (schema.xml) -- 样例(6)

    managed-schema 样例: <?xml version="1.0" encoding="UTF-8" ?> <!-- License ...

  3. Solr 6.7学习笔记(02)-- 配置文件 managed-schema (schema.xml)(3)

         5. <fieldType> fieldType主要定义了一些字段类型,其name属性值用于前面<field>中的type属性的值.e.g. <fieldTyp ...

  4. Solr 6.7学习笔记(04)-- Suggest

    当我们使用baidu或者Google时,你输入很少的字符,就会自动跳出来一些建议选项,在Solr里,我们称之为Suggest,在solrconfig.xml里做一些简单的配置,即可实现这一功能.配置如 ...

  5. Solr 6.7学习笔记(02)-- 配置文件 managed-schema (schema.xml) - filter(5)

    自定义fieldType时,通常还会用到filter.filter必须跟在tokenizer或其它filter之后.如: <fieldType> <analyzer> < ...

  6. C++ GUI Qt4学习笔记05

    C++ GUI Qt4学习笔记05   qtc++正则表达式 QIntValidator           --  只让用户输入整数 QDoubleValidator     --  只让用户输入浮 ...

  7. Solr 6.7学习笔记(02)-- 配置文件 managed-schema (schema.xml)(1)

    刚学Solr(版本6.7.0),新建一个core时,提示要求schema.xml文件,我找了半天也没在源码包中找到名为schema.xml的文件.这个版本其实用的是managed-schema文件,没 ...

  8. [Golang学习笔记] 05 程序实体2 作用域访问权限和变量重声明

    作用域访问权限: 程序实体访问权限(作用域)有三种:1. 包级私有(代码包)2. 模块级私有(代码包)3. 公开(全域). 一个函数是一个代码块.一个程序实体的作用域总是会被限制在某个代码块中.好处: ...

  9. stm32寄存器版学习笔记05 PWM

    STM32除TIM6和TIM7外都可以产生PWM输出.高级定时器TIM1和TIM8可以同时产生7路PWM,通用定时器可以产生4路PWM输出. 1.TIM1 CH1输出PWM配置步骤 ①开启TIM1时钟 ...

  10. [原创]java WEB学习笔记05:Servlet中的ServletConfig对象

    本博客为原创:综合 尚硅谷(http://www.atguigu.com)的系统教程(深表感谢)和 网络上的现有资源(博客,文档,图书等),资源的出处我会标明 本博客的目的:①总结自己的学习过程,相当 ...

随机推荐

  1. PHP接口中的静态变量、常量与类中静态变量、常量的区别

    接口: 1 不能够定义静态变量(常量除外) 2 定义的常量 const YOUCONST = VALUE,不能在子类中覆盖,在子类中以 interfaceName::YOUCONST的方式调用 3 不 ...

  2. 【linux】crontab的环境变量问题

    今天遇到一个奇怪的问题,同样一个脚本,手动执行没问题,加入到crontab中,就出现无法运行的情况,第一反应是环境变量问题 环境说明: 操作系统:centos 用户:test用户通过sudo su切换 ...

  3. [2018-12-18]ABP中的AsyncCrudAppService介绍

    前言 自从写完上次略长的<用ABP入门DDD>后,针对ABP框架的项目模板初始化,我写了个命令行工具Abp-CLI,其中子命令abplus init可以从github拉取项目模板以初始化项 ...

  4. 使用git连接到Github

    直奔主题,使用git连接到Github步骤如下: 1. 安装git yum install git 或者 sudo get-apt install git git-core 2. 全局配置 git c ...

  5. LightOJ - 1284 Lights inside 3D Grid —— 期望

    题目链接:https://vjudge.net/problem/LightOJ-1284 1284 - Lights inside 3D Grid    PDF (English) Statistic ...

  6. SQL Server 2008R2 代理服务-开启

    ,点击开始菜单-所有程序-SQLServer2008R2-配置工具-SQLServer配置管理器 2,选择SQLServer服务 3,找到SqlServer代理(MSSQLSERVER),双击或右键选 ...

  7. The Contiki build system

    The Contiki build system http://contiki.sourceforge.net/docs/2.6/a01796.html 先看官方文档的说明,对contiki的构建系统 ...

  8. HTML布局之左右结构,左边固定右边跟据父元素自适应

    HTML布局之左右结构,左边固定右边跟据父元素自适应,兼容IE6+.Firefox.Chrome.Opera.Safari,这里是用表单写的一个demo,其实就在主体布局中也是可以的,比如像后台一些管 ...

  9. utf8_general_ci和utf8_unicode_ci的比较

    看到很多数据库的设计对于中文字符都是选择选用utf8_general_ci而非utf8_unicode_ci utf8_general_ci和utf8_unicode_ci的区别并不大:utf8_un ...

  10. Linux_学习_02_ 重启tomcat与查看tomcat日志

    一.重启tomcat服务器 cd /home/ehlhec/tomcat_dingtalk/bin ./shutdown.sh ps -ef|grep java ./startup.sh (1) 进入 ...