【Lucene】三个高亮显示模块的简单示例-Highlighter
Lucene针对高亮显示功能提供了两种实现方式,分别是Highlighter和FastVectorHighlighter
这里的三个示例都是使用Highlighter;
示例代码:
- package com.tan.code;
- import java.io.File;
- import java.io.IOException;
- import java.io.StringReader;
- import org.apache.lucene.analysis.TokenStream;
- import org.apache.lucene.analysis.core.SimpleAnalyzer;
- import org.apache.lucene.document.Document;
- import org.apache.lucene.index.DirectoryReader;
- import org.apache.lucene.index.IndexReader;
- import org.apache.lucene.index.Term;
- import org.apache.lucene.queryparser.classic.ParseException;
- import org.apache.lucene.queryparser.classic.QueryParser;
- import org.apache.lucene.search.IndexSearcher;
- import org.apache.lucene.search.Query;
- import org.apache.lucene.search.ScoreDoc;
- import org.apache.lucene.search.TermQuery;
- import org.apache.lucene.search.TopDocs;
- import org.apache.lucene.search.highlight.Highlighter;
- import org.apache.lucene.search.highlight.InvalidTokenOffsetsException;
- import org.apache.lucene.search.highlight.QueryScorer;
- import org.apache.lucene.search.highlight.SimpleHTMLFormatter;
- import org.apache.lucene.search.highlight.SimpleSpanFragmenter;
- import org.apache.lucene.search.highlight.TokenSources;
- import org.apache.lucene.store.Directory;
- import org.apache.lucene.store.SimpleFSDirectory;
- import org.apache.lucene.util.Version;
- import org.wltea.analyzer.lucene.IKAnalyzer;
- public class HighlighterTest {
- // 高亮處理文本(以下内容纯属虚构)
- private String text = "China has lots of people,most of them are very poor.China is very big.China become strong now,but the poor people is also poor than other controry";
- // 原文高亮
- public void highlighter() throws IOException, InvalidTokenOffsetsException {
- TermQuery termQuery = new TermQuery(new Term("field", "china"));
- TokenStream tokenStream = new SimpleAnalyzer(Version.LUCENE_43)
- .tokenStream("field", new StringReader(text));
- QueryScorer queryScorer = new QueryScorer(termQuery);
- Highlighter highlighter = new Highlighter(queryScorer);
- highlighter.setTextFragmenter(new SimpleSpanFragmenter(queryScorer));
- System.out.println(highlighter.getBestFragment(tokenStream, text));
- }
- // 使用CSS進行高亮顯示處理
- public void highlighter_CSS(String searchText) throws ParseException,
- IOException, InvalidTokenOffsetsException {
- // 創建查詢
- QueryParser queryParser = new QueryParser(Version.LUCENE_43, "field",
- new SimpleAnalyzer(Version.LUCENE_43));
- Query query = queryParser.parse(searchText);
- // 自定义标注高亮文本标签
- SimpleHTMLFormatter htmlFormatter = new SimpleHTMLFormatter(
- "<span style=\"backgroud:red\">", "</span>");
- // 语汇单元化
- TokenStream tokenStream = new SimpleAnalyzer(Version.LUCENE_43)
- .tokenStream("field", new StringReader(text));
- // 創建QueryScoer
- QueryScorer queryScorer = new QueryScorer(query, "field");
- Highlighter highlighter = new Highlighter(htmlFormatter, queryScorer);
- highlighter.setTextFragmenter(new SimpleSpanFragmenter(queryScorer));
- System.out.println(highlighter.getBestFragments(tokenStream, text, 4,
- "..."));
- }
- // 高亮顯示搜索結果
- public void highlighter_SR(String field, String searchText)
- throws IOException, ParseException, InvalidTokenOffsetsException {
- //本次示例为了简便直接使用之前实验建立的索引
- Directory directory = new SimpleFSDirectory(new File("E://MyIndex"));
- IndexReader reader = DirectoryReader.open(directory);// 读取目录
- IndexSearcher search = new IndexSearcher(reader);// 初始化查询组件
- QueryParser parser = new QueryParser(Version.LUCENE_43, field,
- new IKAnalyzer(true));
- Query query = parser.parse(searchText);
- TopDocs td = search.search(query, 10000);// 获取匹配上元素的一个docid
- ScoreDoc[] sd = td.scoreDocs;// 加载所有的Documnet文档
- System.out.println("本次命中数据:" + sd.length);
- QueryScorer scorer = new QueryScorer(query, "content");
- Highlighter highlighter = new Highlighter(scorer);
- highlighter.setTextFragmenter(new SimpleSpanFragmenter(scorer));
- for (ScoreDoc scoreDoc : sd) {
- Document document = search.doc(scoreDoc.doc);
- String content = document.get("content");
- TokenStream tokenStream = TokenSources.getAnyTokenStream(
- search.getIndexReader(), scoreDoc.doc, "content", document,
- new IKAnalyzer(true));
- System.out.println(highlighter
- .getBestFragment(tokenStream, content));
- }
- }
- }
测试代码:
- @Test
- public void test() throws IOException, InvalidTokenOffsetsException,
- ParseException {
- // fail("Not yet implemented");
- HighlighterTest highlighterTest = new HighlighterTest();
- highlighterTest.highlighter();
- highlighterTest.highlighter_CSS("china");
- highlighterTest.highlighter_CSS("poor");
- highlighterTest.highlighter_SR("content", "床前明月光");
- }
测试结果:
- <B>China</B> has lots of people,most of them are very poor。<B>China</B> is very big.<B>China</B> become strong now,but the poor people is also poor than other controry
- <span style="backgroud:red">China</span> has lots of people,most of them are very poor。<span style="backgroud:red">China</span> is very big.<span style="backgroud:red">China</span> become strong now,but the poor people is also poor than other controry
- China has lots of people,most of them are very <span style="backgroud:red">poor</span>。China is very big.China become strong now,but the <span style="backgroud:red">poor</span> people is also <span style="backgroud:red">poor</span> than other controry
- 本次命中数据:1
- <B>床</B><B>前</B><B>明月光</B>,疑是地上霜
【Lucene】三个高亮显示模块的简单示例-Highlighter的更多相关文章
- 【Redis】三、Redis安装及简单示例
(四)Redis安装及使用 Redis的安装比较简单,仍然和大多数的Apache开源软件一样,只需要下载,解压,配置环境变量即可.具体安装过程参考:菜鸟教程Redis安装. 安装完成后,通过r ...
- Python(2.7.6) 标准日志模块的简单示例
Python 标准库中的 logging 模块提供了一套标准的 API 来处理日志信息的打印. import logging logging.basicConfig( level = logging. ...
- java中request,application,session三个域及参数简单示例
直接上代码: java代码: public class HelloAction implements Action { @Override public String execute() throws ...
- lucene创建索引简单示例
利用空闲时间写了一个使用lucene创建索引简单示例, 1.使用maven创建的项目 2.需要用到的jar如下: 废话不多说,直接贴代码如下: 1.创建索引的类(HelloLucene): packa ...
- 为Lua5.3编写C模块简单示例
为Lua5.3编写C模块简单示例 一.编译安装Lua5.3 MSVC 命令行安装脚本: @echo off md bin md lib md include cd src cl /c /nologo ...
- SignalR代理对象异常:Uncaught TypeError: Cannot read property 'client' of undefined 推出的结论 SignalR 简单示例 通过三个DEMO学会SignalR的三种实现方式 SignalR推送框架两个项目永久连接通讯使用 SignalR 集线器简单实例2 用SignalR创建实时永久长连接异步网络应用程序
SignalR代理对象异常:Uncaught TypeError: Cannot read property 'client' of undefined 推出的结论 异常汇总:http://www ...
- pureMVC简单示例及其原理讲解三(View层)
本篇说的是View层,即视图层,在本示例中包括两个部分:MXML文件,即可视控件:Mediator. 可视控件 可视控件由UserForm.mxml(图1)和UserList.mxml(图2)两个文件 ...
- 基于.NET CORE微服务框架 -surging的介绍和简单示例 (开源)
一.前言 至今为止编程开发已经11个年头,从 VB6.0,ASP时代到ASP.NET再到MVC, 从中见证了.NET技术发展,从无畏无知的懵懂少年,到现在的中年大叔,从中的酸甜苦辣也只有本人自知.随着 ...
- web 框架的本质及自定义web框架 模板渲染jinja2 mvc 和 mtv框架 Django框架的下载安装 基于Django实现的一个简单示例
Django基础一之web框架的本质 本节目录 一 web框架的本质及自定义web框架 二 模板渲染JinJa2 三 MVC和MTV框架 四 Django的下载安装 五 基于Django实现的一个简单 ...
随机推荐
- Ubuntu杂记——双系统重装Win7后找不到Ubuntu的解决办法
之前装过Ubuntu和Win7的双系统,后来重装了Win7,发现Ubuntu不见了,那会没怎么用,也没去解决问题.现在再看Android内核剖析,大部分都是在Ubuntu环境下进行的,所以百度了一些方 ...
- RESTful API URI 设计: 判断资源是否存在?
相关的一篇文章:RESTful API URI 设计的一些总结. 问题场景:判断一个资源(Resources)是否存在,URI 该如何设计? 应用示例:判断 id 为 1 用户下,名称为 window ...
- Java-Spring:java.lang.ClassCastException: com.sun.proxy.$Proxy* cannot be cast to***问题解决方案
java.lang.ClassCastException: com.sun.proxy.$Proxy* cannot be cast to***问题解决方案 临床表现: 病例: 定义代理类: @Tra ...
- CSS-float详解,深入理解clear:both[转+部分原创]
首先要知道,div是块级元素,在页面中独占一行,自上而下排列,也就是传说中的流. 可以看出,即使div1的宽度很小,页面中一行可以容下div1和div2,div2也不会排在div1后边,因为div元素 ...
- jQuery Mobile案例,最近用Moon.Web和Moon.Orm做了一套系统
一.简介 先说说,我们的主题.jQuery Mobile,最近用Moon.Web和Moon.Orm做了一套系统 jQuery Mobile是jQuery 在手机上和平板设备上的版本.jQuery ...
- C# 项目提交过程中感受
C# 项目提交过程中感受 新到一家互联网公司,昨天第一次提交代码,遇到了不少问题,而且大多数是代码格式问题,特此将范的错误记录下来,自我警示. 1. 代码对齐,这个虽然一直也都在注意,不过还是有一行代 ...
- VBA初试——合并
今天遇到一个任务,要把excel中的相同行合并:没有找到直接的办法(vlookup大概能做),试了试VBA挺好用 数据结构 第一.二列是描述字段,第二列元素唯一:第三到第八列是标志位 任务 合并描述字 ...
- 【工匠大道】Git的使用总结
初衷是想将一些常用的代码整理在博客园上,但是考虑到博客园上的代码量多,需要折叠,折叠后就不能直接修改,于是想到了 大家都常用的 gitHub来进行代码的管理. 其实之前我是用过 Osa的git的,但是 ...
- 【工匠大道】一些Vim(Linux)不常见但很逼格的命令(不断更新中)
本文地址 分享提纲: 1. :Tlist 2. :colorscheme 3. :set cursorline 4. ma 5. vim -x 6. CTRL-] 7. 折叠 8. 向别的用户终端写信 ...
- DrawSVG - SVG 路径动画 jQuery 插件
jQuery DrawSVG 使用了 jQuery 内置的动画引擎实现 SVG 路径动画,用到了 stroke-dasharray 和 stroke-dashoffset 属性.DrawSVG 是完全 ...