检索结果高亮

实现效果：

核心代码

package ucas.ir.lucene;

import java.io.File;

import java.io.IOException;

import javax.print.Doc;

import org.apache.lucene.analysis.Analyzer;

import org.apache.lucene.analysis.TokenStream;

import org.apache.lucene.analysis.core.KeywordAnalyzer;

import org.apache.lucene.analysis.standard.StandardAnalyzer;

import org.apache.lucene.document.Document;

import org.apache.lucene.index.DirectoryReader;

import org.apache.lucene.index.IndexWriter;

import org.apache.lucene.queryparser.classic.QueryParser;

import org.apache.lucene.search.IndexSearcher;

import org.apache.lucene.search.Query;

import org.apache.lucene.search.TopDocs;

import org.apache.lucene.search.highlight.Fragmenter;

import org.apache.lucene.search.highlight.Highlighter;

import org.apache.lucene.search.highlight.QueryScorer;

import org.apache.lucene.search.highlight.SimpleHTMLFormatter;

import org.apache.lucene.search.highlight.SimpleSpanFragmenter;

import org.apache.lucene.search.highlight.TokenSources;

import org.apache.lucene.store.Directory;

import org.apache.lucene.store.FSDirectory;

import org.apache.lucene.util.Version;

import org.wltea.analyzer.lucene.IKAnalyzer;

public class IndexSearch {

    public static void main(String[] args) {

        Directory directory = null;

        try {

            File indexpath = new File("/Users/yp/Documents/workspace/UCASIR/WebContent/index");

            if (indexpath.exists() != true) {

                indexpath.mkdirs();

            }

            // 设置要查询的索引目录

            directory = FSDirectory.open(indexpath);

            // 创建indexSearcher

            DirectoryReader dReader = DirectoryReader.open(directory);

            IndexSearcher searcher = new IndexSearcher(dReader);

            // 设置分词方式

            Analyzer analyze2 = new StandardAnalyzer(Version.LUCENE_43);// 标准分词

            Analyzer analyzer = new IKAnalyzer();

            // 设置查询域

            String field="news_title";

            QueryParser parser = new QueryParser(Version.LUCENE_43, field, analyzer);

            // 查询字符串

            Query query = parser.parse("阿法狗");

            QueryScorer scorer=new QueryScorer(query,field);

            SimpleHTMLFormatter fors=new SimpleHTMLFormatter("<span style=\"color:red;\">", "</span>");

            Highlighter highlighter=new Highlighter(fors, scorer);

            System.out.println("query:" + query.toString());

            // 返回前10条

            TopDocs topDocs = searcher.search(query, 10);

            if (topDocs != null) {

                System.out.println("符合条件第文档总数：" + topDocs.totalHits);

                for (int i = 0; i < topDocs.scoreDocs.length; i++) {

                    Document doc = searcher.doc(topDocs.scoreDocs[i].doc);

                    TokenStream tokenStream=TokenSources.getAnyTokenStream(searcher.getIndexReader(), topDocs.scoreDocs[i].doc, field, analyzer);

                    Fragmenter  fragment=new SimpleSpanFragmenter(scorer);

                    highlighter.setTextFragmenter(fragment);

                    //高亮news_title域

                    String str=highlighter.getBestFragment(tokenStream, doc.get("news_title"));//获取高亮的片段，可以对其数量进行限制

                    System.out.println("高亮title："+str);

                    tokenStream=TokenSources.getAnyTokenStream(searcher.getIndexReader(), topDocs.scoreDocs[i].doc, "news_summary", analyzer);

                    str=highlighter.getBestFragment(tokenStream, doc.get("news_summary"));//获取高亮的片段，可以对其数量进行限制

                    System.out.println("高亮summary："+str);

                }

            }

            directory.close();

            dReader.close();

        } catch (Exception e) {

            e.printStackTrace();

        }

    }

}

结果：

Lucene查询结果高亮的更多相关文章

lucene 查询+分页+排序
lucene 查询+分页+排序 1.定义一个工厂类 LuceneFactory 1 import java.io.IOException; 2 3 import org.apache.lucene.a ...
Lucene7.2.1系列（三）查询及高亮
系列文章: Lucene系列(一)快速入门 Lucene系列(二)luke使用及索引文档的基本操作 Lucene系列(三)查询及高亮一准备创建项目并添加Maven依赖 <dependenc ...
Lucene 查询工具 LQT
Lucene Query Tool (lqt) 是一个命令行工具用来执行 Lucene 查询并对结果进行格式化输出. 使用方法: 01 $ ./lqt 02 usage: LuceneQueryToo ...
Lucene查询语法详解
Lucene查询 Lucene查询语法以可读的方式书写,然后使用JavaCC进行词法转换,转换成机器可识别的查询. 下面着重介绍下Lucene支持的查询: Terms词语查询词语搜索,支持单词和 ...
Lucene查询条数限制
运用Lucene进行索引,在查询的时候是有条数限制的 public virtual TopFieldDocs Search(Query query, Filter filter, int n, Sor ...
kibana使用（ELK）、Lucene 查询语法
Lucene查询 Lucene查询语法以可读的方式书写,然后使用JavaCC进行词法转换,转换成机器可识别的查询. 下面着重介绍下Lucene支持的查询: Terms词语查询词语搜索,支持单词和 ...
Lucene 查询分页技术
常用的Lucene查询代码如下所示,该代码的作用是将path路径下的所有索引信息返回 public String matchAll(String path) { try { Directory dir ...
query_string查询支持全部的Apache Lucene查询语法低频词划分依据模糊查询 Disjunction Max
3.3 基本查询3.3.1词条查询词条查询是未经分析的,要跟索引文档中的词条完全匹配注意:在输入数据中,title字段含有Crime and Punishment,但我们使用小写开头的crime来搜 ...
基于Lucene查询原理分析Elasticsearch的性能
前言 Elasticsearch是一个很火的分布式搜索系统,提供了非常强大而且易用的查询和分析能力,包括全文索引.模糊查询.多条件组合查询.地理位置查询等等,而且具有一定的分析聚合能力.因为其查询场景 ...

随机推荐

A Neural Algorithm of Artistic Style 图像风格转换 - keras简化版实现
前言深度学习是最近比较热的词语.说到深度学习的应用,第一个想到的就是Prisma App的图像风格转换.既然感兴趣就直接开始干,读了论文,一知半解:看了别人的源码,才算大概了解的具体的实现,也惊叹别 ...
Tab标签js切换高效率写法
原来的传统写法: function tabit(id,cid) { for(var i=0; i<10; i++){ gi(["tab"+i]).className = &q ...
js中三种全局变量声明方法
声明方式一: 使用var(关键字)+变量名(标识符)的方式在function外部声明,即为全局变量,否则在function声明的是局部变量.该方式即为显式声明详细如下: <script> ...
[JetBrains注册] 利用教育邮箱注册pycharm，idea等产品教程。
我们在使用JetBrains的一些产品时,大多使用网上的一些key去注册或者pojie的,但是由于提供这些key的服务器并不能保证稳定可用,所以可能一段时间我们使用的ide又需要重新pojie. 这里 ...
[LeetCode] Accounts Merge 账户合并
Given a list accounts, each element accounts[i] is a list of strings, where the first element accoun ...
Spring Boot简单应用——会员管理系统
简介本项目是使用Spring Boot编写的一个简单的会员管理系统. 提供了会员的解决方案,主要有会员模块,管理员模块,礼品模块,商品模块,会员等级模块,生日提醒模块,积分模块,详细模块如下图准备 ...
[Codeforces 864F]Cities Excursions
Description There are n cities in Berland. Some pairs of them are connected with m directed roads. O ...
UOJ #30. 【CF Round #278】Tourists
Description Cyberland 有 n 座城市,编号从 1 到 n,有 m 条双向道路连接这些城市.第 j 条路连接城市 aj 和 bj.每天,都有成千上万的游客来到 Cyberland ...
POJ - 3264：Balanced Lineup
ST表模版 #include<cstdio> #include<cstdlib> #include<algorithm> #include<cstring&g ...
[BZOJ]1177: [Apio2009]Oil
题目大意:给出一个n*m的矩阵,选出3个不相交的k*k子矩阵,使得子矩阵中元素和最大.(k<=n,m<=1500) 思路:选出的子矩阵有3种情况:横着排三个.竖着排三个.三角状分布(其中有 ...

Lucene查询结果高亮

检索结果高亮

实现效果：

核心代码

Lucene查询结果高亮的更多相关文章

随机推荐

热门专题