lucene4之后的近实时搜索实现

好久没干这块东西了，近几天须要做这个。所以又一次学了一下。首先很感谢孔浩老师，没孔浩老师的视频我也不会进入lucene的殿堂。

老师当时讲的实时搜索还是NRTManager,如今已经都变了，这个类已经不存在了，在4.0之后消失的。到我如今使用的5.2.1都是以下的方法：

首先罗列会使用的特殊类（经常使用的不再赘述）:

TrackingIndexWriter 追踪writer，在api中有介绍，仅仅有通过这个类进行更新ControlledRealTimeReopenThread才干获得更新

ControlledRealTimeReopenThread 实时搜索事实上叫做“近实时搜索”。就是当更新之后在非常短时间内进行了更新然后让人感觉不出来，这样说来就须要一个守护线程去坚守这个过程，当更新的时候就去获取更新然后通知查询更新了，这样“近实时搜索”就实现了，这个类就是这个守护线程。

我写了个測试在以下，里面不懂得能够查看api。也有部分凝视，希望对大家有帮助。

package com.xikoubuy.main;

import java.io.IOException;

import org.apache.lucene.analysis.Analyzer;

import org.apache.lucene.document.Document;

import org.apache.lucene.document.Field;

import org.apache.lucene.document.TextField;

import org.apache.lucene.index.IndexWriter;

import org.apache.lucene.index.IndexWriterConfig;

import org.apache.lucene.index.TrackingIndexWriter;

import org.apache.lucene.queryparser.classic.ParseException;

import org.apache.lucene.queryparser.classic.QueryParser;

import org.apache.lucene.search.ControlledRealTimeReopenThread;

import org.apache.lucene.search.IndexSearcher;

import org.apache.lucene.search.Query;

import org.apache.lucene.search.ReferenceManager;

import org.apache.lucene.search.ScoreDoc;

import org.apache.lucene.search.SearcherFactory;

import org.apache.lucene.search.SearcherManager;

import org.apache.lucene.store.Directory;

import org.apache.lucene.store.RAMDirectory;

import org.wltea.analyzer.lucene.IKAnalyzer;

public class NRTTest {

private Directory directory;

private Analyzer analyzer;

////追踪writer。这样才干在更新之后通知搜索

private TrackingIndexWriter writer;

//是线程安全的.第二个參数是是否在全部缓存清空后让search看到

private SearcherManager searcherManager;

private IndexSearcher searcher;

public static void main(String[] args) throws IOException {

new NRTTest();

}

public NRTTest() throws IOException {

directory = new RAMDirectory();

analyzer = new IKAnalyzer(true);

IndexWriterConfig indexWriterConfig = new IndexWriterConfig(analyzer);

IndexWriter indexWriter = new IndexWriter(directory, indexWriterConfig);

writer = new TrackingIndexWriter(indexWriter);

searcherManager = new SearcherManager(indexWriter, true, new SearcherFactory());

ControlledRealTimeReopenThread CRTReopenThead = new ControlledRealTimeReopenThread(writer, searcherManager, 5.0, 0.025);

//守护线程，又叫后台线程，级别比較低，假设没有主线程这个也会消失，这个线程作用就是定期更新让searchManager管理的search能获得更新

CRTReopenThead.setDaemon(true);

CRTReopenThead.setName("更新线程");

CRTReopenThead.start();

this.addDoc();

this.searchDoc();

}

public synchronized void addDoc(){

final int i = 0;

new Thread(){

public void run() {

while(true){

try {

Thread.sleep(10000);

System.out.println("----增加文档中");

Document doc = new Document();

doc.add(new Field("title", "标题" + i, TextField.TYPE_STORED));

doc.add(new Field("content", "我爱你中国" + i, TextField.TYPE_STORED));

writer.addDocument(doc);

} catch (InterruptedException e) {

// TODO Auto-generated catch block

e.printStackTrace();

} catch (IOException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

}

};

}.start();

}

public synchronized void searchDoc(){

new Thread(){

public void run() {

while(true){

try {

Thread.sleep(5000);

System.out.println("----检索中");

searcher = searcherManager.acquire();

QueryParser parser = new QueryParser("content", analyzer);

Query query = parser.parse("中国");

ScoreDoc [] hits = searcher.search(query, 100).scoreDocs;

for(int i = 0; i < hits.length;i++){

Document doc = searcher.doc(hits[i].doc );

System.out.println(doc.get("title") + hits[i].doc);

}

} catch (InterruptedException e) {

// TODO Auto-generated catch block

e.printStackTrace();

} catch (IOException e) {

// TODO Auto-generated catch block

e.printStackTrace();

} catch (ParseException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

finally{

try {

searcherManager.release(searcher);

} catch (IOException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

}

searcher = null;

}

};

}.start();

}

}

lucene4之后的近实时搜索实现的更多相关文章

lucene4.5近实时搜索
近实时搜索就是他能打开一个IndexWriter快速搜索索引变更的内容,而不必关闭writer,或者向writer提交,这个功能是在2.9版本以后引入的,在以前没有这个功能时,必须调用writer的c ...
Lucene.net 实现近实时搜索（NRT）和增量索引
Lucene做站内搜索的时候经常会遇到实时搜索的应用场景,比如用户搜索的功能.实现实时搜索,最普通的做法是,添加新的document之后,调用 IndexWriter 的 Commit 方法把内存中的 ...
Lucene系列-近实时搜索(1)
近实时搜索(near-real-time)可以搜索IndexWriter还未commit的内容,介于immediate和eventual之间,在数据比较大.更新较频繁的情况下使用.本文主要来介绍下如何 ...
【Lucene】近实时搜索
近实时搜索:可以使用一个打开的IndexWriter快速搜索索引的变更内容,而不必首先关闭writer,或者向该writer提交:这是2.9版本之后推出的新功能. 代码示例(本例参考<Lucen ...
剖析Elasticsearch集群系列之三：近实时搜索、深层分页问题和搜索相关性权衡之道
转载:http://www.infoq.com/cn/articles/anatomy-of-an-elasticsearch-cluster-part03 近实时搜索虽然Elasticsearch ...
solr 近实时搜索
摘要: Solr的近实时搜索NRT(Near Real Time Searching)意味着文档可以在索引以后马上可以被查询到. Solr不会因为本次提交而阻塞更新操作,不会等待后台合并操作(merg ...
Solr -- 实时搜索
在solr中,实时搜索有3种方案 ①soft commit,这其实是近实时搜索,不能完全实时. ②RealTimeGet,这是实时,但只支持根据文档ID的查询. ③和第一种类似,只是触发softcom ...
sphinx通过增量索引实现近实时更新
一.sphinx增量索引实现近实时更新设置数据库中的已有数据很大,又不断有新数据加入到数据库中,也希望能够检索到.全部重新建立索引很消耗资源,因为我们需要更新的数据相比较而言很少. 例如.原来的数据 ...
【搜索引擎】Solr全文检索近实时查询优化
设置多个搜索建议查找算法 <searchComponent name="suggest" class="solr.SuggestComponent"> ...

随机推荐

T-SQL语句3
一.删除表 1.drop table语句 drop table database_name,schema_name,table_name 2.删除数据表 drop table dbo.t_delete ...
yum list失败
搭建了本地yum源,用yum list 测试报如下错误: [root@heguol ~]# yum list error: rpmdb: BDB0113 Thread/process ye67ww ...
webstorm减少内存占用
首先,按照我说的设置之后要重启才行. 在项目里找到不需要监听的文件夹右键:Mark Directory As => Cancel Exclusion 然后重启,嘿嘿,成功了!
ClouderaManager中Event Server报No such file or directory
错误日志如下: 2015-06-24 06:13:10,176 ERROR com.cloudera.cmf.eventcatcher.server.EventCatcherService: Erro ...
008 jquery过滤选择器-----------（子元素过滤选择器）
1.介紹 2.程序 <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> < ...
vue.js阻止事件冒泡和默认事件
首先我们来看原生JS取消事件冒泡方法: e.stopPropagation(); //非IE浏览器window.event.cancelBubble = true; //IE浏览器原生JS阻止默认事 ...
Python实现截图
本文主要介绍了Python实现截图的两种方式,使用PIL的方法和不使用PIL的方法.文中也涉及到了一些位图的知识.
在 Intellij IDEA 中部署 Java 应用到阿里云 ECS
你有没有怀疑过人生多的去了在开发过程中,发布部署项目是一件令人头疼的事拿springboot项目来说吧(springboot算是已经极大简化了部署了) 步骤运行clean install 将打 ...
Java 多线程 - synchronize 关键字
目录 Java 多线程 - synchronize 关键字 Java 多线程 - synchronize 关键字学习自 http://cmsblogs.com/?p=2071 https://www ...
BZOJ4556 HEOI2016字符串
没错,又是这题,使用后缀自动机,反向建树,主席树维护right集合. By:大奕哥 #include<bits/stdc++.h> using namespace std; ; ]; ch ...

lucene4之后的近实时搜索实现

lucene4之后的近实时搜索实现的更多相关文章

随机推荐

热门专题