*lucene索引_的删除和更新

【删除】

【恢复删除】

【强制删除】

【优化和合并】

【更新索引】

附：

代码：

IndexUtil.java：

 package cn.hk.index;

 import java.io.File;

 import java.io.IOException;

 import org.apache.lucene.analysis.standard.StandardAnalyzer;

 import org.apache.lucene.document.Document;

 import org.apache.lucene.document.Field;

 import org.apache.lucene.index.CorruptIndexException;

 import org.apache.lucene.index.IndexReader;

 import org.apache.lucene.index.IndexWriter;

 import org.apache.lucene.index.IndexWriterConfig;

 import org.apache.lucene.index.StaleReaderException;

 import org.apache.lucene.index.Term;

 import org.apache.lucene.store.Directory;

 import org.apache.lucene.store.FSDirectory;

 import org.apache.lucene.store.LockObtainFailedException;

 import org.apache.lucene.util.Version;

 public class IndexUtil {

     private String[] ids = {"1","2","3","4","5","6"};

     private String[] emails = {"aa@hk.arg","bb@hk.org","cc@hk.arg",

                                "dd@hk.org","ee@hk.org","ff@hk.org"};

     private String[] content = {

             "welcome to visited the space","hello boy","my name is aa","i like football",

             "I like football and I like Basketball too","I like movie and swim"

     };

     private int[] attachs = {2,3,1,4,5,5};

     private String[] names = {"zhangsan","lisi","john","mike","jetty","jake"};

     private Directory directory = null;

     public IndexUtil(){

         try {

             directory = FSDirectory.open(new File("d://lucene/index02"));

         } catch (IOException e) {

             e.printStackTrace();

         }

     }

     public void update(){

         IndexWriter writer =null;

         try {

             writer = new IndexWriter(directory,

                     new IndexWriterConfig(Version.LUCENE_35,new StandardAnalyzer(Version.LUCENE_35)));

             /*

              * lucene并没有提供更新的方法，这里的更新其实是提供如下两个操作：

              * 先删除之后再添加

              */

             Document doc = new Document();

             doc.add(new Field("id","11",Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS));

             doc.add(new Field("email",emails[0],Field.Store.YES,Field.Index.NOT_ANALYZED));

             doc.add(new Field("content",content[0],Field.Store.NO,Field.Index.ANALYZED));

             doc.add(new Field("name",names[0],Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS));

             writer.updateDocument(new Term("id","1"),doc);

         } catch (CorruptIndexException e) {

             e.printStackTrace();

         } catch (LockObtainFailedException e) {

             e.printStackTrace();

         } catch (IOException e) {

             e.printStackTrace();

         }finally{

             if(writer != null)

                 try {

                     writer.close();

                 } catch (CorruptIndexException e) {

                     e.printStackTrace();

                 } catch (IOException e) {

                     e.printStackTrace();

                 }

         }

     }

     public void merge(){

         IndexWriter writer = null;

         try {

             writer = new IndexWriter(directory,

                     new IndexWriterConfig(Version.LUCENE_35, new StandardAnalyzer(Version.LUCENE_35)));

             //会将索引合并为2段，这两段中的被删除的数据会被清空

             //特别注意：此处在lucene3.5后不建议使用，因为会消耗大量的开销，

             //lucene会根据情况自动处理的

             writer.forceMerge(2);

         } catch (CorruptIndexException e) {

             e.printStackTrace();

         } catch (LockObtainFailedException e) {

             e.printStackTrace();

         } catch (IOException e) {

             e.printStackTrace();

         }finally{

             if(writer != null)

                 try {

                     writer.close();

                 } catch (CorruptIndexException e) {

                     e.printStackTrace();

                 } catch (IOException e) {

                     e.printStackTrace();

                 }

         }

     }

     public void forceDelete(){

         IndexWriter writer = null;

         try {

             writer = new IndexWriter(directory,

                     new IndexWriterConfig(Version.LUCENE_35,new StandardAnalyzer(Version.LUCENE_35)));

             writer.forceMergeDeletes();

         } catch (CorruptIndexException e) {

             e.printStackTrace();

         } catch (LockObtainFailedException e) {

             e.printStackTrace();

         } catch (IOException e) {

             e.printStackTrace();

         }finally{

             if(writer != null)

                 try {

                     writer.close();

                 } catch (CorruptIndexException e) {

                     e.printStackTrace();

                 } catch (IOException e) {

                     e.printStackTrace();

                 }

         }

     }

     public void undelete(){

         //使用IndexReader进行恢复

         try {

             IndexReader reader = IndexReader.open(directory,false);

             //回复时，必须把IndexReader的只读（readyonly）设置为FALSE

             reader.undeleteAll();

             reader.close();

         } catch (StaleReaderException e) {

             e.printStackTrace();

         } catch (CorruptIndexException e) {

             e.printStackTrace();

         } catch (LockObtainFailedException e) {

             e.printStackTrace();

         } catch (IOException e) {

             // TODO Auto-generated catch block

             e.printStackTrace();

         }

     }

     public void delete(){

         IndexWriter writer = null;

         try {

             writer = new IndexWriter(directory,

                     new IndexWriterConfig(Version.LUCENE_35, new StandardAnalyzer(Version.LUCENE_35)));

             //删除ID为1的文档

             //参数可以是一个选项，可以是一个Query，也可以是一个Term，Term是一个精确查找的值

             //此时删除的文档并不会被完全删除，而是存储在回收站中的，可以恢复

             writer.deleteDocuments(new Term("id","1"));

         } catch (CorruptIndexException e) {

             e.printStackTrace();

         } catch (LockObtainFailedException e) {

             e.printStackTrace();

         } catch (IOException e) {

             e.printStackTrace();

         }finally{

             if(writer != null)

                 try {

                     writer.close();

                 } catch (CorruptIndexException e) {

                     e.printStackTrace();

                 } catch (IOException e) {

                     e.printStackTrace();

                 }

         }

     }

     public void query(){

         try {

             IndexReader reader = IndexReader.open(directory);

             //通过reader可以获取文档的数量

             System.out.println("numDocs:" + reader.numDocs());

             System.out.println("maxDocs" + reader.maxDoc());

             System.out.println("deleteDocs:" + reader.numDeletedDocs());

             reader.close();

         } catch (CorruptIndexException e) {

             e.printStackTrace();

         } catch (IOException e) {

             e.printStackTrace();

         }

     }

     public void index(){

         IndexWriter writer = null;

         try {

             writer = new IndexWriter(directory,new IndexWriterConfig(Version.LUCENE_35, new StandardAnalyzer(Version.LUCENE_35)));

             Document doc = null;

             for(int i=0;i<ids.length;i++){

                 doc = new Document();

                 doc.add(new Field("id",ids[i],Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS));

                 doc.add(new Field("email",emails[i],Field.Store.YES,Field.Index.NOT_ANALYZED));

                 doc.add(new Field("content",content[i],Field.Store.NO,Field.Index.ANALYZED));

                 doc.add(new Field("name",names[i],Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS));

                 writer.addDocument(doc);

             }

         } catch (CorruptIndexException e) {

             e.printStackTrace();

         } catch (LockObtainFailedException e) {

             e.printStackTrace();

         } catch (IOException e) {

             e.printStackTrace();

         }finally{

                 if(writer != null)

                     try {

                         writer.close();

                     } catch (CorruptIndexException e) {

                         e.printStackTrace();

                     } catch (IOException e) {

                         e.printStackTrace();

                     }

         }

     }

 }

TestIndex.java：

 package cn.hk.test;

 import org.junit.Test;

 import cn.hk.index.IndexUtil;

 public class TestIndex {

     @Test

     public void testIndex(){

         IndexUtil iu = new IndexUtil();

         iu.index();

     }

     @Test

     public void testQuery(){

         IndexUtil iu = new IndexUtil();

         iu.query();

     }

     @Test

     public void testDelete(){

         IndexUtil iu = new IndexUtil();

         iu.delete();

     }

     @Test

     public void testUnDelete(){

         IndexUtil iu = new IndexUtil();

         iu.undelete();

     }

     @Test

     public void testForceDelete(){

         IndexUtil iu = new IndexUtil();

         iu.forceDelete();

     }

     public void testMerge(){

         IndexUtil  iu = new IndexUtil();

         iu.merge();

     }

     @Test

     public void testUpdate(){

         IndexUtil iu = new IndexUtil();

         iu.update();

     }

 }

*lucene索引_的删除和更新的更多相关文章

*lucene索引_创建_域选项
[索引建立步骤] [创建Directory] [创建writer] [创建文档并添加索引] 文档和域的概念很重要文档相当于表中的每一条记录,域相当于表中的每一个字段. [查询索引的基本信息] 使用I ...
Lucene系列五：Lucene索引详解（IndexWriter详解、Document详解、索引更新）
一.IndexWriter详解问题1:索引创建过程完成什么事? 分词.存储到反向索引中 1. 回顾Lucene架构图: 介绍我们编写的应用程序要完成数据的收集,再将数据以document的形式用lu ...
Lucene——索引的创建、删除、修改
package cn.tz.lucene; import java.io.File; import java.util.ArrayList; import java.util.List; import ...
Lucene索引维护(添加、修改、删除)
1. Field域属性分类添加文档的时候,我们文档当中包含多个域,那么域的类型是我们自定义的,上个案例使用的TextField域,那么这个域他会自动分词,然后存储我们要根据数 ...
Lucene——索引过程分析Index
Lucene索引过程分为3个主要操作步骤:将原始文档转换成文本.分析文本.将分析好的文本保存至索引中一.提取文本和创建文档从 pdf.word等非纯文本格式文件中,提取文本格式信息.建立起对应的, ...
【手把手教你全文检索】Lucene索引的【增、删、改、查】
前言搞检索的,应该多少都会了解Lucene一些,它开源而且简单上手,官方API足够编写些小DEMO.并且根据倒排索引,实现快速检索.本文就简单的实现增量添加索引,删除索引,通过关键字查询,以及更新索 ...
理解Lucene索引与搜索过程中的核心类
理解索引过程中的核心类执行简单索引的时候需要用的类有: IndexWriter.Directory.Analyzer.Document.Field 1.IndexWriter IndexWr ...
lucene索引
一.lucene索引 1.文档层次结构索引(Index):一个索引放在一个文件夹中: 段(Segment):一个索引中可以有很多段,段与段之间是独立的,添加新的文档可能产生新段,不同的段可以合并成一 ...
Lucene 索引功能
Lucene 数据建模基本概念文档(doc): 文档是 Lucene 索引和搜索的原子单元,文档是一个包含多个域的容器. 域(field): 域包含“真正的”被搜索的内容,每一个域都有一个标识名称 ...

随机推荐

网站如何从http升级成https
基本概念: HTTP: 是互联网上应用最为广泛的一种网络协议,是一个客户端和服务器端请求和应答的标准,用于从WWW服务器传输超文本到本地浏览器的传输协议,它可以使浏览器更加高效,使网络传输减少. HT ...
DNS练习之正向解析
配置正向解析: 主机名:sishen63 主机IP:192.168.1.63 操作系统:Red Hat Enterprise Linux Server release 6.5 (Santiago) 安 ...
Vue 页面加载闪现代码问题
CSS中 [v-cloak] { display: none; } HTML中 <div v-cloak> {{ message }} </div> 显示代码主要是{{}}这个 ...
浅议block实现原理，block为什么使用copy关键字？
1.block是一个特殊的oc对象,建立在栈上,而不是堆上,这么做一个是为性能考虑,还有就是方便访问局部变量. 2.默认Block使用到的局部变量会被copy,而不是retain.所以,他无法改变局部 ...
Spring Boot学到的内容
Hello World:了解程序入口(创建启动类) Web程序:写Controller类(@RestController),写Controller方法(@GetMapping),maven依赖spri ...
jq获取设置选中值
var standard = $('input[name="standard"]:checked').val(); $("input[name='advertByid'] ...
再遇BGP
第一次遇到BGP,是在大学的课堂上,现在再次看到它,有种深深的无奈,我只记得它的名字,忘记了它的样子. 那么什么是BGP呢? 翻译过来就是边界网关协议,一个用来网络数据进行选路的路由协议,使用TCP协 ...
原创齐天大圣老司机亲传rescue恢复磁盘分区
老葵花哥哥课堂开课了本文档秉承爱看不看的原则一不要钱二服务大众的高尚情操咱们今天讲一讲rescue恢复磁盘分区首先咱们搭建环境搞起来 (parted) mkpart #创建分区 Partitio ...
PHP一句话后门过狗姿势万千之后门构造与隐藏
第二章节主要带给大家一些后门构造思路,与安全狗文件特征检测的机制. 另外强调一下,这篇文章需要大家对于php有一定的认识. 本章节分为三大部分,第一部分针对初级,分析菜刀php代码的执行过程,较基础: ...
Java随机产生中文昵称
有时候我们注册一个网站第一次登陆系统会产生一个随机昵称供用户选择,在项目测试阶段遇到了这个问题,因为注册时没有让用户填写昵称,于是找了两种产生随机中文昵称的方法: 代码如下 package com.u ...

*lucene索引_的删除和更新

【删除】

【恢复删除】

【强制删除】

【优化和合并】

【更新索引】

*lucene索引_的删除和更新的更多相关文章

随机推荐

热门专题