1.创建索引

  

package com.DingYu.Test;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.UnsupportedEncodingException;
import java.nio.file.Paths; import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.Field.Store;
import org.apache.lucene.document.StoredField;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.junit.Test; /**
* 我们的目标是把索引和文档存入索引库中, 所以首先我们需要创建一个索引库 然后创建一个IndexWrite对象把索引,和文档对象写入,
* 文档对象中需要自己设置域,索引是通过分词器对域进行分词产生的, 所以我们需要分词器
*
* @author 丁宇
*
*/
public class LuceneTest {
/**
* 创建索引
* @throws IOException
*/
@Test
public void createIndex() throws IOException {
// 标准分词器
Analyzer analyzer = new StandardAnalyzer();
// 创建一个索引
Directory directory = FSDirectory.open(Paths.get("D:\\LuceneIndex"));
// 创建一个IndexWriteConfig对象
IndexWriterConfig config = new IndexWriterConfig(analyzer);
// 创建一个IndexWrite对象
IndexWriter write = new IndexWriter(directory, config);
// 获得所有文件下的文件
File[] files = new File("D:\\LuceneTest").listFiles();
for (File file : files) {
// 创建一个文档对象
Document document = new Document();
// 增加一个filepath域,不分析 不索引 但会存储在索引库里 把文件路径放到域中
Field field1 = new StoredField("filepath", file.getPath());
// 增加一个filename域,会分词,会索引,
Field field2 = new org.apache.lucene.document.TextField("filename", file.getName(), Store.YES);
// 增加一个fileContent域,会分词,会索引,只放文件内容的索引
Field field3 = new org.apache.lucene.document.TextField("filecontent", fileContent(file), Store.NO);
// 增加一个filesize域,不分析 不索引 但会存储在索引库里 把文件路径放到域中
Field field4 = new StoredField("filesize", file.length());
document.add(field1);
document.add(field2);
document.add(field3);
document.add(field4);
write.addDocument(document);
}
write.close();
}
/**
* 获得文件内容
* @param file
* @return
*/
public String fileContent(File file) {
byte[] fileContent = new byte[(int) file.length()];
FileInputStream in = null;
try {
in = new FileInputStream(file);
} catch (FileNotFoundException e2) {
e2.printStackTrace();
}
try {
in.read(fileContent);
} catch (IOException e1) {
e1.printStackTrace();
}
try {
in.close();
} catch (IOException e) {
e.printStackTrace();
}
try {
return new String(fileContent, "UTF-8");
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
return null;
}
}

2.查询索引

package com.DingYu.Test;

import java.io.IOException;
import java.nio.file.Path;
import java.nio.file.Paths; import org.apache.lucene.document.Document;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.BooleanClause.Occur;
import org.apache.lucene.search.BooleanQuery;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.NumericRangeQuery;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TermQuery;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.junit.Test; /**
* 查询索引
*
* @author 丁宇
*
*/
public class LuceneTest1 {
// 获得IndexSearcher对象
private IndexSearcher getIndexSearcher() throws IOException {
// 指定索引库
Directory directory = FSDirectory.open(Paths.get("D:\\LuceneIndex"));
// 打开索引库
IndexReader reader = DirectoryReader.open(directory);
// 创建查询的对象
IndexSearcher searcher = new IndexSearcher(reader);
return searcher;
} // 输出查到的内容
private void printIndex(TopDocs docs,IndexSearcher searcher) throws IOException {
// 获得顶部匹配记录
ScoreDoc[] scoreDocs = docs.scoreDocs;
// 获得在索引库中存着的文档的id,利用id去寻找文档
for (ScoreDoc scoreDoc : scoreDocs) {
// 获得id
int doc = scoreDoc.doc;
// 获得文档
Document document = searcher.doc(doc);
// 获得这个文档的域
System.out.println(document.get("filename"));
System.out.println(document.get("filecontent"));
System.out.println(document.get("filepath"));
System.out.println(document.get("filesize"));
System.out.println("------------------------");
}
}
/**
* 精准查询
* @throws IOException
*/
@Test
public void termQueryIndex() throws IOException { IndexSearcher searcher = getIndexSearcher();
// 选择合适的查询方法,这里用最简单的,具体的看下图
Query query = new TermQuery(new Term("filename", "txt"));
// 执行查询
TopDocs docs = searcher.search(query, 2);
//输出查询内容
printIndex(docs, searcher);
// 关闭索引库
searcher.getIndexReader().close();
}
/**
* 范围查询 五个参数 第一个域名,第二个第三个表示范围,第四个第五个表示是否包含最小值和最大值。
* @throws IOException
*/
@Test
public void numRangeQueryIndex() throws IOException {
IndexSearcher searcher = getIndexSearcher();
// 选择合适的查询方法,这里用最简单的,具体的看下图
Query query = NumericRangeQuery.newLongRange("filesize", 0L, 1000L, true, true);
// 执行查询
TopDocs docs = searcher.search(query, 2);
//输出查询内容
printIndex(docs, searcher);
// 关闭索引库
searcher.getIndexReader().close();
}
/**
* 组合查询
* @throws IOException
*/
@Test
public void booleanQueryIndex() throws IOException {
IndexSearcher searcher = getIndexSearcher();
BooleanQuery booleanQuery = new BooleanQuery();
Query query = new TermQuery(new Term("filename","txt"));
Query query2 = NumericRangeQuery.newLongRange("filesize", 0L, 1000L, true, true);
//表示query是必须的 query2也是必须 相当于并集
booleanQuery.add(query,Occur.MUST);
booleanQuery.add(query2, Occur.MUST);
// 执行查询
TopDocs docs = searcher.search(query, 2);
//输出查询内容
printIndex(docs, searcher);
// 关闭索引库
searcher.getIndexReader().close();
}
}

3.删除索引

package com.DingYu.Test;

import java.io.IOException;
import java.nio.file.Paths; import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.TermQuery;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.junit.Test; /**
* 删除索引 一般增删改都是同一个操作对象 这里使用IndexWriter对象
*
* @author 丁宇
*
*/
public class LuceneTest3 {
/**
* 获得IndexWrite对象
* @return
* @throws IOException
*/
public IndexWriter getIndexWrite() throws IOException {
Analyzer analyzer = new StandardAnalyzer();
Directory directory = FSDirectory.open(Paths.get("D:\\LuceneIndex"));
IndexWriterConfig config = new IndexWriterConfig(analyzer);
return new IndexWriter(directory, config);
} /**
* 删除所有的索引
*
* @throws IOException
*/
@Test
public void deleteAllIndex() throws IOException {
IndexWriter indexWrite = getIndexWrite();
indexWrite.deleteAll();
indexWrite.close();
}
/**
* 根据条件删除索引,同时删除文档
* @throws IOException
*/
@Test
public void deleteSomeIndex() throws IOException {
IndexWriter indexWrite = getIndexWrite();
Query query = new TermQuery(new Term("filename","txt"));
indexWrite.deleteDocuments(query);
indexWrite.close();
}
}

4.修改索引

package com.DingYu.Test;

import java.io.IOException;
import java.nio.file.Paths; import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field.Store;
import org.apache.lucene.document.StringField;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.IndexableField;
import org.apache.lucene.index.Term;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.junit.Test; /**
* 索引的修改
* @author 丁宇
*
*/
public class LuceneTest2 { private IndexWriter getIndexWriter() throws IOException {
Analyzer analyzer = new StandardAnalyzer();
Directory directory = FSDirectory.open(Paths.get("D:\\LuceneIndex"));
IndexWriterConfig config = new IndexWriterConfig(analyzer);
return new IndexWriter(directory, config);
} @Test
public void updateIndex() throws IOException {
IndexWriter indexWriter = getIndexWriter();
Document document = new Document();
document.add(new StringField("filename", "think in java", Store.YES));
//update 就是删除一个你指定的 创建一个你想要的 。
indexWriter.updateDocument(new Term("filecontent","txt"), document);
indexWriter.close();
}
}

Lucene的简单用法的更多相关文章

  1. 2、Lucene 最简单的使用(小例子)

    在了解了Lucene以后,我打算亲手来做一个Lucene的小例子,这个例子只是Lucene最简单的应用:使用Lucene实现标准的英文搜索: 1.下载Lucene 下载Lucene,到Lucene的官 ...

  2. CATransition(os开发之画面切换) 的简单用法

    CATransition 的简单用法 //引进CATransition 时要添加包“QuartzCore.framework”,然后引进“#import <QuartzCore/QuartzCo ...

  3. jquery.validate.js 表单验证简单用法

    引入jquery.validate.js插件以及Jquery,在最后加上这个插件的方法名来引用.$('form').validate(); <!DOCTYPE html PUBLIC " ...

  4. NSCharacterSet 简单用法

    NSCharacterSet 简单用法 NSCharacterSet其实是许多字符或者数字或者符号的组合,在网络处理的时候会用到 NSMutableCharacterSet *base = [NSMu ...

  5. [转]Valgrind简单用法

    [转]Valgrind简单用法 http://www.cnblogs.com/sunyubo/archive/2010/05/05/2282170.html Valgrind的主要作者Julian S ...

  6. Oracle的substr函数简单用法

    substr(字符串,截取开始位置,截取长度) //返回截取的字 substr('Hello World',0,1) //返回结果为 'H'  *从字符串第一个字符开始截取长度为1的字符串 subst ...

  7. Ext.Net学习笔记19:Ext.Net FormPanel 简单用法

    Ext.Net学习笔记19:Ext.Net FormPanel 简单用法 FormPanel是一个常用的控件,Ext.Net中的FormPanel控件同样具有非常丰富的功能,在接下来的笔记中我们将一起 ...

  8. TransactionScope简单用法

    记录TransactionScope简单用法,示例如下: void Test() { using (TransactionScope scope = new TransactionScope()) { ...

  9. WPF之Treeview控件简单用法

    TreeView:表示显示在树结构中分层数据具有项目可展开和折叠的控件 TreeView 的内容是可以包含丰富内容的 TreeViewItem 控件,如 Button 和 Image 控件.TreeV ...

随机推荐

  1. 背水一战 Windows 10 (122) - 其它: 通过 Windows.System.Profile 命名空间下的类获取信息, 查找指定类或接口的所在程序集的所有子类和子接口

    [源码下载] 背水一战 Windows 10 (122) - 其它: 通过 Windows.System.Profile 命名空间下的类获取信息, 查找指定类或接口的所在程序集的所有子类和子接口 作者 ...

  2. 「ZJOI2018」历史(LCT)

    「ZJOI2018」历史(LCT) \(ZJOI\) 也就数据结构可做了-- 题意:给定每个点 \(access\) 次数,使轻重链切换次数最大,带修改. \(30pts:\) 挺好想的.发现切换次数 ...

  3. 开源播放器 ijkplayer (五) :Linux/Ubuntu 下编译ijkplayer

    一.安装Git与yasm sudo apt-get install git sudo apt-get install yasm 二.下载和配置 SDK.NDK SDK一般开发时肯定都有的,NDK一般是 ...

  4. Metasploit Framework(5)弱点扫描

    文章的格式也许不是很好看,也没有什么合理的顺序 完全是想到什么写一些什么,但各个方面都涵盖到了 能耐下心看的朋友欢迎一起学习,大牛和杠精们请绕道 当我们发现了目标机器开放的端口,开启的服务等等之后 就 ...

  5. SpringMVC框架六:拦截器

    拦截器的概念就不介绍了: SpringMVC中拦截器的执行规则: 一个小示例展示: 我搞两个拦截器: 第一个: package org.dreamtech.springmvc.interceptor; ...

  6. 软件测试人员需要掌握的linux命令(二)

    2 设备管理 2.1 mount 名称 : mount 使用权限 : 系统管理者或/etc/fstab中允许的使用者 使用方式 : mount [-hV] mount [-fnrsvw] [-t vf ...

  7. 开源深度学习架构Caffe

    Caffe 全称为 Convolutional Architecture for Fast Feature Embedding,是一个被广泛使用的开源深度学习框架(在 TensorFlow 出现之前一 ...

  8. JWT(Json web token)简介

    Json web token (JWT), 是为了在网络应用环境间传递声明而执行的一种基于JSON的开放标准((RFC 7519).该token被设计为紧凑且安全的,特别适用于分布式站点的单点登录(S ...

  9. [原创]K8Cscan插件之Cisco思科设备扫描(IP、设备型号、主机名、Boot、硬件版本)

    [原创]K8 Cscan 大型内网渗透自定义扫描器 https://www.cnblogs.com/k8gege/p/10519321.html Cscan简介:何为自定义扫描器?其实也是插件化,但C ...

  10. 如何批量添加图片到ppt的方法

    如何批量添加图片到ppt 许多时候会做一些幻灯片,需要大量的图片,但是往往一张以张的加图片,会很浪费时间,如何快速添加图片,一次解决呢? 步骤:插入-相册-点击相册 点击文件,批量选择你要插入的图片, ...