【Lucene】具体解释Lucene全文检索的信息写入与读取

Lucene的大致结构图：

信息写入索引库的过程：

读取信息的过程：

以下是一个向索引库写入信息与读取信息的样例：

public void testCreateIndex() throws Exception{

	/**

	 * 1、创建一个student对象，而且把信息存放进去

	 * 2、调用indexWriter的API把数据存放在索引库中

	 * 3、关闭indexWriter

	 */

	// 创建一个Student对象。而且把信息存放进去

	Student student = new Student();

	student.setId(1L);

	student.setName("张三");

	// 调用indexWriter的API把数据存放在索引库中

	   /**

		* 创建一个IndexWriter

		*    參数三个 1、索引库, 指向索引库的位置  2、分词器

		*/

	// 创建索引库

	Directory directory = FSDirectory.open(new File("./indexDir"));

	// 创建分词器

	Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_30);

	IndexWriter indexWriter = new IndexWriter(directory, analyzer, MaxFieldLength.LIMITED);

	// 把一个student对象转化成document

	Document document = new Document();

	Field idField = new Field("id",student.getId().toString(),Store.YES,Index.NOT_ANALYZED);

	Field nameField = new Field("name",student.getName(),Store.YES,Index.ANALYZED);

	document.add(idField);

	document.add(nameField);

	indexWriter.addDocument(document);

	// 关闭indexWriter

	indexWriter.close();

}

public void testSearchIndex() throws Exception{

	/**

	 * 1、创建一个IndexSearch对象

	 * 2、调用search方法进行检索

	 * 3、输出内容

	 */

	// 创建一个 IndexSearch对象

	Directory directory = FSDirectory.open(new File("./indexDir"));

	IndexSearcher indexSearcher = new IndexSearcher(directory);

	// 调用search方法进行检索

	Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_30);

	QueryParser queryParser = new QueryParser(Version.LUCENE_30,"name",analyzer);

	Query query = queryParser.parse("张");  // 要查找的关键词

	TopDocs topDocs = indexSearcher.search(query, 2);  // 前两条

	int count = topDocs.totalHits;  // 依据关键词查询出来的总的记录数

	ScoreDoc[] scoreDocs = topDocs.scoreDocs;

	List<Student> studentList = new ArrayList<Student>();

	for(ScoreDoc scoreDoc:scoreDocs){

		float score = scoreDoc.score;  // 关键词得分

		int index = scoreDoc.doc;  // 索引的下标

		Document document = indexSearcher.doc(index);

		// 把document转化成Student

		Student student = new  Student();

		student.setId(Long.parseLong(document.get("id")));  // document.getField("id").stringValue()

		student.setTitle(document.get("name"));

		studentList.add(student);

	}

	for(Student student:studentList){

		System.out.println(student.getId());

		System.out.println(student.getName());

	}

}

说明：

1、索引库的增、删、改是由indexWriter来操作的

2、同一个时刻内。同一个索引库，仅仅能同意一个indexWriter操作

3、当IndexWriter创建完毕以后，indexwriter所指向的索引库就被占据了。仅仅有当indexWriter.close时。才干释放锁的资源

4、当一个新的indexWriter想拥有索引库时，原来的indexWriter必须释放锁

5、仅仅要索引库中存在write.lock文件，说明上锁了

6、indexWriter.close有两层含义：1. 关闭IO资源； 2.释放锁

文件索引库和内存索引库的结合：

1、能不能设置非常多个索引库

能够设置非常多个索引库

2、索引库能不能合并起来

假设是内存索引库

Directory ramDirectory = new RamDirectory(Directory d);

这样就能够把一个索引库放入到内存索引库中

利用IndexWriter.addIndexesNoOptimize方法能够把非常多个索引库进行合并操作

3、应用程序能不能在内存中和索引库进行交互

Author：顾故

Sign：别输给以前的自己

【Lucene】具体解释Lucene全文检索的信息写入与读取的更多相关文章

Lucene3.6.2包介绍，第一个Lucene案例介绍，查看索引信息的工具lukeall介绍，Luke查看的索引库内容，索引查找过程
2.Lucene3.6.2包介绍,第一个Lucene案例介绍,查看索引信息的工具lukeall介绍,Luke查看的索引库内容,索引查找过程 2014-12-07 23:39 2623人阅读评论(0) ...
Lucene学习-深入Lucene分词器,TokenStream获取分词详细信息
Lucene学习-深入Lucene分词器,TokenStream获取分词详细信息在此回复牛妞的关于程序中分词器的问题,其实可以直接很简单的在词库中配置就好了,Lucene中分词的所有信息我们都可以从 ...
Lucene 01 - 初步认识全文检索和Lucene
目录 1 搜索简介 1.1 搜索实现方案 1.2 数据查询方法 1.2.1 顺序扫描法 1.2.2 倒排索引法(反向索引) 1.3 搜索技术应用场景 2 Lucene简介 2.1 Lucene是什么 ...
Lucene核心--构建Lucene搜索(上篇，理论篇)
2.1构建Lucene搜索 2.1.1 Lucene内容模型一个文档(document)就是Lucene建立索引和搜索的原子单元,它由一个或者多个字段(field)组成,字段才是Lucene的真实内 ...
Lucene4.6 把时间信息写入倒排索引的Offset偏移量中，并实现按时间位置查询
有个新的技术需求,需要对Lucene4.x的源码进行扩展,把如下的有时间位置的文本写入倒排索引,为此,我扩展了一个TimeTokenizer分词器,在这个分词器里将时间信息写入偏移量Offset中. ...
Lucene系列二：Lucene（Lucene介绍、Lucene架构、Lucene集成）
一.Lucene介绍 1. Lucene简介最受欢迎的java开源全文搜索引擎开发工具包.提供了完整的查询引擎和索引引擎,部分文本分词引擎(英文与德文两种西方语言).Lucene的目的是为软件开发人 ...
java将错误信息写入文件
第一种办法可以通过字符串,也就是先把错误信息写入字符串,再将字符串写入文件 import java.io.*; public class Demo { public static void main( ...
ZH奶酪：PHP error_log()将错误信息写入日志文件
error_log() 是发送错误信息到某个地方的一个函数,在程序编程中比较常见,尤其是在程序调试阶段. bool error_log ( string $message [, int $messag ...
将不同级别的logging 日志信息写入不同文件
将不同级别的logging 日志信息写入不同文件 # -*- coding: utf-8 -*- import os import time from logging.handlers import ...

随机推荐

easyUI 之datagrid 在前端自定义排序
首先先来看一下,直接从后台读取数据并展示到前端的列表,后端传回的数据是“按商品ID倒序排列” 前端源代码 $('#good_tables').datagrid({ nowrap: true, auto ...
文件操作-dd
Linux dd命令用于读取.转换并输出数据. dd可从标准输入或文件中读取数据,根据指定的格式来转换数据,再输出到文件.设备或标准输出. 参数说明: if=文件名: 输入文件名,缺省为标准输入.即 ...
uboot下include\autoconfig.mk分析
CONFIG_CMD_FAT=yCONFIG_HARD_I2C=yCONFIG_IMX_OTP=yCONFIG_CMD_ITEST=yCONFIG_ETH_PRIME=yCONFIG_CMD_BDI= ...
cs229_part6
part 6 接下来就是无监督学习算法了. k均值聚类问题背景样本集描述: \[ x\in D, x\in R^n \] 之前的有监督学习问题中,所有的x都有对应的y.但是如果我们的x没有对应的y ...
cs229_part3
接下来就是最最最重要的一个有监督学习算法了. 支持向量机问题背景样本集表示: \[(x,y)\in D, x\in R^n, y\in \{-1,+1\}\] 回到之前的逻辑回归模型中: 逻辑回归 ...
【MySQL】浅谈 varchar(N)
一前言 varchar(N) N代表什么意思,能存放多少个中文字符?属于老生常谈的问题了,今天又被一个开发同事问我关于这个问题,索性写一篇文章来具体介绍一下.二理论知识先说明一下 MySQL ...
安卓启动图去除顶部title和状态栏
1.在启动页的xml配置中,设置layout的id, <?xml version="1.0" encoding="utf-8"?> <Line ...
if-else优化
过多if-else分支的优化超过3个就应该去优化,说if-else过多的分支可以使用switch或者责任链模式等等方式来优化.确实,这是一个小问题,不过我们还是可以整理一下这个小问题的重构方式. ...
luogu3980 [NOI2008]志愿者招募
神题,还不太清楚 #include <iostream> #include <cstring> #include <cstdio> #include <que ...
【LeetCode】Palindrome Number(回文数)
这道题是LeetCode里的第9道题. 题目说的: 判断一个整数是否是回文数.回文数是指正序(从左向右)和倒序(从右向左)读都是一样的整数. 示例 1: 输入: 121 输出: true 示例 2: ...

【Lucene】具体解释Lucene全文检索的信息写入与读取

【Lucene】具体解释Lucene全文检索的信息写入与读取的更多相关文章

随机推荐

热门专题