lucene4.6 索引创建和搜索例子

本文转自：http://blog.csdn.net/jyf211314/article/details/17503997 点击打开链接

lucene4.6小例子，Lucene全文检索步骤大体上有两方面：索引过程和搜索过程，具体如下：

1.索引过程

<1>创建IndexWriter,它的作用是用来写索引文件，

可以将IndexWriter看做是一个特定类型的数据库,用来存放各种表,可以将Document看做是一张张的表。

IndexWriter iw=new IndexWriter(Directory dire, IndexWriterConfig iwc);

可见,该方法有两个参数,第一个参数为索引存放位置,参数类型为Directory,第二个参数为 IndexWriter的配置类,

@1.Directory dire=FSDirectory.open(new File(D:\\lucenefiles));

通过Directory的创建指定索引存放位置(D:\lucenefiles文件夹)

@2.Analyzer analyzer=new StandardAnalyzer(Version.LUCENE_46);

通过Analyzer 的创建指定索引语言词汇的分析器。当前版本Lucene-core-4.6.0

@3.IndexWriterConfig iwc=new IndexWriterConfig(Version.LUCENE_46, analyzer);

iwc.setOpenMode(OpenMode.CREATE); //CREATE：清空重建(推荐);

IndexWriter indexWriter=new IndexWriter(dire, iwc);

通过IndexWriterConfig的创建指定索引版本和语言词汇分析器

<2>创建Document,代表要索引的文档，

可以将Document看做是数据库中的一张张的表,而每个field都是表中的一个colum用来存放各种类型的信息,如标题、作者、时间等等

@1.File fileDir= new File("D:\\lucenefiles");
File[] files = fileDir.listFiles();

读取文件

@2.Document doc=new Document();

通过创建Document指定要索引的文档

@3.doc.add(new TextField("name", String name=files[i].getName(), Store.YES));

doc.add(new TextField("content", getFileContent(files[i]), Store.YES));

向Document文档中添加Field信息,不同类型的信息用不同类型的Field来表示;

getFileContent(File file)用于读取文件内容。

<3>将Document添加到IndexWriter中并且提交，

表（Document）创建好之后,当然要添加到数据库（IndexWriter）中,同时commit

@1.indexWriter.addDocument(doc); 通过该方法添加

indexWriter.commit();

2.搜索过程

<!>首先指定搜索目录

Directory dire=FSDirectory.open(new File("D:\\luceneindex"));

<2>创建语言词汇解析器，前后版本要一致

Analyzer analyzer=new StandardAnalyzer(Version.LUCENE_46);

<3>创建IndexReader将搜索目录读取到内存,

IndexReader ireader=DirectoryReader.open(dire);

<4>创建IndexSearcher准备搜索

IndexSearcher isearcher=new IndexSearcher(ireader);

<5>创建QueryParser对查询语句进行语法分析,确定搜索的内容

QueryParser parser = new QueryParser(Version.LUCENE_46, "path", analyzer);

<6>创建Query生成查询语法树,

QueryParser parser = new QueryParser(Version.LUCENE_46, "content", analyzer);

通过调用QueryParser 的parse("");方法来生成Query以及查询语法树

Query query = parser.parse("程序员");

<7>获取搜索结果

TopDocs td=is.search(query, 1000);ScoreDoc[] sds =td.scoreDocs;

<8>对搜索结果遍历操作

3.以下是个人测试例子

public class Constants {

	public final static String INDEX_FILE_PATH = "F:\\lucene\\test";

//索引的文件的存放路径 测试时可以在本目录下自行建一些文档,内容自行编辑即可

    public final static String INDEX_STORE_PATH = "F:\\lucene\\index";

//索引的存放位置

}

package com.lucene.jl;

import java.io.BufferedReader;

import java.io.File;

import java.io.FileInputStream;

import java.io.InputStreamReader;

import org.apache.lucene.analysis.Analyzer;

import org.apache.lucene.analysis.standard.StandardAnalyzer;

import org.apache.lucene.document.Document;

import org.apache.lucene.document.Field.Store;

import org.apache.lucene.document.TextField;

import org.apache.lucene.index.DirectoryReader;

import org.apache.lucene.index.IndexReader;

import org.apache.lucene.index.IndexWriter;

import org.apache.lucene.index.IndexWriterConfig;

import org.apache.lucene.queryparser.classic.QueryParser;

import org.apache.lucene.search.IndexSearcher;

import org.apache.lucene.search.Query;

import org.apache.lucene.search.ScoreDoc;

import org.apache.lucene.search.TopDocs;

import org.apache.lucene.store.Directory;

import org.apache.lucene.store.FSDirectory;

import org.apache.lucene.util.Version;

public class LuceneIndex {

	/**

	 * 创建索引

	 * @param analyzer

	 * @throws Exception

	 */

	public static void createIndex(Analyzer analyzer) throws Exception{

		Directory dire=FSDirectory.open(new File(Constants.INDEX_STORE_PATH));

		IndexWriterConfig iwc=new IndexWriterConfig(Version.LUCENE_46, analyzer);

		IndexWriter iw=new IndexWriter(dire, iwc);

		LuceneIndex.addDoc(iw);

		iw.close();

	}

	/**

	 * 动态添加Document

	 * @param iw

	 * @throws Exception

	 */

	public static void addDoc(IndexWriter iw)  throws Exception{

		File[] files=new File(Constants.INDEX_FILE_PATH).listFiles();

		for (File file : files) {

			Document doc=new Document();

			String content=LuceneIndex.getContent(file);

			String name=file.getName();

			String path=file.getAbsolutePath();

			doc.add(new TextField("content", content, Store.YES));

			doc.add(new TextField("name", name, Store.YES));

			doc.add(new TextField("path", path,Store.YES));

			System.out.println(name+"==="+content+"==="+path);

			iw.addDocument(doc);

			iw.commit();

		}

	}

	/**

	 * 获取文本内容

	 * @param file

	 * @return

	 * @throws Exception

	 */

	@SuppressWarnings("resource")

	public static String getContent(File file) throws Exception{

		FileInputStream fis=new FileInputStream(file);

		InputStreamReader isr=new InputStreamReader(fis);

		BufferedReader br=new BufferedReader(isr);

		StringBuffer sb=new StringBuffer();

		String line=br.readLine();

		while(line!=null){

			sb.append(line+"\n");

			line=null;

		}

		return sb.toString();

	}

	/**

	 * 搜索

	 * @param query

	 * @throws Exception

	 */

	private static void search(Query query) throws Exception {

		Directory dire=FSDirectory.open(new File(Constants.INDEX_STORE_PATH));

		IndexReader ir=DirectoryReader.open(dire);

		IndexSearcher is=new IndexSearcher(ir);

		TopDocs td=is.search(query, 1000);

		System.out.println("共为您查找到"+td.totalHits+"条结果");

		ScoreDoc[] sds =td.scoreDocs;

		for (ScoreDoc sd : sds) {

			Document d = is.doc(sd.doc);

			System.out.println(d.get("path") + ":["+d.get("path")+"]");

		}

	}

	public static void main(String[] args) throws Exception, Exception {

		Analyzer analyzer=new StandardAnalyzer(Version.LUCENE_46);

		LuceneIndex.createIndex(analyzer);

		QueryParser parser = new QueryParser(Version.LUCENE_46, "content", analyzer);

		Query query = parser.parse("人");

		LuceneIndex.search(query);

	}

}

4.磁盘文件检索如上述,对于数据库的检索页应该是差不多,应该也是先从数据库查出数据，然后对查出的数据做索引然后搜索,大致一样吧

lucene4.6 索引创建和搜索例子的更多相关文章

Lucene7.1.0版本的索引创建与查询以及维护,包括新版本的一些新特性探索!
一吐槽 lucene版本更新实在太快了,往往旧版本都还没学会,新的就出来,而且每个版本改动都特别大,尤其是4.7,6,6,7.1.......ε=(´ο｀*)))唉,但不可否认,新版本确实要比旧版本 ...
lucene4入门（2）搜索
欢迎转载http://www.cnblogs.com/shizhongtao/p/3440479.html 接着上一篇,这里继续搜索,对于搜索和创建一样,首先你要确定搜索位置,然后用规定的类来读取.还 ...
关于lucene的IndexSearcher单实例,对于索引的实时搜索
Lucene版本:3.0 一般情况下,lucene的IndexSearcher都要写成单实例,因为每次创建IndexSearcher对象的时候,它都需要把索引文件加载进来,如果访问量比较大,而索引也比 ...
mysql 优化实例之索引创建
mysql 优化实例之索引创建优化前: pt-query-degist分析结果: # Query 23: 0.00 QPS, 0.00x concurrency, ID 0x78761E301CC7 ...
MongoDB索引创建（5）
索引创建 1:索引提高查询速度,降低写入速度,权衡常用的查询字段,不必在太多列上建索引 2. 在mongodb中,索引可以按字段升序/降序来创建,便于排序 3. 默认是用btree来组织索引文件,2. ...
数据结构二叉树的java实现，包括二叉树的创建、搜索、删除和遍历
根据自己的学习体会并参考了一些网上的资料,以java写出了二叉树的创建.搜索.删除和遍历等操作,尚未实现的功能有:根据先序和中序遍历,得到后序遍历以及根据后序和中序遍历,得到先序遍历,以及获取栈的深度 ...
索引-mysql索引创建、查看、删除及使用示例
mysql索引创建.查看.删除及使用示例 1.创建索引: ALTER TABLE用来创建普通索引.UNIQUE索引或PRIMARY KEY索引. ALTER TABLE table_name ADD ...
solr索引创建流程
solr索引创建流程: 分词组件Tokenizer 分词组件(Tokenizer)会做以下几件事情(这个过程称为:Tokenize),处理得到的结果是词汇单元(Token). 1.将文档分成一个一个单 ...
ArcEngine创建IElement简单例子
转自IT-GIS终结者原文ArcEngine创建IElement简单例子代码下载地址:http://files.cnblogs.com/ogis/MapControlApplication2.rar ...

随机推荐

(转)Maven实战（二）构建简单Maven项目
上一节讲了maven的安装和配置,这一节我们来学习一下创建一个简单的Maven项目 1. 用Maven 命令创建一个简单的Maven项目在cmd中运行如下命令: mvn archetype:gene ...
如何判断手机收有几张SIM卡
//判断卡槽1中是不是有卡 boolean hasIccCard1 = MSimTelephonyManager.getDefault().hasIccCard(0); //判断卡槽2中是不是有卡 b ...
[React] React Router: activeStyle & activeClassName
react-router provides two props for setting a specific style on a Link component whose path matches ...
void*指针
C++提供了一种特殊的指针类型void*,它可以保存任何类型对象的地址: void*表明该指针与一地址值相关,但不清楚存储在此地址上的对象的类型. void*指针只支持几种有限的操作: 1)与另一个指 ...
springmvc的讲解
概述继 Spring 2.0 对 Spring MVC 进行重大升级后,Spring 2.5 又为 Spring MVC 引入了注解驱动功能.现在你无须让 Controller 继承任何接口,无需在 ...
MacOS U盘安装
通过Mac上的App Store下载安装程序插入U盘启动终端输入命令 sudo /Applications/Install\ OS\ X\ El\ Capitan.app/Contents/R ...
for-of循环
/* 1. 遍历数组 2. 遍历Set 3. 遍历Map 4. 遍历字符串 5. 遍历伪数组 6. 可迭代的对象 */var arr = [2,3,4];for(let ele of arr) { c ...
带搜索功能，支持绑定对象到节点的TreeView辅助类
特点: 1.支持数叶子节点与对象绑定 2.支持xml导入,且数据类相关的xml可自定义,只和泛型的实现有关 3.支持节点搜索功能,可在树结构上要求只显示部分节点 4.用C#编写,但与平台关联性低,可移 ...
innodb_flush_method参数解析
innodb_flush_method这个参数控制着innodb数据文件及redo log的打开.刷写模式,对于这个参数,文档上是这样描述的:有三个值:fdatasync(默认),O_DSYNC,O_ ...
解决iOS中tabBarItem图片默认颜色的问题(指定代码渲染模式为以原样模式的方式显示出来)
解决iOS中tabBarItem图片默认颜色的问题(指定代码渲染模式为以原样模式的方式显示出来) 解决办法:指定图片的渲染模式(imageWithRenderingMode为:UIImageRende ...

lucene4.6 索引创建和搜索例子

lucene4.6 索引创建和搜索例子的更多相关文章

随机推荐

热门专题