Lucene的基本应用

import java.io.File;

import java.io.IOException;

import java.util.ArrayList;

import java.util.List;

import org.apache.lucene.analysis.Analyzer;

import org.apache.lucene.analysis.standard.StandardAnalyzer;

import org.apache.lucene.document.Document;

import org.apache.lucene.document.Field;

import org.apache.lucene.document.Field.Index;

import org.apache.lucene.document.Field.Store;

import org.apache.lucene.index.IndexWriter;

import org.apache.lucene.index.IndexWriter.MaxFieldLength;

import org.apache.lucene.queryParser.QueryParser;

import org.apache.lucene.search.IndexSearcher;

import org.apache.lucene.search.Query;

import org.apache.lucene.search.ScoreDoc;

import org.apache.lucene.search.TopDocs;

import org.apache.lucene.store.Directory;

import org.apache.lucene.store.FSDirectory;

import org.apache.lucene.util.Version;

import org.junit.Test;

import cn.itcast._domain.Article;

public class HelloWorld {

	private static Directory directory; // 索引库文件夹

	private static Analyzer analyzer; // 分词器

	static {

		try {

			directory = FSDirectory.open(new File("./indexDir"));

			analyzer = new StandardAnalyzer(Version.LUCENE_30);

		} catch (IOException e) {

			throw new RuntimeException(e);

		}

	}

	// 建立索引

	@Test

	public void testCreateIndex() throws Exception {

		// 准备数据

		Article article = new Article();

		article.setId(1);

		article.setTitle("准备Lucene的开发环境");

		article.setContent("假设信息检索系统在用户发出了检索请求后再去互联网上找答案，根本无法在有限的时间内返回结果。");

		// 放到索引库中

		// 1, 把Article转为Document

		Document doc = new Document();

		String idStr = article.getId().toString();

		doc.add(new Field("id", idStr, Store.YES, Index.NOT_ANALYZED));

		doc.add(new Field("title", article.getTitle(), Store.YES, Index.ANALYZED));

		doc.add(new Field("content", article.getContent(), Store.NO, Index.ANALYZED));

		// 2, 把Document放到索引库中

		IndexWriter indexWriter = new IndexWriter(directory, analyzer,  MaxFieldLength.UNLIMITED);

		indexWriter.addDocument(doc);

		indexWriter.close();

	}

	// 搜索

	@Test

	public void testSearch() throws Exception {

		// 准备查询条件

		String queryString = "lucene";

		// String queryString = "hibernate";

		// 运行搜索

		List<Article> list = new ArrayList<Article>();

		// ==========================================================================================

		// 1，把查询字符串转为Query对象（默认仅仅从title中查询）

		QueryParser queryParser = new QueryParser(Version.LUCENE_30, "title", analyzer);

		Query query = queryParser.parse(queryString);

		// 2，运行查询，得到中间结果

		IndexSearcher indexSearcher = new IndexSearcher(directory); // 指定所用的索引库

		TopDocs topDocs = indexSearcher.search(query, 100); // 最多返回前n条结果

		int count = topDocs.totalHits;

		ScoreDoc[] scoreDocs = topDocs.scoreDocs;

		// 3，处理结果

		for (int i = 0; i < scoreDocs.length; i++) {

			ScoreDoc scoreDoc = scoreDocs[i];

			float score = scoreDoc.score; // 相关度得分

			int docId = scoreDoc.doc; // Document的内部编号

			// 依据编号拿到Document数据

			Document doc = indexSearcher.doc(docId);

			// 把Document转为Article

			String idStr = doc.getField("id").toString(); //doc.get("id");

			String title = doc.get("title");

			String content = doc.get("content"); // 等价于 doc.getField("content").stringValue();

			Article article = new Article();

			article.setId(Integer.parseInt(idStr));

			article.setTitle(title);

			article.setContent(content);

			list.add(article);

		}

		indexSearcher.close();

		// ==========================================================================================

		// 显示结果

		System.out.println("总结果数：" + list.size());

		for (Article a : list) {

			System.out.println("------------------------------");

			System.out.println("id = " + a.getId());

			System.out.println("title = " + a.getTitle());

			System.out.println("content = " + a.getContent());

		}

	}

}

public class Article {

	private Integer id;

	private String title;

	private String content;

	public Integer getId() {

		return id;

	}

	public void setId(Integer id) {

		this.id = id;

	}

	public String getTitle() {

		return title;

	}

	public void setTitle(String title) {

		this.title = title;

	}

	public String getContent() {

		return content;

	}

	public void setContent(String content) {

		this.content = content;

	}

}

Lucene的基本应用的更多相关文章

lucene 基础知识点
部分知识点的梳理,参考<lucene实战>及网络资料 1.基本概念 lucence 可以认为分为两大组件: 1)索引组件 a.内容获取:即将原始的内容材料,可以是数据库.网站(爬虫).文本 ...
用lucene替代mysql读库的尝试
采用lucene对mysql中的表建索引,并替代全文检索操作. 备注:代码临时梳理很粗糙,后续修改. import java.io.File; import java.io.IOException; ...
Lucene的评分(score)机制研究
首先,需要学习Lucene的评分计算公式—— 分值计算方式为查询语句q中每个项t与文档d的匹配分值之和,当然还有权重的因素.其中每一项的意思如下表所示: 表3.5 评分公式中的因子评分因子描述 ...
Lucene的分析资料【转】
Lucene 源码剖析 1 目录 2 Lucene是什么 2.1.1 强大特性 2.1.2 API组成- 2.1.3 Hello World! 2.1.4 Lucene roadmap 3 索引文件结 ...
Lucene提供的条件判断查询
第一.按词条搜索 - TermQuery query = new TermQuery(new Term("name","word1"));hits = sear ...
Lucene 单域多条件查询
在Lucene 中 BooleanClause用于表示布尔查询子句关系的类,包括:BooleanClause.Occur.MUST表示and,BooleanClause.Occur.MUST_NOT表 ...
lucene自定义过滤器
先介绍下查询与过滤的区别和联系,其实查询(各种Query)和过滤(各种Filter)之间非常相似,可以这样说只要用Query能完成的事,用过滤也都可以完成,它们之间可以相互转换,最大的区别就是使用过滤 ...
lucene+IKAnalyzer实现中文纯文本检索系统
首先IntelliJ IDEA中搭建Maven项目(web):spring+SpringMVC+Lucene+IKAnalyzer spring+SpringMVC搭建项目可以参考我的博客整合Luc ...
全文检索解决方案（lucene工具类以及sphinx相关资料）
介绍两种全文检索的技术. 1. lucene+ 中文分词(IK) 关于lucene的原理,在这里可以得到很好的学习. http://www.blogjava.net/zhyiwww/archive/ ...
MySQL和Lucene索引对比分析
MySQL和Lucene都可以对数据构建索引并通过索引查询数据,一个是关系型数据库,一个是构建搜索引擎(Solr.ElasticSearch)的核心类库.两者的索引(index)有什么区别呢?以前写过 ...

随机推荐

【Netty】NIO框架Netty入门
Netty介绍 Netty是由JBOSS提供的一个java开源框架.Netty提供异步的.事件驱动的网络应用程序框架和工具,用以快速开发高性能.高可靠性的网络服务器和客户端程序. 也就是说,Netty ...
ASP.Net教程系列：多线程编程实战（一）
Web开发中使用多线程可以增强用户体验,尤其是多用户.多任务.海量数据和资源紧张的情况下.所以我们的ASP.Net教程设立多线程编程实战专题.下面这些代码范例都是入门级的,希望对对大家学习ASP.Ne ...
小白用shiro（1）
本文来自网易云社区作者:王飞首先引入一段关于shiro的介绍: 开发系统中,少不了权限,目前java里的权限框架有SpringSecurity和Shiro(以前叫做jsecurity),对于Spr ...
从Windows想Linux上传文件 Linux（CentOS）上安装vsftpd
今天想在Linux上搭建个LAMP环境,以前用的Linux都安装了图形界面,但是这次用的阿里云服务器是纯命令模式,用起来有点不大适应. 最大的不适应就是获取apache等软件了,以前直接登录相应网站, ...
Linux系统维护管理命令及vim编辑器
系统维护管理命令date.clear $>>date //显示或修改系统时间与日期. //%H:小时 %M:分钟 %S:秒 %Y完整年份 %d:日 %m:月份 eg: date " ...
BZOJ2324 [ZJOI2011]营救皮卡丘【费用流】
题目皮卡丘被火箭队用邪恶的计谋抢走了!这三个坏家伙还给小智留下了赤果果的挑衅!为了皮卡丘,也为了正义,小智和他的朋友们义不容辞的踏上了营救皮卡丘的道路. 火箭队一共有N个据点,据点之间存在M条双向道 ...
欧拉回路 & 欧拉路径
欧拉路径 & 欧拉回路概念欧拉路径: 如果图 G 种的一条路径包括所有的边,且仅通过一次的路径. 欧拉回路: 能回到起点的欧拉路径. 混合图: 既有无向边又有无向边的图. 判定无向图一 ...
【bzoj1053】[HAOI2007]反素数ant
对于任何正整数x,其约数的个数记作g(x).例如g(1)=1.g(6)=4.如果某个正整数x满足:g(x)>g(i) 0<i<x,则称x为反质数.例如,整数1,2,4,6等都是反质数 ...
python tab 自动补全
学习python,经常要使用python命令行查找一些不熟悉的使用方法等等,但是python命令行下没有自带tab补全的功能,看见别人写了tab,可以解决特此记下,以备后用 1.创建tab.py文件, ...
Python基础教程总结（二）
上周总结了一下Python的一些基本数据类型和用法.这次总结一下4-9章的内容,完后,赶紧学以致用吧. 5. 第四章——字典:当索引不好用时字典是Python中唯一内建的映射类型.字典中的值并没有特 ...

Lucene的基本应用

Lucene的基本应用的更多相关文章

随机推荐

热门专题