lucene 5.2.0学习笔记

package com.bc.cas.manager;

import com.bc.cas.dao.BookDao;

import com.bc.cas.model.entity.Book;

import com.google.common.base.Objects;

import com.google.common.collect.Lists;

import org.apache.log4j.helpers.LogLog;

import org.apache.lucene.analysis.Analyzer;

import org.apache.lucene.analysis.cn.smart.SmartChineseAnalyzer;

import org.apache.lucene.analysis.util.CharArraySet;

import org.apache.lucene.document.*;

import org.apache.lucene.index.*;

import org.apache.lucene.queryparser.classic.ParseException;

import org.apache.lucene.queryparser.classic.QueryParser;

import org.apache.lucene.search.*;

import org.apache.lucene.store.FSDirectory;

import org.junit.Test;

import org.springframework.beans.factory.annotation.Autowired;

import org.springframework.stereotype.Repository;

import org.springframework.util.CollectionUtils;

import java.io.IOException;

import java.nio.file.Paths;

import java.util.Arrays;

import java.util.Iterator;

import java.util.List;

/**

* @Author Created by Administrator on 2016/11/29.

* @Version V 1.0.0

* @Desc 索引管理器

@Repository

public class IndexManager {

@Autowired

private BookDao bookDao;

static FSDirectory dir;

static {

try {

dir = FSDirectory.open(Paths.get("d:/lucene/lucene052_index05"));

} catch (IOException e) {

e.printStackTrace();

}

/**

* 创建索引 -common

@Test

public void createIndex(List<Document> docs) throws IOException {

if (docs == null) {

return;

}

// 自定义停用词

List<String> strings = Arrays.asList("的", "在", "了", "呢", "，", "0", "：", ",", "是", "这", "那", "么");

CharArraySet unUsefulWorlds = new CharArraySet(strings, true);

// 加入系统默认停用词

Iterator<Object> itor = SmartChineseAnalyzer.getDefaultStopSet().iterator();

while (itor.hasNext()) unUsefulWorlds.add(itor.next());

//指定了停用词的分词器

Analyzer analyzer = new SmartChineseAnalyzer(unUsefulWorlds);

IndexWriterConfig config = new IndexWriterConfig(analyzer);

IndexWriter writer = new IndexWriter(dir, config);

writer.addDocuments(docs);

writer.commit();

writer.close();

}

/**

* 执行查询 -common

* @param query

* @throws IOException

* @throws ParseException

private static void doQuery(Query query) throws IOException, ParseException {

IndexReader reader = DirectoryReader.open(dir);

IndexSearcher searcher = new IndexSearcher(reader);

//执行query,获取指定条数的顶行记录

TopDocs topDocs = searcher.search(query, 10);

System.out.println("搜索出的总记录数为: " + topDocs.totalHits);

//评分文档集合

ScoreDoc[] docs = topDocs.scoreDocs;

for (ScoreDoc doc : docs) {

//获取文档id

int id = doc.doc;

//根据文档id查询文档对象

Document document = searcher.doc(id);

//打印信息

System.out.println(

Objects.toStringHelper("docuemnt")

.add("文档id", document.get("id"))

.add("文档名称", document.get("name"))

.add("文档图片", document.get("pic"))

.add("文档描述", document.get("description"))

.toString());

}

reader.close();

}

/**

* 测试新建索引

public void testCreateIndex() {

List<Book> bookList = bookDao.findAll();

if (CollectionUtils.isEmpty(bookList)) return;

List<Document> docList = Lists.newArrayList();

Document doc;

for (Book book : bookList) {

doc = new Document();

doc.add(new StoredField("id", book.getId()));

doc.add(new StringField("name", book.getName(), Field.Store.YES));

doc.add(new TextField("pic", book.getPic(), Field.Store.YES));

doc.add(new TextField("description", book.getDescription(), Field.Store.YES));

docList.add(doc);

}

try {

createIndex(docList);

} catch (IOException e) {

LogLog.error(e.getMessage(), e);

}

/**

* 查询

* @throws IOException

@Test

public static void testQuery() throws IOException, ParseException {

QueryParser parser = new QueryParser("description", new SmartChineseAnalyzer());

Query query = parser.parse("description:java AND lucene");

doQuery(query);

}

Field类的子类和说明, 以及用法:

StoredField(FieldName, FieldValue)	重载,支持多种类型	不分词	不索引	示例:
StringField(FieldName, String FieldValue, Store.YES)	字符串类型数据	不分词	索引	示例: 订单号, id, 手机号等
LongField(FieldName, Long FieldValue, Store.YES)	Long型数据	分词	索引	示例: 价格
TextField(FieldName, FieldValue, Store.YES) 或 TextField(FieldName, Reader)	字符串或者流	分词	索引

来自为知笔记(Wiz)

lucene 5.2.0学习笔记的更多相关文章

DirectX 总结和DirectX 9.0 学习笔记
转自:http://www.cnblogs.com/graphics/archive/2009/11/25/1583682.html DirectX 总结 DDS DirectXDraw Surfac ...
一起学ASP.NET Core 2.0学习笔记(二): ef core2.0 及mysql provider 、Fluent API相关配置及迁移
不得不说微软的技术迭代还是很快的,上了微软的船就得跟着她走下去,前文一起学ASP.NET Core 2.0学习笔记(一): CentOS下 .net core2 sdk nginx.superviso ...
vue2.0学习笔记之路由（二）路由嵌套+动画
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
vue2.0学习笔记之路由（二）路由嵌套
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
hdcms v5.7.0学习笔记
hdcms v5.7.0学习笔记 https://note.youdao.com/ynoteshare1/index.html?id=c404d63ac910eb15a440452f73d6a6db& ...
dhtmlxgrid v3.0学习笔记
dhtmlxgrid v3.0学习笔记分类: dhtmlx JavaScript2012-01-31 15:41 1744人阅读评论(0) 收藏举报 stylesheetdatecalendar ...
OAuth 2.0学习笔记
文章目录 OAuth的作用就是让"客户端"安全可控地获取"用户"的授权,与"服务商提供商"进行互动. OAuth在"客户端&quo ...
一起学ASP.NET Core 2.0学习笔记(一): CentOS下 .net core2 sdk nginx、supervisor、mysql环境搭建
作为.neter,看到.net core 2.0的正式发布,心里是有点小激动的,迫不及待的体验了一把,发现速度确实是快了很多,其中也遇到一些小问题,所以整理了一些学习笔记: 阅读目录环境说明安装C ...
RxJava2.0学习笔记2 2018年7月3日周二
摘记: 1.map -- 转换有些服务端的接口设计,会在返回的数据外层包裹一些额外信息,这些信息对于调试很有用,但本地显示是用不到的.使用 map() 可以把外层的格式剥掉,只留下本地会用到的核心 ...

随机推荐

OpenStack企业私有云新需求（1）：Nova 虚机支持 GPU
作者:Sammy Liu 刘世民本系列会介绍OpenStack 企业私有云的几个需求: GPU 支持自动扩展(Auto-scaling)支持混合云(Hybrid cloud)支持物理机(Bar ...
使用java代码打开特定网页
第一种方法的代码如下所示: import java.io.File; public class Test04 { public static void main(String[] args) { // ...
demo(幸福大转盘)总结
百度推广首页demo 在<head>与</head>之间加入代码 <link rel="shortcut icon" href="favic ...
新东方雅思词汇---7.1、probation
新东方雅思词汇---7.1.probation 一.总结一句话总结:prob(检查,试验)+ation 英 [prə'beɪʃ(ə)n] 美 [pro'beʃən] n. 试用:缓刑:查验短语 ...
mysql数据库优化课程---3、数据库设计是什么
mysql数据库优化课程---3.数据库设计是什么一.总结一句话总结: 就是设计各个字段及各个字段类型 1.char,varchar,text同存'ABC'的存储空间为多少? char(255): ...
请求被中止: 未能创建 SSL/TLS 安全通道，以及解决方法,即：Could not create SSL/TLS secure channel
C# 访问https请求被中止: 未能创建 SSL/TLS 安全通道(Could not create SSL/TLS secure channel) 以及 X509Certificate2 temp ...
poj2778 ac自动机+矩阵快速幂
给m个子串,求长度为n的不包含子串的母串数,最直接的应该是暴搜,肯定tle,考虑用ac自动机将子串建成字典树,通过next表来构造矩阵,然后用矩阵快速幂求长度为n的数量邻接矩阵https://we ...
为mac终端添加tree命令
原文:http://superuser.com/questions/359723/mac-os-x-equivalent-of-the-ubuntu-tree-command/ 整理步骤如下: $ t ...
51nod 1117 贪心
http://www.51nod.com/onlineJudge/questionCode.html#!problemId=1117 1117 聪明的木匠题目来源: 河北大学算法艺术协会基准时间限 ...
JS循环遍历JSON数据的方法
JSON数据如:{"options":"[{/"text/":/"王家湾/",/"value/":/" ...

lucene 5.2.0学习笔记

lucene 5.2.0学习笔记的更多相关文章

随机推荐

热门专题