lucene4.10.2实例（增删改查）

最新jar和src免费下载：http://download.csdn.net/detail/u011518709/8248403

lucene 包的组成结构：对于外部应用来说索引模块(index)和检索模块(search)是主要的外部应用入口

org.apache.Lucene.search/ 搜索入口

org.apache.Lucene.index/ 索引入口
org.apache.Lucene.analysis/ 语言分析器
org.apache.Lucene.queryParser/ 查询分析器
org.apache.Lucene.document/ 存储结构
org.apache.Lucene.store/ 底层IO/存储结构
org.apache.Lucene.util/ 一些公用的数据结构

代码中引用的jar ,在上述相对于的文件下copy相关的jar文件

package com.util;

import java.io.File;

import java.io.IOException;

import java.io.StringReader;

import java.util.List;

import org.apache.log4j.Logger;

import org.apache.lucene.analysis.Analyzer;

import org.apache.lucene.analysis.TokenStream;

import org.apache.lucene.document.Document;

import org.apache.lucene.document.Field;

import org.apache.lucene.document.StringField;

import org.apache.lucene.document.TextField;

import org.apache.lucene.document.Field.Store;

import org.apache.lucene.index.IndexReader;

import org.apache.lucene.index.IndexWriter;

import org.apache.lucene.index.IndexWriterConfig;

import org.apache.lucene.index.LogDocMergePolicy;

import org.apache.lucene.index.LogMergePolicy;

import org.apache.lucene.index.Term;

import org.apache.lucene.index.IndexWriterConfig.OpenMode;

import org.apache.lucene.queryparser.classic.MultiFieldQueryParser;

import org.apache.lucene.queryparser.classic.ParseException;

import org.apache.lucene.queryparser.classic.QueryParser;

import org.apache.lucene.search.IndexSearcher;

import org.apache.lucene.search.MatchAllDocsQuery;

import org.apache.lucene.search.Query;

import org.apache.lucene.search.ScoreDoc;

import org.apache.lucene.search.TermQuery;

import org.apache.lucene.search.TopDocs;

import org.apache.lucene.search.highlight.Highlighter;

import org.apache.lucene.search.highlight.InvalidTokenOffsetsException;

import org.apache.lucene.search.highlight.QueryScorer;

import org.apache.lucene.search.highlight.SimpleFragmenter;

import org.apache.lucene.search.highlight.SimpleHTMLFormatter;

import org.apache.lucene.store.Directory;

import org.apache.lucene.store.FSDirectory;

import org.apache.lucene.util.Version;

import org.wltea.analyzer.lucene.IKAnalyzer;

/**

 * version:lucene4.10.2

 * lucene download:

 * @author zp

 * date 2014-12-12

 */

public class Index410 {

    private final static Logger logger = Logger.getLogger(Index410.class);

    private static String indexPath = "G://lucene//index";

    public static void main(String[] args) {

        try {

          createIndex();

//           searchIndex("码农");

//           query();

//           deleteIndex();

//            forceDeleteIndex();

//            query();

//            highlighterSearch();

        } catch (Exception e) {

            // TODO Auto-generated catch block

            e.printStackTrace();

        }

    }

    /**

     * 创建索引

     */

    public static void createIndex() {

        // 最细粒切分算法--true的话是 智能切分

        Analyzer analyzer = new IKAnalyzer(false);

        Document doc = null;

        IndexWriter indexWriter = null;

        try {

            indexWriter = getIndexWriter(analyzer);

            // 添加索引

            doc = new Document();

            doc.add(new StringField("id", "1", Store.YES));

            doc.add(new TextField("title", "标题：开始", Store.YES));

            doc.add(new TextField("content", "内容：我现在是个码农", Store.YES));

            indexWriter.addDocument(doc);

            doc = new Document();

            doc.add(new StringField("id", "2", Store.YES));

            doc.add(new TextField("title", "标题：结束", Store.YES));

            doc.add(new TextField("content", "内容:我现在是个lucene开发工程师的专家",Store.YES));

            indexWriter.addDocument(doc);

            indexWriter.commit();

        } catch (IOException e) {

            // TODO Auto-generated catch block

            e.printStackTrace();

            logger.info("索引器发送异常");

        } finally {

            try {

                destroyWriter(indexWriter);

            } catch (IOException e) {

                // TODO Auto-generated catch block

                e.printStackTrace();

            }

        }

    }

    /**

     * 搜索文档

     *

     * @param keyword

     */

    @SuppressWarnings("deprecation")

    public static void searchIndex(String keyword) {

        IndexReader indexReader = null;

        IndexSearcher indexSearcher = null;

        try {

            // 1.创建Directory 在硬盘上的G:/luence/index下建立索引

            Directory dir = FSDirectory.open(new File(indexPath));

            // 2.创建IndexReader

            indexReader = IndexReader.open(dir);

            // 实例化搜索器

            indexSearcher = new IndexSearcher(indexReader);

            // 使用QueryParser查询分析器构造Query对象

            QueryParser parse = new QueryParser(Version.LUCENE_4_10_1,"content", new IKAnalyzer(false));

            // 搜索包含keyword关键字的文档

            Query query = parse.parse(keyword.trim());

            // 使用lucene构造搜索引擎的时候，如果要针对多个域进行一次性查询

            // 这种方法的好处就是可以加权给字段的控制

            // 在这四个域中检索

            String[] fields = { "phoneType", "name", "category", "price" };

            Query querys = new MultiFieldQueryParser(Version.LATEST, fields,new IKAnalyzer(false)).parse(keyword.trim());

            TopDocs results = indexSearcher.search(query, 1000);

            // 6.根据TopDocs获取ScoreDoc对象

            ScoreDoc[] score = results.scoreDocs;

            if (score.length > 0) {

                logger.info("查询结果数：" + score.length);

                System.out.println("查询结果数：" + score.length);

                for (int i = 0; i < score.length; i++) {

                    // 7.根据Seacher和ScoreDoc对象获取具体的Document对象

                    Document doc = indexSearcher.doc(score[i].doc);

                    // 8.根据Document对象获取需要的值

                    System.out.println(doc.toString());

                    System.out.println(doc.get("title") + "["+ doc.get("content") + "]");

                }

            } else {

            }

        } catch (Exception e) {

            // TODO: handle exception

            logger.info("查询结果为空！");

        } finally {

            if (indexReader != null) {

                try {

                    indexReader.close();

                } catch (IOException e) {

                    // TODO Auto-generated catch block

                    e.printStackTrace();

                }

            }

        }

    }

    /**

     * 对搜索返回的前n条结果进行分页显示

     *

     * @param keyWord

     *            查询关键词

     * @param pageSize

     *            每页显示记录数

     * @param currentPage

     *            当前页

     * @throws ParseException

     */

    @SuppressWarnings("deprecation")

    public void paginationQuery(String keyWord, int pageSize, int currentPage)

            throws IOException, ParseException {

        String[] fields = { "title", "content" };

        QueryParser queryParser = new MultiFieldQueryParser(Version.LATEST,fields, new IKAnalyzer());

        Query query = queryParser.parse(keyWord.trim());

        IndexReader indexReader = IndexReader.open(FSDirectory.open(new File(

                indexPath)));

        IndexSearcher indexSearcher = new IndexSearcher(indexReader);

        // TopDocs 搜索返回的结果

        TopDocs topDocs = indexSearcher.search(query, 100);// 只返回前100条记录

        TopDocs all = indexSearcher.search(new MatchAllDocsQuery(), 100);

        // int totalCount = topDocs.totalHits; // 搜索结果总数量

        ScoreDoc[] scoreDocs = topDocs.scoreDocs; // 搜索返回的结果集合

        // 查询起始记录位置

        int begin = pageSize * (currentPage - 1);

        // 查询终止记录位置

        int end = Math.min(begin + pageSize, scoreDocs.length);

        // 进行分页查询

        for (int i = begin; i < end; i++) {

            int docID = scoreDocs[i].doc;

            System.out.println("docID=" + docID);

            Document doc = indexSearcher.doc(docID);

            String title = doc.get("title");

            System.out.println("title is : " + title);

        }

        indexReader.close();

    }

    @SuppressWarnings("deprecation")

    public static void highlighterSearch() throws IOException, ParseException, InvalidTokenOffsetsException {

        IndexReader reader = IndexReader.open(FSDirectory.open(new File(indexPath)));

        IndexSearcher searcher = new IndexSearcher(reader);

        // String []fields={"title","content"};

        // QueryParser parser=new MultiFieldQueryParser(Version.LATEST, fields,

        // new IKAnalyzer());

        // Query query=parser.parse("");

        Term term = new Term("content", "lucene");

        TermQuery query = new TermQuery(term);

        TopDocs topdocs = searcher.search(query, Integer.MAX_VALUE);

        ScoreDoc[] scoreDoc = topdocs.scoreDocs;

        System.out.println("查询结果总数:" + topdocs.totalHits);

        System.out.println("最大的评分:" + topdocs.getMaxScore());

        for(int i=0;i<scoreDoc.length;i++){

        	int docid=scoreDoc[i].doc;

       	    Document document=searcher.doc(docid);

        	System.out.println("检索关键字："+term.toString());

        	String  content=document.get("content");

        	//高亮展示

        	SimpleHTMLFormatter  formatter=new SimpleHTMLFormatter("<font color='red'>", "");

            Highlighter highlighter=new Highlighter(formatter, new QueryScorer(query));

            highlighter.setTextFragmenter(new SimpleFragmenter(content.length())); 

            if(!"".equals(content)){

                TokenStream tokenstream=new IKAnalyzer().tokenStream(content, new StringReader(content));

                String highLightText = highlighter.getBestFragment(tokenstream,content);

                System.out.println("高亮显示第 " + (i + 1) + " 条检索结果如下所示：");

                System.out.println(highLightText);

                /*End:结束关键字高亮*/

                System.out.println("文件内容:"+content);

                System.out.println("匹配相关度："+scoreDoc[i].score);

            }

        }

    }

    /**

     * 获取indexWriter对象---获取索引器

     *

     * @param dir

     * @param analyer

     * @return

     * @throws IOException

     */

    private static IndexWriter getIndexWriter(Analyzer analyzer)

            throws IOException {

        File indexFile = new File(indexPath);

        if (!indexFile.exists())

            indexFile.mkdir();// 索引库不存在 则新建一个

        Directory directory = FSDirectory.open(indexFile);

        // Directory directory = new RAMDirectory(); //在内存中建立索引

        IndexWriterConfig conf = new IndexWriterConfig(Version.LUCENE_4_10_1,

                analyzer);

        LogMergePolicy mergePolicy = new LogDocMergePolicy();

        // 索引基本配置

        // 设置segment添加文档(Document)时的合并频率

        // 值较小,建立索引的速度就较慢

        // 值较大,建立索引的速度就较快,>10适合批量建立索引

        mergePolicy.setMergeFactor(30);

        // 设置segment最大合并文档(Document)数

        // 值较小有利于追加索引的速度

        // 值较大,适合批量建立索引和更快的搜索

        mergePolicy.setMaxMergeDocs(5000);

        conf.setMaxBufferedDocs(10000);

        conf.setMergePolicy(mergePolicy);

        conf.setRAMBufferSizeMB(64);

        conf.setOpenMode(OpenMode.CREATE_OR_APPEND);

        if (IndexWriter.isLocked(directory)) {// ?

            IndexWriter.unlock(directory);

        }

        IndexWriter indexWriter = new IndexWriter(directory, conf);

        return indexWriter;

    }

    /**

     * 销毁writer

     *

     * @param writer

     * @throws IOException

     */

    private static void destroyWriter(IndexWriter indexWriter)

            throws IOException {

        if (indexWriter != null) {

            indexWriter.close();

        }

    }

    /**

     * 批量删除

     *

     * @param list

     * @throws IOException

     */

    public static void deleteIndexs(List list) throws IOException {

        if (list == null || list.size() > 0) {

            logger.debug("beans is null");

            return;

        }

        for (int i=0 ;i<list.size();i++) {

            deleteIndex();

        }

    }

    /**

     * 删除单个索引 --不会立刻删除，生成.del文件

     *

     * @param bean

     * @throws IOException

     */

    private static void deleteIndex() throws IOException {

        // if(bean==null){

        // logger.debug("Get search bean is empty!");

        // return;

        // }

        IndexWriter indexWriter = getIndexWriter(new IKAnalyzer());

        // 参数是一个选项，可以是一个Query,也可以是一个term,term是一个精确查找的值

        // 这里删除id=1的文档，还会留在”回收站“。xxx.del

        indexWriter.deleteDocuments(new Term("id", "1"));

        destroyWriter(indexWriter);

    }

    /**

     * 查询文档

     */

    @SuppressWarnings("deprecation")

    public static void query() {

        // 1.创建Directory 在硬盘上的F:/luence/index下建立索引

        try {

            IndexReader indexReader = IndexReader.open(FSDirectory

                    .open(new File(indexPath)));

            System.out.println("存储的文档数:" + indexReader.numDocs());

            System.out.println("总存储量:" + indexReader.maxDoc());

            System.out.println("被删除的文档：" + indexReader.numDeletedDocs());

        } catch (IOException e) {

            // TODO Auto-generated catch block

            e.printStackTrace();

        }

    }

    /**

     * 回滚回收站

     *

     * @throws IOException

     */

    public void recoveryIndexByIsDelete() throws IOException {

        IndexWriter indexWriter = getIndexWriter(new IKAnalyzer());

        indexWriter.rollback();

        destroyWriter(indexWriter);

    }

    /**

     * 清空回收站 在版本3.6之后，已经没有了unDeleteAll()方法了

     *

     * @throws IOException

     */

    public static void forceDeleteIndex() throws IOException {

        IndexWriter indexWriter = getIndexWriter(new IKAnalyzer());

        indexWriter.forceMergeDeletes();

        destroyWriter(indexWriter);

    }

    /**

     * 更新索引

     *

     * @throws IOException

     */

    public void update() throws IOException {

        IndexWriter indexWriter = new IndexWriter(FSDirectory.open(new File(

                indexPath)), new IndexWriterConfig(Version.LATEST,

                new IKAnalyzer(true)));

        Document document = new Document();

        document.add(new Field("id", "10", Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS));

        document.add(new Field("email", "9481629991", Field.Store.YES,Field.Index.NOT_ANALYZED));

        document.add(new Field("name", "小米", Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS));

        document.add(new Field("content", "小米好", Field.Store.NO,Field.Index.ANALYZED));

        // 这里的更新，从方法上可以看出，它实际上时将旧的删除，然后添加一个新文档的进去，将匹配到term的文档删除，然后就新的document添加进去

        indexWriter.updateDocument(new Term("id", "1"), document);

        indexWriter.close();

    }

}

lucene4.10.2实例（增删改查）的更多相关文章

spring-data-rest的魔力 10分钟实现增删改查
目录创建项目启动项目添加person 查看person 及 person 列表条件查询分页查询 controller 去哪里了自定义 spring-data-rest 魔力之外的contr ...
egg 完整实例增删改查MongoDB，websocket
项目地址 github.com/richard1015… 技术栈 eggjs.MongoDB.swagger.websocket.Amap 演示地址: 前台 school.zhuzhida.vip A ...
Mybatis实例增删改查（二）
创建实体类: package com.test.mybatis.bean; public class Employee { private Integer id; private String las ...
一个Solr搜索实例,增删改查+高亮+分页
今天个人coding的模块测试,所以闲暇之余继续研究solr,然后顺带写了一个实例,随便搞的,solr真心不熟,期待认识热爱搜索的朋友,共同进步. 1.配置schema.xml文件[solr\coll ...
自己写的一个Solr搜索实例,增删改查+高亮+分页
今天个人coding的模块测试,所以闲暇之余继续研究solr,然后顺带写了一个实例,随便搞的,solr真心不熟,期待认识热爱搜索的朋友,共同进步. 1.配置schema.xml文件[solr\coll ...
lucene4.4 索引的增删改查
package com.lucene.test; import java.io.File; import java.io.FileReader; import java.io.IOException; ...
什么是Pro*C/C++，嵌入式SQL，第一个pro*c程序，pro*c++,Makefile,Proc增删改查
1 什么是Pro*C/C++ 1.通过在过程编程语言C/C++中嵌入SQL语句而开发出的应用程序 2.什么是嵌入式SQL 1.在通用编程语言中使用的SQL称为嵌入式SQL 2.在SQL标准中定义 ...
Day 18 :面向对象[基础，继承，组合]类的增删改查
有的人说,编程有3种范式: 1.面向过程:就是分析出解决问题所需要的步骤,然后用函数把这些步骤一步一步实现,使用的时候一个一个依次调用就可以了. 2.面向函数:面向函数是面向过程的升级版,也就是把每个 ...
python链接oracle数据库以及数据库的增删改查实例
初次使用python链接oracle,所以想记录下我遇到的问题,便于向我这样初次尝试的朋友能够快速的配置好环境进入开发环节. 1.首先,python链接oracle数据库需要配置好环境. 我的相关环境 ...
yii2.0增删改查实例讲解
yii2.0增删改查实例讲解一.创建数据库文件. 创建表 CREATE TABLE `resource` ( `id` int(10) NOT NULL AUTO_INCREMENT, `textur ...

随机推荐

Lightoj1028 【数学-乘法原理】
题意: 给你一个数,问你有多少种进制对n的表示,存在后导零: 比如30:用3进制表示: 1010 思路: 我们发现,就是一个数的约数就能对n表示最后存在后导零: 计算[2 ,n]之间的n的约数个数. ...
各种移动GPU压缩纹理的使用方法
本文系原创整理,欢迎转载,请标明链接 http://www.cnblogs.com/luming1979 有问题欢迎加qq群讨论:366239605 介绍了各种移动设备所使用的GPU,以及各个GPU所 ...
Ogre 整体框架入门
ogre 是面向对象的3d图形引擎. root 是引擎的一个界面类,包含很多快捷的调用其他类的接口. 在ogre中,广泛的使用了单件模式,同时最大的保证了你不需要自己管理资源,除了是你自己new的对象 ...
我被面试官给虐懵了，竟然是因为我不懂Spring中的@Configuration
现在大部分的Spring项目都采用了基于注解的配置,采用了@Configuration 替换标签的做法.一行简单的注解就可以解决很多事情.但是,其实每一个注解背后都有很多值得学习和思考的内容.这些思考 ...
Eclipse - 安装了jd-eclipse插件后依然无法反编译类文件
问题 Eclipse在安装了jd-eclipse插件后依然无法反编译类文件,这个问题是因为没有修改默认的类文件查看器. 解决方法修改默认的类文件查看器为jd-eclipse Window -> ...
centos6.7版本下配置ssh密钥登录
需要提前说明的是我使用的系统是centos6.7的版本. 1.我使用的是Putty登录 #ssh-keygen (生成公钥和私钥的命令) 回车之后会提示密钥要存放的目录,默认的目录是当前目录下的.ss ...
Elasticsearch之探索集群信息
REST API 启动并运行了节点和集群,下一步是了解如何与它进行通信.elasticsearch提供了一个非常全面和强大的REST API,可以使用它与集群进行交付. 使用API完成以下: • 检查 ...
转如何快速清理 chrom 缓存
谷歌浏览器(Chrome)如何手动清除缓存听语音 | 浏览:13267 | 更新:2014-05-15 01:00 | 标签:谷歌 chrome 浏览器的缓存可以帮助我们更好地使用一些程序,但时间长 ...
ZOJ Seven-Segment Display 暴力dfs + 剪枝
http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemCode=3954 0 = on 1 = off A seven segment ...
Spark Mllib里如何将数值特征字段用StandardScaler进行标准化（图文详解）
不多说,直接上干货! 首先,要明白为什么有时候,数值特征字段需要进行标准化? 答:因为,当我们若用回归分析算法时,必须将数值特征字段进行标准化,这是因为数值特征字段单位不同,数字差异很大,所以无法彼此 ...

lucene4.10.2实例（增删改查）

lucene4.10.2实例（增删改查）的更多相关文章

随机推荐

热门专题