lucene4入门（2）搜索

欢迎转载http://www.cnblogs.com/shizhongtao/p/3440479.html

接着上一篇，这里继续搜索，对于搜索和创建一样，首先你要确定搜索位置，然后用规定的类来读取。还要注意一点，确定分词器，因为不同的分词器所创建的分词规则不同。上篇我使用的是默认的分词器，这里我也先不管分词器。为了方便阅读，代码就全部粘上。

 package com.bing.test;

 import java.io.File;

 import java.io.FileNotFoundException;

 import java.io.FileReader;

 import java.io.IOException;

 import org.apache.lucene.analysis.Analyzer;

 import org.apache.lucene.analysis.standard.StandardAnalyzer;

 import org.apache.lucene.document.Document;

 import org.apache.lucene.document.Field.Store;

 import org.apache.lucene.document.FieldType;

 import org.apache.lucene.document.StringField;

 import org.apache.lucene.document.TextField;

 import org.apache.lucene.index.DirectoryReader;

 import org.apache.lucene.index.IndexReader;

 import org.apache.lucene.index.IndexWriter;

 import org.apache.lucene.index.IndexWriterConfig;

 import org.apache.lucene.queryparser.classic.ParseException;

 import org.apache.lucene.queryparser.classic.QueryParser;

 import org.apache.lucene.search.IndexSearcher;

 import org.apache.lucene.search.Query;

 import org.apache.lucene.search.ScoreDoc;

 import org.apache.lucene.search.TopDocs;

 import org.apache.lucene.store.Directory;

 import org.apache.lucene.store.FSDirectory;

 import org.apache.lucene.util.Version;

 /**

  * @author bingyulei

  *

  */

 public class HelloLucene

 {

     Directory directory = null;

     Document doc;

     IndexWriter writer = null;

     /**

      *

      * @param indexWriterPath

      *            索引创建路径

      * @param filePath

      *            读取文件路径

      */

     public void createIndex(String indexWriterPath, String filePath)

     {

         // 创建indexwriter

         Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_45);// 设置标准分词器

                                                                     // ,默认是一元分词

         IndexWriterConfig iwc = new IndexWriterConfig(Version.LUCENE_45,

                 analyzer);// 设置IndexWriterConfig

         try

         {

             // 创建directory

             // directory=RAMDirectory();//创建在内存中

             // 创建在硬盘上

             directory = FSDirectory.open(new File(indexWriterPath));// 打开存放索引的路径

             writer = new IndexWriter(directory, iwc);

             // 为document添加field

             addFile(writer, filePath);

             System.out.println("添加成功");

         } catch (IOException e)

         {

             // TODO Auto-generated catch block

             e.printStackTrace();

         }

     }

     private void addFile(IndexWriter writer, String filePath)

     {

         File f = new File(filePath);

         FieldType ft = new FieldType();

         ft.setIndexed(true);// 索引

         ft.setStored(true);// 存储，数据量比较大，一般都是不鼓励存储，放在索引文件中会把索引文件撑大

         ft.setTokenized(true);

         for (File file : f.listFiles())

         {

             try

             {

                 // 创建Document对象

                 doc = new Document();

                 // doc.add(new Field("content", new FileReader(file), ft));

                 doc.add(new TextField("content", new FileReader(file)));

                 doc.add(new TextField("filename", file.getName(), Store.YES));

                 doc.add(new StringField("path", file.getPath(), Store.YES));

                 // 添加文档

                 writer.addDocument(doc);

                 writer.commit();// 提交数据

             } catch (FileNotFoundException e)

             {

                 // TODO Auto-generated catch block

                 e.printStackTrace();

             } catch (IOException e)

             {

                 // TODO Auto-generated catch block

                 e.printStackTrace();

             }

         }

     }

     /**

      * 搜索

      *

      * @param path

      *            搜索路径

      * @param indexReaderPath

      *            索引存放路径

      */

     public void seacher(String indexReaderPath, String searthText)

     {

         IndexReader reader=null;

         try

         {

             directory = FSDirectory.open(new File(indexReaderPath));

             // 创建读取索引的reader

              reader = DirectoryReader.open(directory);

             // 根据reader创建search

             IndexSearcher searcher = new IndexSearcher(reader);

             // 创建查询,第二个参数表示查询的字段名，第三个是分词器

             QueryParser parser = new QueryParser(Version.LUCENE_45, "content",

                     new StandardAnalyzer(Version.LUCENE_45));

             // 搜索包含searthText的内容

             Query query = parser.parse(searthText);

             // 搜索返回10条记录

             TopDocs tds = searcher.search(query, 10);

              //获取scoredoc对象组，

              ScoreDoc[] sds=tds.scoreDocs;

              for(ScoreDoc sd:sds){

                  //获取具体的doc

                  Document doc=searcher.doc(sd.doc);

                  System.out.println(doc.get("filename")+":"+doc.get("path"));

              }

         } catch (IOException e)

         {

             // TODO Auto-generated catch block

             e.printStackTrace();

         }// 打开存放索引的路径

         catch (ParseException e)

         {

             // TODO Auto-generated catch block

             e.printStackTrace();

         }finally{

             if (reader!=null)

             {

                 try

                 {

                     reader.close();

                 } catch (IOException e)

                 {

                     // TODO Auto-generated catch block

                     e.printStackTrace();

                 }

             }

         }

     }

 }

说明，"D:\\lucene\\file"是我复制lucene官方文档上的两段话，不过当你创建完索引之后，然后再修改文件内容，新加的内容并不能搜索出来。这个应该很好理解。

然后进行测试：searchTest,就可以得到那个文本文件中有"Changing Similarity"这段字符

package com.bing.test;

import org.junit.Test;

public class HelloLuceneTest

{

    @Test

    public void writertest(){

        HelloLucene test=new HelloLucene();

        test.createIndex("D:\\lucene\\index","D:\\lucene\\file");

    }

    @Test

    public void searchTest(){

        HelloLucene test=new HelloLucene();

        test.seacher("D:\\lucene\\index", "Changing Similarity");

    }

}

lucene4入门（2）搜索的更多相关文章

lucene4入门（1）
欢迎转载http://www.cnblogs.com/shizhongtao/p/3440325.html lucene你可以理解为一种数据库,他是全文搜索的一种引擎. 1.首先去官网download ...
lucene4入门（3）琐记
欢迎转载http://www.cnblogs.com/shizhongtao/p/3440486.html <--这个是lucene4.6的api下载地址,格式是chm的.需要的人可以下载htt ...
solr入门之搜索建议的几种实现方式和最终选取实现思路
上篇博客中我简单的讲了下solr自身的suggest模块来实现搜索建议.但是今天研究了下在solr自身的suggest中添加进去拼音来智能推荐时不时很方便.在次从网上搜集和整理思考了下该问题的解决. ...
angular入门--filter搜索
首先,列表绑定忽略先上代码 <html ng-app="app1"> <head> <meta charset='utf-8' /> < ...
[算法入门]——深度优先搜索（DFS）
深度优先搜索(DFS) 深度优先搜索叫DFS(Depth First Search).OK,那么什么是深度优先搜索呢?_? 样例: 举个例子,你在一个方格网络中,可以简单理解为我们的地图,要从A点到B ...
linux 入门教程
linux入门教程搜索 Linux入门教程前言第一章关于Linux的历史第二章图形界面还是命令窗口第三章 Linux操作系统的安装第四章初步进入linux世界第五章 Linux系统 ...
Linux入门基础篇
Linux入门基础篇 Linux诞生 Linux发行版本说明 Linux官方网站 Linux内核官方网站比较有名的Linux发行版虚拟机(Virtual Machine),一个虚拟的系统,安装在系 ...
Egret入门学习日记 --- 第二篇（书籍的选择 && 书籍目录 && 书中 3.3 节内容）
第二篇 (书籍的选择 && 书籍目录 && 书中 3.3 节内容) 既然选好了Egret,那我就要想想怎么学了. 开始第一步,先加个Q群先,这不,拿到了一本<E ...
java课程设计团队博客《基于学院的搜索引擎》
JAVA课程设计基于学院网站的搜索引擎对学院网站用爬虫进行抓取.建索(需要中文分词).排序(可选).搜索.数据摘要高亮.分页显示.Web界面. 一.团队介绍学号班级姓名简介 2016211 ...

随机推荐

string <-> wstring
// std::string -> std::wstringstd::string s("string");std::wstring ws;ws.assign(s.begin ...
java_接口和抽象类的区别
1. 接口只能定义抽象方法,不包含已经提供实现的方法. 抽象类可以包含普通方法 2. 接口不能定义静态方法.抽象类可以定义静态方法 3. 接口里只能定义静态常量filed,不能定义普通filed. 抽 ...
ie F12开发工具出不来
IE的F12开发人员工具不显示问题: 按下F12之后,开发人员工具在桌面上看不到,但是任务栏里有显示.将鼠标放在任务栏的开发人员工具上,出现一片透明的区域,选中之后却出不来.将鼠标移动到开发人员工具的 ...
如何在linux下解压缩rar和zip格式的文件压缩包
转载:http://oldboy.blog.51cto.com/2561410/597515 使用apt-get安装: sudo apt-get install rar zip rar使用: 将 ...
下了个C-Free，结果点新建，出来的就是.cpp 怎么变成.c呢。。。他默认新建文件是c++的啊，
C-Free主界面--->工具--->环境选择--->一般--->“新建文件类型”将cpp改成c即可
DOM+Javascript一些实例
1.内容+遮罩层+悬浮对话框 <!DOCTYPE html> <html lang="en"> <head> <meta charset= ...
MYSQL基础笔记(一)
关系型数据库概念: 1.什么是关系型数据库? 关系型数据库:是一种建立在关系模型(数学模型)上的数据库关系模型:一种所谓建立在关系上的模型. 关系模型包含三个方面: 1.数据结构:数据存储的问题,二 ...
jQuery插件面向对象开发
为什么要有面向对象的思维,因为如果不这样,你可能需要一个方法的时候就去定义一个function,当需要另外一个方法的时候,再去随便定义一个function,同样,需要一个变量的时候,毫无规则地定义一些 ...
Visual studio 2013 添加 GitHub
IJKMediaFramework第三方库的使用
大多数做直播的时候使用 FFMpeg. IJKMediaFramework也是基于FFMpeg封装使用起来比较简单,个人觉得如果有能力可以使用 FFMpeg , 使用 FFMpeg对内存的占用比 ...

lucene4入门（2）搜索

lucene4入门（2）搜索的更多相关文章

随机推荐

热门专题