Lucene的其他搜索(三)

生成索引：

package com.wp.search;

import java.nio.file.Paths;

import org.apache.lucene.analysis.Analyzer;

import org.apache.lucene.analysis.standard.StandardAnalyzer;

import org.apache.lucene.document.Document;

import org.apache.lucene.document.Field;

import org.apache.lucene.document.IntField;

import org.apache.lucene.document.StringField;

import org.apache.lucene.document.TextField;

import org.apache.lucene.index.IndexWriter;

import org.apache.lucene.index.IndexWriterConfig;

import org.apache.lucene.store.Directory;

import org.apache.lucene.store.FSDirectory;

public class Indexer {

    private Integer ids[] = { 1, 2, 3 };

    private String citys[] = { "aingdao", "banjing", "changhai" };

    private String descs[] = { "Qingdao is b beautiful city.",

            "Nanjing is c city of culture.", "Shanghai is d dustling dity." };

    // 这里的descs中的Shanghai is d dustling dity这句中我让他们不出现b和c，为等下搜索准备

    private Directory dir;

    /**

     * 获取IndexWriter实例

     *

     * @return

     * @throws Exception

     */

    private IndexWriter getWriter() throws Exception {

        Analyzer analyzer = new StandardAnalyzer(); // 标准分词器

        IndexWriterConfig iwc = new IndexWriterConfig(analyzer);// 为索引配置分词器

        IndexWriter writer = new IndexWriter(dir, iwc);

        return writer;

    }

    /**

     * 生成索引

     *

     * @param indexDir

     * @throws Exception

     */

    private void index(String indexDir) throws Exception {

        dir = FSDirectory.open(Paths.get(indexDir));

        IndexWriter writer = getWriter();

        for (int i = 0; i < ids.length; i++) {

            Document doc = new Document();

            doc.add(new IntField("id", ids[i], Field.Store.YES));

            doc.add(new StringField("city", citys[i], Field.Store.YES));

            doc.add(new TextField("desc", descs[i], Field.Store.YES));

            writer.addDocument(doc); // 添加文档

        }

        writer.close();

    }

    public static void main(String[] args) throws Exception {

        new Indexer().index("D:\\lucene\\luceneIndex");

    }

}

其他搜索:

package com.wp.search;

import java.nio.file.Paths;

import org.apache.lucene.document.Document;

import org.apache.lucene.index.DirectoryReader;

import org.apache.lucene.index.IndexReader;

import org.apache.lucene.index.Term;

import org.apache.lucene.search.BooleanClause;

import org.apache.lucene.search.BooleanQuery;

import org.apache.lucene.search.IndexSearcher;

import org.apache.lucene.search.NumericRangeQuery;

import org.apache.lucene.search.PrefixQuery;

import org.apache.lucene.search.ScoreDoc;

import org.apache.lucene.search.TermRangeQuery;

import org.apache.lucene.search.TopDocs;

import org.apache.lucene.store.Directory;

import org.apache.lucene.store.FSDirectory;

import org.apache.lucene.util.BytesRef;

import org.junit.After;

import org.junit.Before;

import org.junit.Test;

public class SearchTest {

    private Directory dir;

    private IndexReader reader;

    private IndexSearcher is;

    @Before

    public void setUp() throws Exception {

        dir = FSDirectory.open(Paths.get("D:\\lucene\\luceneIndex"));// FSDirectory为专门处理目录文件的一个类

        reader = DirectoryReader.open(dir);

        is = new IndexSearcher(reader);

    }

    @After

    public void tearDown() throws Exception {

        reader.close();

    }

    /**

     * 指定项范围搜索 之前我将Shanghai is d dustling dity不出现b和c的原因，更好看结果

     *

     * @throws Exception

     */

    @Test

    public void testTermRangeQuery() throws Exception {

        TermRangeQuery query = new TermRangeQuery("desc", new BytesRef("b"

                .getBytes()), new BytesRef("c".getBytes()), true, true);// 查询满足包含b和c区间的结果

        TopDocs hits = is.search(query, 10);// 显示查询结果的最前10条数据

        for (ScoreDoc scoreDoc : hits.scoreDocs) {

            Document doc = is.doc(scoreDoc.doc);// 将查到的内容放在文档中

            System.out.println(doc.get("id"));

            System.out.println(doc.get("city"));

            System.out.println(doc.get("desc"));

        }

    }

    /**

     * 指定数字范围

     *

     * @throws Exception

     */

    @Test

    public void testNumericRangeQuery() throws Exception {

        NumericRangeQuery<Integer> query = NumericRangeQuery.newIntRange("id",

                1, 3, true, true);// 查询在id包含1到3以内的结果(包括2)

        TopDocs hits = is.search(query, 10);

        for (ScoreDoc scoreDoc : hits.scoreDocs) {

            Document doc = is.doc(scoreDoc.doc);

            System.out.println(doc.get("id"));

            System.out.println(doc.get("city"));

            System.out.println(doc.get("desc"));

        }

    }

    /**

     * 指定字符串开头搜索

     *

     * @throws Exception

     */

    @Test

    public void testPrefixQuery() throws Exception {

        PrefixQuery query = new PrefixQuery(new Term("city", "a"));// 查询城市以a开头的

        TopDocs hits = is.search(query, 10);

        for (ScoreDoc scoreDoc : hits.scoreDocs) {

            Document doc = is.doc(scoreDoc.doc);

            System.out.println(doc.get("id"));

            System.out.println(doc.get("city"));

            System.out.println(doc.get("desc"));

        }

    }

    /**

     * 多条件查询

     *

     * @throws Exception

     */

    @Test

    public void testBooleanQuery() throws Exception {

        NumericRangeQuery<Integer> query1 = NumericRangeQuery.newIntRange("id",

                1, 2, true, true);// 查询id在1和2之间的

        PrefixQuery query2 = new PrefixQuery(new Term("city", "a"));// 城市以a开头的

        BooleanQuery.Builder booleanQuery = new BooleanQuery.Builder();

        // booleanQuery.add(query1, BooleanClause.Occur.MUST_NOT);//

        // MUST_NOT表示除了

        // booleanQuery.add(query1, BooleanClause.Occur.SHOULD);// SHOULD表示或者

        booleanQuery.add(query1, BooleanClause.Occur.MUST);// MUST表示并且

        booleanQuery.add(query2, BooleanClause.Occur.MUST);

        TopDocs hits = is.search(booleanQuery.build(), 10);

        for (ScoreDoc scoreDoc : hits.scoreDocs) {

            Document doc = is.doc(scoreDoc.doc);

            System.out.println(doc.get("id"));

            System.out.println(doc.get("city"));

            System.out.println(doc.get("desc"));

        }

    }

}

Lucene的其他搜索(三)的更多相关文章

Apache Solr采用Java开发、基于Lucene的全文搜索服务器
http://docs.spring.io/spring-data/solr/ 首先介绍一下solr: Apache Solr (读音: SOLer) 是一个开源.高性能.采用Java开发.基于Luc ...
基于 Lucene 的桌面文件搜索
开源2010年,自己在学习 Lucene 时开发的一款桌面文件搜索工具,这么多年过去了,代码一直静静存放在自己的硬盘上,与其让其沉睡,不如分享出来. 这款工具带有明显的模仿 Everything 的痕 ...
Apache Lucene(全文检索引擎)—搜索
目录返回目录:http://www.cnblogs.com/hanyinglong/p/5464604.html 本项目Demo已上传GitHub,欢迎大家fork下载学习:https://gith ...
lucene学习笔记：三，Lucene的索引文件格式
Lucene的索引里面存了些什么,如何存放的,也即Lucene的索引文件格式,是读懂Lucene源代码的一把钥匙. 当我们真正进入到Lucene源代码之中的时候,我们会发现: Lucene的索引过程, ...
lucene的多种搜索2-SpanQuery
SpanQuery按照词在文章中的距离或者查询几个相邻词的查询 SpanQuery包括以下几种: SpanTermQuery:词距查询的基础,结果和TermQuery相似,只不过是增加了查询结果中单词 ...
如何使用 Lucene 做网站高亮搜索功能？
现在基本上所有网站都支持搜索功能,现在搜索的工具有很多,比如Solr.Elasticsearch,它们都是基于 Lucene 实现的,各有各的使用场景.Lucene 比较灵活,中小型项目中使用的比较多 ...
一种安全云存储方案设计（下）——基于Lucene的云端搜索与密文基础上的模糊查询
一种安全的云存储方案设计(未完整理中) 一篇老文了,现在看看错漏颇多,提到的一些技术已经跟不上了.仅对部分内容重新做了一些修正,增加了一些机器学习的内容,然并卵. 这几年来,云产品层出不穷,但其安全性 ...
Lucene建立索引搜索入门实例
第一部分:Lucene建立索引 Lucene建立索引主要有以下两步:第一步:建立索引器第二步:添加索引文件准备在f盘建立lucene文件夹,然后 ...
WebGIS中解决使用Lucene进行兴趣点搜索排序的两种思路
文章版权由作者李晓晖和博客园共有,若转载请于明显处标明出处:http://www.cnblogs.com/naaoveGIS/. 1.背景目前跟信息采集相关的一个项目提出了这样的一个需求:中国银行等 ...

随机推荐

14.statefulset服务
有状态的控制器有以下几个特点稳定,独特的网络标识符. 稳定,持久的存储. 有序,优雅的部署和扩展. 有序的自动滚动更新. 使用限制 StatefulSet是1.9之前的beta资源,在1.5之前的任 ...
VS Code 编辑器
使用VS Code 编辑器有一段时间了,感觉非常好用,已经成为了我的第一选择了.现在需要学习了一下了. 1,更改编辑器的默认设置文件 =>首选项 => 设置或 ctrl + ,(逗号) ...
hdu1839（最小生成树）
题意:字面意思: 思路:就是多了一个前提,有些点之间可能有边,有两个处理方法,一个是有边的,这条边权值归零,另一个是,先一次循环用并查集过一遍: 代码:(用的是第一种方法) #include<i ...
qt 在窗口上画框
在窗口w上面画个黄色的框:在窗口上添加一个label,然后在label上画框 QLabel label(&w); label.setScaledContents(true); QPixmap ...
微信小程序——安装开发工具和环境【二】
准备开发工具下载获取APPID 安装工具安装接受协议选择安装位置等待安装完成安装完成选择项目选择小程序填写信息确定无误后,点击确定进入开发页面建立普通快速启动模板界面
前端 -- BOM和DOM
一,引入到目前为止,已经学过了JavaScript的一些简单的语法.但是这些简单的语法,并没有和浏览器有任何交互. 也就是我们还不能制作一些我们经常看到的网页的一些交互,我们需要继续学习BOM和DO ...
Pearls POJ - 1260 dp
题意:有n种不同的珍珠每种珍珠的价格不同现在给出一个采购单标注了需要不同等级的珍珠和相对于的个数(输入按价格升序排列) 其中价格为 (当前种类价格+10)*购买数量这样就有一种诡异的 ...
MT【304】反射路径长度比
(高考压轴题改编)如图,长方体$ABCD-A_1B_1C_1D_1$中,$AB=11,AD=7,AA_1=12.$一质点从顶点$A$设向$E(4,3,12)$遇到长方体的面反射(服从光的反射原理),将 ...
Fiddler中显示IP方法
如何在fiddler查看到请求的IP地址?就像下面这样打开fiddler, 快捷键Ctrl+R 或者菜单->Rules->Customize Rules…,然后在CustomRul ...
一种使用 emwin 绘制图片的方法
@2018-12-10 [小记] 使用官方 <GUIBuilder.exe> 软件里的 Image 控件,注意格式为 .bmp,这种方式是将图片数据直接转为十六进制数据存储至静态区具体使 ...

Lucene的其他搜索(三)

Lucene的其他搜索(三)的更多相关文章

随机推荐

热门专题