lucene 查询的使用

各种查询
方式一：使用QueryParser与查询语法。（会使用分词器）

MultiFieldQueryParser
查询字符串 ------------------------> Query对象

例如：
上海 AND 天气
上海 OR 天气
上海新闻 AND site:news.163.com
...

方式二：
直接创建Query的实例（子类的），不会使用分词器
new TermQuery(..);
new BooleanQuery(..);

package cn.itcast.i_query;

import java.util.ArrayList;

import java.util.List;

import org.apache.lucene.document.Document;

import org.apache.lucene.index.Term;

import org.apache.lucene.search.BooleanQuery;

import org.apache.lucene.search.FuzzyQuery;

import org.apache.lucene.search.IndexSearcher;

import org.apache.lucene.search.MatchAllDocsQuery;

import org.apache.lucene.search.NumericRangeQuery;

import org.apache.lucene.search.Query;

import org.apache.lucene.search.TermQuery;

import org.apache.lucene.search.TopDocs;

import org.apache.lucene.search.WildcardQuery;

import org.apache.lucene.search.BooleanClause.Occur;

import org.junit.Test;

import cn.itcast._domain.Article;

import cn.itcast._util.ArticleDocumentUtils;

import cn.itcast._util.LuceneUtils;

public class TestApp {

    // 关键词查询

    @Test

    public void testTermQuery() {

        // 对应的查询字符串为：title:lucene

        TermQuery query = new TermQuery(new Term("title", "lucene"));

        searchAndShowResult(query);

    }

    // 通配符查询

    // ? 表示一个任意字符

    // * 表示0或多个任意字符

    @Test

    public void testWildcardQuery() {

        // 对应的查询字符串为：title:lu*n?

        // WildcardQuery query = new WildcardQuery(new Term("title", "lu*n?"));

        // 对应的查询字符串为：content:互?网

        WildcardQuery query = new WildcardQuery(new Term("content", "互?网"));

        searchAndShowResult(query);

    }

    // 查询所有

    @Test

    public void testMatchAllDocsQuery() {

        // 对应的查询字符串为：*:*

        MatchAllDocsQuery query = new MatchAllDocsQuery();

        searchAndShowResult(query);

    }

    // 模糊查询

    @Test

    public void testFuzzyQuery() {

        // 对应的查询字符串为：title:lucenX~0.9

        // 第二个参数是最小相似度，表示有多少正确的就显示出来，比如0.9表示有90%正确的字符就会显示出来。

        FuzzyQuery query = new FuzzyQuery(new Term("title", "lucenX"), 0.8F);

        searchAndShowResult(query);

    }

    // 范围查询

    @Test

    public void testNumericRangeQuery() {

        // 对应的查询字符串为：id:[5 TO 15]

        // NumericRangeQuery query = NumericRangeQuery.newIntRange("id", 5, 15, true, true);

        // 对应的查询字符串为：id:{5 TO 15}

        // NumericRangeQuery query = NumericRangeQuery.newIntRange("id", 5, 15, false, false);

        // 对应的查询字符串为：id:[5 TO 15}

        NumericRangeQuery query = NumericRangeQuery.newIntRange("id", 5, 15, true, false);

        searchAndShowResult(query);

    }

    // 布尔查询

    @Test

    public void testBooleanQuery() {

        BooleanQuery booleanQuery = new BooleanQuery();

        // booleanQuery.add(query, Occur.MUST); // 必须满足

        // booleanQuery.add(query, Occur.SHOULD); // 多个SHOULD一起用表示OR的关系

        // booleanQuery.add(query, Occur.MUST_NOT); // 非

        Query query1 = new TermQuery(new Term("title", "lucene"));

        Query query2 = NumericRangeQuery.newIntRange("id", 5, 15, false, true);

        // // 对应的查询字符串为：+title:lucene +id:{5 TO 15]

        // // 对应的查询字符串为（大写的AND）：title:lucene AND id:{5 TO 15]

        // booleanQuery.add(query1, Occur.MUST);

        // booleanQuery.add(query2, Occur.MUST);

        // 对应的查询字符串为：title:lucene id:{5 TO 15]

        // 对应的查询字符串为：title:lucene OR id:{5 TO 15]

        // booleanQuery.add(query1, Occur.SHOULD);

        // booleanQuery.add(query2, Occur.SHOULD);

        // 对应的查询字符串为：+title:lucene -id:{5 TO 15]

        // 对应的查询字符串为：title:lucene (NOT id:{5 TO 15] )

        booleanQuery.add(query1, Occur.MUST);

        booleanQuery.add(query2, Occur.MUST_NOT);

        searchAndShowResult(booleanQuery);

    }

    /**

     * 测试搜索的工具方法

     *

     * @param query

     */

    private void searchAndShowResult(Query query) {

        try {

            // // 准备查询条件

            // String queryString = "content:lucene";

            // // 1，把查询字符串转为Query对象（从title和content中查询）

            // QueryParser queryParser = new MultiFieldQueryParser(Version.LUCENE_30, new String[] { "title", "content" }, LuceneUtils.getAnalyzer());

            // Query query = queryParser.parse(queryString);

            System.out.println("--->  // 对应的查询字符串为：" + query + "\n");

            // 2，执行查询，得到中间结果

            IndexSearcher indexSearcher = new IndexSearcher(LuceneUtils.getDirectory()); // 指定所用的索引库

            TopDocs topDocs = indexSearcher.search(query, 100); // 最多返回前n条结果

            // 3，处理结果

            List<Article> list = new ArrayList<Article>();

            for (int i = 0; i < topDocs.scoreDocs.length; i++) {

                // 根据编号拿到Document数据

                int docId = topDocs.scoreDocs[i].doc; // Document的内部编号

                Document doc = indexSearcher.doc(docId);

                // 把Document转为Article

                Article article = ArticleDocumentUtils.documentToArticle(doc);

                list.add(article);

            }

            indexSearcher.close();

            // 显示结果

            System.out.println("总结果数：" + list.size());

            for (Article a : list) {

                System.out.println("------------------------------");

                System.out.println("id = " + a.getId());

                System.out.println("title = " + a.getTitle());

                System.out.println("content = " + a.getContent());

            }

        } catch (Exception e) {

            throw new RuntimeException(e);

        }

    }

}

更多查询说明：

1、Lucene实例（各种Query使用的例子）

2、lucene多种查询方式

3、Lucene开发实例（一般企业搜索平台完全够用全程）

lucene 查询的使用的更多相关文章

Lucene 查询工具 LQT
Lucene Query Tool (lqt) 是一个命令行工具用来执行 Lucene 查询并对结果进行格式化输出. 使用方法: 01 $ ./lqt 02 usage: LuceneQueryToo ...
Lucene查询语法详解
Lucene查询 Lucene查询语法以可读的方式书写,然后使用JavaCC进行词法转换,转换成机器可识别的查询. 下面着重介绍下Lucene支持的查询: Terms词语查询词语搜索,支持单词和 ...
Lucene查询条数限制
运用Lucene进行索引,在查询的时候是有条数限制的 public virtual TopFieldDocs Search(Query query, Filter filter, int n, Sor ...
lucene 查询+分页+排序
lucene 查询+分页+排序 1.定义一个工厂类 LuceneFactory 1 import java.io.IOException; 2 3 import org.apache.lucene.a ...
kibana使用（ELK）、Lucene 查询语法
Lucene查询 Lucene查询语法以可读的方式书写,然后使用JavaCC进行词法转换,转换成机器可识别的查询. 下面着重介绍下Lucene支持的查询: Terms词语查询词语搜索,支持单词和 ...
Lucene 查询分页技术
常用的Lucene查询代码如下所示,该代码的作用是将path路径下的所有索引信息返回 public String matchAll(String path) { try { Directory dir ...
query_string查询支持全部的Apache Lucene查询语法低频词划分依据模糊查询 Disjunction Max
3.3 基本查询3.3.1词条查询词条查询是未经分析的,要跟索引文档中的词条完全匹配注意:在输入数据中,title字段含有Crime and Punishment,但我们使用小写开头的crime来搜 ...
基于Lucene查询原理分析Elasticsearch的性能
前言 Elasticsearch是一个很火的分布式搜索系统,提供了非常强大而且易用的查询和分析能力,包括全文索引.模糊查询.多条件组合查询.地理位置查询等等,而且具有一定的分析聚合能力.因为其查询场景 ...
Lucene 查询原理传统二级索引方案倒排链合并倒排索引跳表位图
提问: 1.倒排索引与传统数据库的索引相比优势? 2.在lucene中如果想做范围查找,根据上面的FST模型可以看出来,需要遍历FST找到包含这个range的一个点然后进入对应的倒排链,然后进行求并集 ...
ELK：kibana使用的lucene查询语法【转载】
kibana在ELK阵营中用来查询展示数据 elasticsearch构建在Lucene之上,过滤器语法和Lucene相同全文搜索在搜索栏输入login,会返回所有字段值中包含login的文档使 ...

随机推荐

FLAG_ACTIVITY_CLEAR_TOP和FLAG_ACTIVITY_REORDER_TO_FRONT用法
Activity的两种启动模式: FLAG_ACTIVITY_CLEAR_TOP和FLAG_ACTIVITY_REORDER_TO_FRONT 1. 如果已经启动了四个Activity:A,B,C和D ...
goLang文件遍历
package main import ( "fmt" "io/ioutil" "os" "path/filepath&q ...
hiho1123_好配对
题目给定两个序列a和b,每个序列中可能含有重复的数字. 一个配对(i,j)是一个好配对当从第一个序列中选出一个数ai,再从第二个序列中选出一个数bj且满足ai>bj. 给出两个序列,问存在多少 ...
PHP工程师突破
身边有几个做PHP开发的朋友,因为面试,也接触到不少的PHP工程师,他们常疑虑自己将来在技术上的成长与发展,我常给他们一些建议,希望他们能破突自己,有更好的发展. PHP工程师面临成长瓶颈先明确我所 ...
java的IO流
java的IO流继承四大抽象类分别是字节流 inputStream outputStream与字符流 read write.怎么理解记忆很重要. 直接连接读写对象的是结点流,例如对文件读取字节类的名字 ...
［转］Material Design Library 23.1.0的新变化与代码实战
Design Library出来已经快有一个月了,当时大概看了一下介绍这个新版本变化的译文,内容不多,给我印象最深的就是Percent lib.AppBarLayout 和NavigationView ...
EF Core » 关系
对初学者理解关系很有用,先留下来,有时间边看边翻译. Caution 注意 This documentation is for EF Core. For EF6.x and earlier relea ...
jmeter笔记7
一.脚本录制(Jmeter): Jmeter 脚本(.jmx)为 xml 格式,树形结构,由元件组成,使用“取样器”产生请求. 在“工作台”添加“HTTP 代理服务器” 端口: 代理服务器的端口,默认 ...
(29)odoo的可用小图标
* 系统的小图标都采用了 fontawesome 官网是 http://fontawesome.dashgame.com/ * 运用小图标 # 首先打开官网 http://fonta ...
python中字典dict的操作
字典可存储任意类型的对象,由键和值(key - value)组成.字典也叫关联数组或哈希表. dict = {' , 'C' : [1 , 2 , 3] } dict['A'] = 007 # 修改字 ...

lucene 查询的使用

lucene 查询的使用的更多相关文章

随机推荐

热门专题