1. 搜索

   排序:lucene 提供了Sort类对结果进行排序

   提供了Filter类对查询条件进行限制

   你或许会不自觉地拿它跟SQL语句进行比较:“lucene能执行and、or、order by、where、like ‘%xx%’操作吗?”回答是:“当然没问题!”

  7.1 各种各样的Query

    下面我们看看lucene到底允许我们进行哪些查询操作:

    7.1.1 TermQuery

       首先介绍最基本的查询,如果你想执行一个这样的查询: “在content域中包含‘lucene’的document.rdquo;,那么你可以用TermQuery:
          Term t = new Term("content", " lucene");
          Query query = new TermQuery(t);

    7.1.2 BooleanQuery

       如果你想这么查询:“在content域中 包含java或perl的document.rdquo;,那么你可以建立两个TermQuery并把它们用BooleanQuery连接起来:
          TermQuery termQuery1 = new TermQuery(new Term("content", "java");
          TermQuery termQuery2 = new TermQuery(new Term("content", "perl");
          BooleanQuery booleanQuery = new BooleanQuery();
          booleanQuery.add(termQuery1, BooleanClause.Occur.SHOULD);
          booleanQuery.add(termQuery2, BooleanClause.Occur.SHOULD);

    7.1.3 WildcardQuery

       如果你想对某单词进行通配符查询,你可以用WildcardQuery,通配符包括’?’匹配一个任意字符和’*’匹配零个或多个任意字符,例如你搜索’use*’,你可能找到’useful’或者’useless’:
          Query query = new WildcardQuery(new Term("content", "use*"));

    7.1.4 PhraseQuery(这个或许可以不考虑)

       你可能对中日关系比较感兴趣,想查找‘中’和‘日’挨得比较近(5个字的距离内)的文章,超过这个距离的不予考虑,你可以:

          PhraseQuery query = new PhraseQuery();
          query.setSlop(5);
          query.add(new Term("content ", “中”));
          query.add(new Term(“content”, “日”));

       那么它可能搜到“中日合作……”、“中方和日方……”,但是搜不到“中国某高层领导说日本欠扁”。

    7.1.5 PrefixQuery

       如果你想搜以‘中’开头的词语,你可以用PrefixQuery:

          PrefixQuery query = new PrefixQuery(new Term("content ", "中");

    7.1.6 FuzzyQuery(或许可以不考虑使用)

       FuzzyQuery用来搜索相似的term,使用Levenshtein算法。假设你想搜索跟‘wuzza’相似的词语,你可以:

          Query query = new FuzzyQuery(new Term("content", "wuzza"));

       你可能得到‘fuzzy’和‘wuzzy’。

    7.1.7 RangeQuery

       另一个常用的Query是RangeQuery,你也许想搜索时间域从20060101到20060130之间的document.你可以用RangeQuery:

          RangeQuery query = new RangeQuery(new Term(“time”, “20060101”), new Term(“time”, “20060130”), true);

       改了:

            //TermRangeQuery rq = new TermRangeQuery("SalaryMin", salaryMin.ToString(), salaryMax.ToString(), true, true);
bq.Add(NumericRangeQuery.NewIntRange("SalaryMin", salaryMin, salaryMax, true, false),Occur.MUST);
bq.Add(NumericRangeQuery.NewIntRange("SalaryMax", salaryMin, salaryMax, true, true), Occur.MUST);

       最后的true表示用闭合区间。

  7.2 QueryParser

      看了这么多Query,你可能会问:“不会让我自己组合各种Query吧,太麻烦了!”

      当然不会,lucene提供了一种类似于SQL语句的查询语句,我们姑且叫它lucene语句,通过它,你可以把各种查询一句话搞定,lucene会自动把它们查分成小块交给相应Query执行。

    下面我们对应每种 Query演示一下:

        TermQuery可以用“field:key”方式,例如“content:lucene”

        BooleanQuery中‘与’用‘+’,‘或’用‘ ’,例如“content:java contenterl”

        WildcardQuery仍然用‘?’和‘*’,例如“content:use*”

        PhraseQuery用‘~’,例如“content:"中日"~5”

        (以。。。开头)PrefixQuery用‘*’,例如“中*”

        (相似的词)FuzzyQuery用‘~’,例如“content: wuzza ~”

        RangeQuery用‘[]’或‘{}’,前者表示闭区间,后者表示开区间,例如“time:[20060101 TO 20060130]”注意TO区分大小写

      你可以任意组合query string,完成复杂操作,例如“标题或正文包括lucene,并且时间在20060101到20060130之间的文章” 可以表示为:“+ (title:lucene content:lucene) +time:[20060101 TO 20060130]”

    代码如下:

        Directory dir = FSDirectory.getDirectory(PATH, false);
        IndexSearcher ins = new IndexSearcher(dir);
        QueryParser parser = new QueryParser("content", new StandardAnalyzer());
        Query query = parser.Parse("+(title:lucene content:lucene) +time:[20060101 TO 20060130]");
        Hits hits = ins.search(query);
        for (int i = ; i < hits.length(); i++)
        {
          document.doc = hits.doc(i);
          System.out.println(doc.get("title");
        }
        ins.close();

      首先我们创建一个在指定文件目录上的IndexSearcher。
      然后创建一个使用StandardAnalyzer作为分析器的QueryParser,它默认搜索的域是content。
      接着我们用QueryParser来parse查询字串,生成一个Query。
      然后利用这个Query去查找结果,结果以Hits的形式返回。
      这个Hits对象包含一个列表,我们挨个把它的内容显示出来。

    7.3 Filter       

       filter的作用就是限制只查询索引的某个子集,它的作用有点像SQL语句里的 where,但又有区别,它不是正规查询的一部分,只是对数据源进行预处理,然后交给查询语句。

       注意它执行的是预处理,而不是对查询结果进行过滤,所以使用filter的代价是很大的,它可能会使一次查询耗时提高一百倍。

       最常用的filter是RangeFilter和QueryFilter。RangeFilter是设定只搜索指定范围内的索引;QueryFilter是在上次查询的结果中搜索。Filter的使用非常简单,你只需创建一个filter实例,然后把它传给searcher。

  其他形式的搜索:

            //----------------这里配置搜索条件----------------
PhraseQuery query = new PhraseQuery();
foreach (string word in Common.SplitContent.SplitWords(searchKey)) //将用户输入的关键字进行分词
{
query.Add(new Term("content", word));
//query.Add(new Term("content", "C#")); //多个查询条件时 为且的关系
} //关键词Or关系设置
BooleanQuery queryOr = new BooleanQuery();
TermQuery query = null;
foreach (string word in Common.SplitContent.SplitWords(searchKey))
{
query = new TermQuery(new Term("content", word));
queryOr.Add(query, Occur.SHOULD); //这里设置条件为Or关系
} query.Boost = ; //query.SetSlop(100); //指定关键词相隔最大距离 //盛放查询结果的容器
TopScoreDocCollector collector = TopScoreDocCollector.Create(, true);
//searcher.Search(query, null, collector); //根据query查询条件进行查询,查询结果放入collector容器
searcher.Search(queryOr, null, collector); //根据queryOr查询条件进行查询,查询结果放入collector容器

Lucene.Net 学习(搜索部分)(低要求,写给自己看)的更多相关文章

  1. TCP/IP详解学习笔记 这位仁兄写得太好了.(转载)

    TCP/IP详解学习笔记   这位仁兄写得太好了   TCP/IP详解学习笔记   这位仁兄写得太好了. http://blog.csdn.net/goodboy1881/category/20444 ...

  2. Apache Lucene(全文检索引擎)—搜索

    目录 返回目录:http://www.cnblogs.com/hanyinglong/p/5464604.html 本项目Demo已上传GitHub,欢迎大家fork下载学习:https://gith ...

  3. 【Todo】Lucene系统学习

    之前已经写过一篇关于Lucene安装学习的文章:http://www.cnblogs.com/charlesblc/p/5980525.html 还有一篇关于Solr安装使用的文章:http://ww ...

  4. 如何使用 Lucene 做网站高亮搜索功能?

    现在基本上所有网站都支持搜索功能,现在搜索的工具有很多,比如Solr.Elasticsearch,它们都是基于 Lucene 实现的,各有各的使用场景.Lucene 比较灵活,中小型项目中使用的比较多 ...

  5. 基于 Lucene 的桌面文件搜索

    开源2010年,自己在学习 Lucene 时开发的一款桌面文件搜索工具,这么多年过去了,代码一直静静存放在自己的硬盘上,与其让其沉睡,不如分享出来. 这款工具带有明显的模仿 Everything 的痕 ...

  6. 推荐一篇关于java 学习的文章,感觉写的很不错

    ---恢复内容开始---    很多网友问我学习Java有没有什么捷径,我说"无他,唯手熟尔".但是我却很愿意将自己学习的一些经验写出来,以便后来者少走弯路,帮助别人是最大的快乐嘛 ...

  7. Apache Solr采用Java开发、基于Lucene的全文搜索服务器

    http://docs.spring.io/spring-data/solr/ 首先介绍一下solr: Apache Solr (读音: SOLer) 是一个开源.高性能.采用Java开发.基于Luc ...

  8. Lucene的其他搜索(三)

    生成索引: package com.wp.search; import java.nio.file.Paths; import org.apache.lucene.analysis.Analyzer; ...

  9. 深度学习-tensorflow学习笔记(1)-MNIST手写字体识别预备知识

    深度学习-tensorflow学习笔记(1)-MNIST手写字体识别预备知识 在tf第一个例子的时候需要很多预备知识. tf基本知识 香农熵 交叉熵代价函数cross-entropy 卷积神经网络 s ...

  10. 深度学习-tensorflow学习笔记(2)-MNIST手写字体识别

    深度学习-tensorflow学习笔记(2)-MNIST手写字体识别超级详细版 这是tf入门的第一个例子.minst应该是内置的数据集. 前置知识在学习笔记(1)里面讲过了 这里直接上代码 # -*- ...

随机推荐

  1. PL/SQL Developer登录出现——Using a filter for all users can lead to poor performance!

    用PL/SQL  Developer登录Oracle时提示:Using a filter for all users can lead to poor performance! 分析:与Oracle的 ...

  2. P2016 战略游戏

    传送门 思路: 前置知识——普通树D: ▲普通的树形 DP : 设 f [ i ][ 0 ] 表示这个点不取,则它的所有子节点都要取:f [ i ][ 1 ] 表示这个点取,则它的子节点取与不取对之前 ...

  3. Integer的最大值

    来自:https://blog.csdn.net/qq_33611068/article/details/77369050 有这样一道题: 编程测试,遍历 0 到 int所能表示最大的正数,将消耗的时 ...

  4. ppython的移位操作

    因为要将js的一个签名算法移植到python上,遇到一些麻烦. int无限宽度,不会溢出 算法中需要用到了32位int的溢出来参与运算,但是python的int是不会溢出的,达到界限后会自己转为lon ...

  5. DAY1 计算机组成和操作系统

    一.编程与编程目的 1.编程语言的定义 编程语言是人与计算机之间沟通的介质 2.什么是编程 编程就是程序员通过编程语言让计算机实现所想做的事 3.编程的目的 解放人力,让计算机按照人的逻辑思维进行工作 ...

  6. LRU缓存机制

    运用你所掌握的数据结构,设计和实现一个  LRU (最近最少使用) 缓存机制.它应该支持以下操作: 获取数据 get 和 写入数据 put . 获取数据 get(key) - 如果密钥 (key) 存 ...

  7. Codeforces 937D - Sleepy Game

    937D - Sleepy Game 思路: dfs. vis[u][0]==1表示u这个点能从s点偶数路径到达 vis[u][1]==1表示u这个点能从s点奇数路径到达 这个样就能保证dfs时每个点 ...

  8. Angular 学习笔记 (version 6 小笔记)

    1. lazyload 的 path 变成相对路径了, 不过如果你用 ng update 的话, 依然可以不需要修改, cli config 好像能调支持绝对路径的写法. const routes: ...

  9. Axure 元件焦点的控制

    讲解如何控制光标的位置,主要学习了以下三种场景: 1.点击邮箱或者密码时,光标分别自动定位到email.password的文本框处: 2.还有将密码对应的文本框的内容设置为密码的格式(····) 3. ...

  10. idel 快捷键 记录

    1.找到实现一个类或者接口子类的快捷键 ctrl + B父类或父方法定义 ctrl + alt + B子类或子方法实现 2.跳转上次 下次 操作 ctrl + alt + -->  / < ...