Lucene.Net 学习（搜索部分）（低要求，写给自己看）

1. 搜索

　　　排序：lucene 提供了Sort类对结果进行排序

　　　提供了Filter类对查询条件进行限制

　　　你或许会不自觉地拿它跟SQL语句进行比较：“lucene能执行and、or、order by、where、like ‘%xx%’操作吗？”回答是：“当然没问题！”

　　7.1 各种各样的Query

　　　　下面我们看看lucene到底允许我们进行哪些查询操作：

　　　　7.1.1 TermQuery

　　　　　　　首先介绍最基本的查询，如果你想执行一个这样的查询： “在content域中包含‘lucene’的document．rdquo;，那么你可以用TermQuery：
　　　　　　　　　　Term t = new Term("content", " lucene");
　　　　　　　　　　Query query = new TermQuery(t);

　　　　7.1.2 BooleanQuery

　　　　　　　如果你想这么查询：“在content域中 包含java或perl的document．rdquo;，那么你可以建立两个TermQuery并把它们用BooleanQuery连接起来：
　　　　　　　　　　TermQuery termQuery1 = new TermQuery(new Term("content", "java");
　　　　　　　　　　TermQuery termQuery2 = new TermQuery(new Term("content", "perl");
　　　　　　　　　　BooleanQuery booleanQuery = new BooleanQuery();
　　　　　　　　　　booleanQuery.add(termQuery1, BooleanClause.Occur.SHOULD);
　　　　　　　　　　booleanQuery.add(termQuery2, BooleanClause.Occur.SHOULD);

　　　　7.1.3 WildcardQuery

　　　　　　　如果你想对某单词进行通配符查询，你可以用WildcardQuery，通配符包括’?’匹配一个任意字符和’*’匹配零个或多个任意字符，例如你搜索’use*’，你可能找到’useful’或者’useless’：
　　　　　　　　　　Query query = new WildcardQuery(new Term("content", "use*"));

　　　　7.1.4 PhraseQuery（这个或许可以不考虑）

　　　　　　　你可能对中日关系比较感兴趣，想查找‘中’和‘日’挨得比较近（5个字的距离内）的文章，超过这个距离的不予考虑，你可以：

　　　　　　　　　　PhraseQuery query = new PhraseQuery();
　　　　　　　　　　query.setSlop(5);
　　　　　　　　　　query.add(new Term("content ", “中”));
　　　　　　　　　　query.add(new Term(“content”, “日”));

　　　　　　　那么它可能搜到“中日合作……”、“中方和日方……”，但是搜不到“中国某高层领导说日本欠扁”。

　　　　7.1.5 PrefixQuery

　　　　　　　如果你想搜以‘中’开头的词语，你可以用PrefixQuery：

　　　　　　　　　　PrefixQuery query = new PrefixQuery(new Term("content ", "中");

　　　　7.1.6 FuzzyQuery（或许可以不考虑使用）

　　　　　　　FuzzyQuery用来搜索相似的term，使用Levenshtein算法。假设你想搜索跟‘wuzza’相似的词语，你可以：

　　　　　　　　　　Query query = new FuzzyQuery(new Term("content", "wuzza"));

　　　　　　　你可能得到‘fuzzy’和‘wuzzy’。

　　　　7.1.7 RangeQuery

　　　　　　　另一个常用的Query是RangeQuery，你也许想搜索时间域从20060101到20060130之间的document．你可以用RangeQuery：

　　　　　　　　　　RangeQuery query = new RangeQuery(new Term(“time”, “20060101”), new Term(“time”, “20060130”), true);

　　　　　　　改了：

            //TermRangeQuery rq = new TermRangeQuery("SalaryMin", salaryMin.ToString(), salaryMax.ToString(), true, true);

            bq.Add(NumericRangeQuery.NewIntRange("SalaryMin", salaryMin, salaryMax, true, false),Occur.MUST);

            bq.Add(NumericRangeQuery.NewIntRange("SalaryMax", salaryMin, salaryMax, true, true), Occur.MUST);

　　　　　　　最后的true表示用闭合区间。

　　7.2 QueryParser

　　　　　　看了这么多Query，你可能会问：“不会让我自己组合各种Query吧，太麻烦了！”

　　　　　　当然不会，lucene提供了一种类似于SQL语句的查询语句，我们姑且叫它lucene语句，通过它，你可以把各种查询一句话搞定，lucene会自动把它们查分成小块交给相应Query执行。

　　　　下面我们对应每种 Query演示一下：

　　　　　　　　TermQuery可以用“field:key”方式，例如“content:lucene”。

　　　　　　　　BooleanQuery中‘与’用‘+’，‘或’用‘ ’，例如“content:java contenterl”。

　　　　　　　　WildcardQuery仍然用‘?’和‘*’，例如“content:use*”。

　　　　　　　　PhraseQuery用‘~’，例如“content:"中日"~5”。

　　　　　　　　（以。。。开头）PrefixQuery用‘*’，例如“中*”。

　　　　　　　　（相似的词）FuzzyQuery用‘~’，例如“content: wuzza ~”。

　　　　　　　　RangeQuery用‘[]’或‘{}’，前者表示闭区间，后者表示开区间，例如“time:[20060101 TO 20060130]”，注意TO区分大小写。

　　　　　　你可以任意组合query string，完成复杂操作，例如“标题或正文包括lucene，并且时间在20060101到20060130之间的文章” 可以表示为：“+ (title:lucene content:lucene) +time:[20060101 TO 20060130]”

　　　　代码如下：

　　　　　　　　Directory dir = FSDirectory.getDirectory(PATH, false);

　　　　　　　　IndexSearcher ins = new IndexSearcher(dir);

　　　　　　　　QueryParser parser = new QueryParser("content", new StandardAnalyzer());                 

　　　　　　　　Query query = parser.Parse("+(title:lucene content:lucene) +time:[20060101 TO 20060130]");

　　　　　　　　Hits hits = ins.search(query);                                                           

　　　　　　　　for (int i = ; i < hits.length(); i++)

　　　　　　　　{

　　　　　　　　　　document．doc = hits.doc(i);

　　　　　　　　　　System.out.println(doc.get("title");

　　　　　　　　}

　　　　　　　　ins.close();

　　　　　　首先我们创建一个在指定文件目录上的IndexSearcher。
　　　　　　然后创建一个使用StandardAnalyzer作为分析器的QueryParser，它默认搜索的域是content。
　　　　　　接着我们用QueryParser来parse查询字串，生成一个Query。
　　　　　　然后利用这个Query去查找结果，结果以Hits的形式返回。
　　　　　　这个Hits对象包含一个列表，我们挨个把它的内容显示出来。

　　　　7.3 Filter　　　　　　　

　　　　　　　filter的作用就是限制只查询索引的某个子集，它的作用有点像SQL语句里的 where，但又有区别，它不是正规查询的一部分，只是对数据源进行预处理，然后交给查询语句。

　　　　　　　注意它执行的是预处理，而不是对查询结果进行过滤，所以使用filter的代价是很大的，它可能会使一次查询耗时提高一百倍。

　　　　　　　最常用的filter是RangeFilter和QueryFilter。RangeFilter是设定只搜索指定范围内的索引；QueryFilter是在上次查询的结果中搜索。Filter的使用非常简单，你只需创建一个filter实例，然后把它传给searcher。

　　其他形式的搜索：

            //----------------这里配置搜索条件----------------

            PhraseQuery query = new PhraseQuery();

            foreach (string word in Common.SplitContent.SplitWords(searchKey))        //将用户输入的关键字进行分词

            {

                query.Add(new Term("content", word));

                //query.Add(new Term("content", "C#"));     //多个查询条件时 为且的关系

            }

            //关键词Or关系设置

            BooleanQuery queryOr = new BooleanQuery();

            TermQuery query = null;

            foreach (string word in Common.SplitContent.SplitWords(searchKey))

            {

                query = new TermQuery(new Term("content", word));

                queryOr.Add(query, Occur.SHOULD);               //这里设置条件为Or关系

            }

            query.Boost = ;      //query.SetSlop(100); //指定关键词相隔最大距离

            //盛放查询结果的容器

            TopScoreDocCollector collector = TopScoreDocCollector.Create(, true);

            //searcher.Search(query, null, collector);          //根据query查询条件进行查询，查询结果放入collector容器

            searcher.Search(queryOr, null, collector);          //根据queryOr查询条件进行查询，查询结果放入collector容器

Lucene.Net 学习（搜索部分）（低要求，写给自己看）的更多相关文章

TCP/IP详解学习笔记这位仁兄写得太好了.（转载）
TCP/IP详解学习笔记这位仁兄写得太好了 TCP/IP详解学习笔记这位仁兄写得太好了. http://blog.csdn.net/goodboy1881/category/20444 ...
Apache Lucene(全文检索引擎)—搜索
目录返回目录:http://www.cnblogs.com/hanyinglong/p/5464604.html 本项目Demo已上传GitHub,欢迎大家fork下载学习:https://gith ...
【Todo】Lucene系统学习
之前已经写过一篇关于Lucene安装学习的文章:http://www.cnblogs.com/charlesblc/p/5980525.html 还有一篇关于Solr安装使用的文章:http://ww ...
如何使用 Lucene 做网站高亮搜索功能？
现在基本上所有网站都支持搜索功能,现在搜索的工具有很多,比如Solr.Elasticsearch,它们都是基于 Lucene 实现的,各有各的使用场景.Lucene 比较灵活,中小型项目中使用的比较多 ...
基于 Lucene 的桌面文件搜索
开源2010年,自己在学习 Lucene 时开发的一款桌面文件搜索工具,这么多年过去了,代码一直静静存放在自己的硬盘上,与其让其沉睡,不如分享出来. 这款工具带有明显的模仿 Everything 的痕 ...
推荐一篇关于java 学习的文章，感觉写的很不错
---恢复内容开始--- 很多网友问我学习Java有没有什么捷径,我说"无他,唯手熟尔".但是我却很愿意将自己学习的一些经验写出来,以便后来者少走弯路,帮助别人是最大的快乐嘛 ...
Apache Solr采用Java开发、基于Lucene的全文搜索服务器
http://docs.spring.io/spring-data/solr/ 首先介绍一下solr: Apache Solr (读音: SOLer) 是一个开源.高性能.采用Java开发.基于Luc ...
Lucene的其他搜索(三)
生成索引: package com.wp.search; import java.nio.file.Paths; import org.apache.lucene.analysis.Analyzer; ...
深度学习-tensorflow学习笔记(1)-MNIST手写字体识别预备知识
深度学习-tensorflow学习笔记(1)-MNIST手写字体识别预备知识在tf第一个例子的时候需要很多预备知识. tf基本知识香农熵交叉熵代价函数cross-entropy 卷积神经网络 s ...
深度学习-tensorflow学习笔记(2)-MNIST手写字体识别
深度学习-tensorflow学习笔记(2)-MNIST手写字体识别超级详细版这是tf入门的第一个例子.minst应该是内置的数据集. 前置知识在学习笔记(1)里面讲过了这里直接上代码 # -*- ...

随机推荐

安装 Linux 内核 4.0
大家好,今天我们学习一下如何从Elrepo或者源代码来安装最新的Linux内核4.0.代号为‘Hurr durr I'm a sheep’的Linux内核4.0是目前为止最新的主干内核.它是稳定版3. ...
springboot搭建环境整合jsp页面整合mybatis
1.pom文件依赖 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www ...
-第1章 HTMLCSS方法实现下拉菜单
中英文的自动换行问题把下面代码中的 javascript 改成子菜单1 试试, 如果英文的话宽度会自动撑开, 用中文不会, 而直接转行下来. <ul> <li><a ...
Shell 脚本批量创建数据库表
使用 Shell 脚本批量创建数据表系统:Centos6.5 64位 MySQL版本:5.1.73 比如下面这个脚本: #!/bin/bash #批量新建数据表 for y in {0..199}; ...
template-web.js 引用变量、函数
1.关键字 $imports.+变量/函数 {{if $imports.myParseInt(b.health_money)}} <span class="num"> ...
Oracle Single-Row Functions(单行函数)——NULL-Related Functions
参考资料:http://docs.oracle.com/database/122/SQLRF/Functions.htm#SQLRF006 Single-row functions return a ...
【UOJ#196】【BZOJ4574】[Zjoi2016]线段树
题目链接: http://www.lydsy.com/JudgeOnline/problem.php?id=4574 http://uoj.ac/problem/196 考虑数字随机并且值域够大,我们 ...
【测试工程师面试】面试官热衷询问的N个问题
1. 数据库中左连接右连接的区别 2.JAVA中continue和break的区别 3.Linux中查看某一个进程并且杀死 1.数据库中多表连接,根据不同的表的某一个字段进行关联, 左连接是将左边表全 ...
java扫描文件夹下面的所有文件（递归与非递归实现）
java中扫描指定文件夹下面的所有文件扫描一个文件夹下面的所有文件,因为文件夹的层数没有限制可能多达几十层几百层,通常会采用两种方式来遍历指定文件夹下面的所有文件.递归方式非递归方式(采用队列或者栈实 ...
SpringMVC 处理Date类型数据@InitBinder @DateTimeFormat 注解的使用
使用SpringMVC的时候,需要将表单中的日期字符串转换成对应JavaBean的Date类型,而SpringMVC默认不支持这个格式的转换,解决方法有两种,如下: 方法一 . 在需要日期转换的Con ...

Lucene.Net 学习（搜索部分）（低要求，写给自己看）

Lucene.Net 学习（搜索部分）（低要求，写给自己看）的更多相关文章

随机推荐

热门专题