Lucene 的四大索引查询  
清单1:使用布尔操作符

Java代码     
  1. //Test boolean operator
  2. blic void testOperator(String indexDirectory) throws Exception{
  3. Directory dir = FSDirectory.getDirectory(indexDirectory,false);
  4. IndexSearcher indexSearcher = new IndexSearcher(dir);
  5. String[] searchWords = {"Java AND Lucene", "Java NOT Lucene", "Java OR Lucene",
  6. "+Java +Lucene", "+Java -Lucene"};
  7. Analyzer language = new StandardAnalyzer();
  8. Query query;
  9. for(int i = 0; i < searchWords.length; i++){
  10. query = QueryParser.parse(searchWords[i], "title", language);
  11. Hits results = indexSearcher.search(query);
  12. System.out.println(results.length() + "search results for query " + searchWords[i]);
  13. }

域搜索(Field Search)

Lucene 支持域搜索,你可以指定一次查询是在哪些域(Field)上进行。例如,如果索引的文档包含两个域,Title 和 Content,你就可以使用查询 “Title: Lucene AND Content: Java” 来返回所有在 Title 域上包含 Lucene 并且在 Content 域上包含 Java 的文档。清单 2 显示了如何利用 Lucene 的 API 来实现域搜索。

清单2:实现域搜索

Java代码     
  1. //Test field search
  2. public void testFieldSearch(String indexDirectory) throws Exception{
  3. Directory dir = FSDirectory.getDirectory(indexDirectory,false);
  4. IndexSearcher indexSearcher = new IndexSearcher(dir);
  5. String searchWords = "title:Lucene AND content:Java";
  6. Analyzer language = new StandardAnalyzer();
  7. Query query = QueryParser.parse(searchWords, "title", language);
  8. Hits results = indexSearcher.search(query);
  9. System.out.println(results.length() + "search results for query " + searchWords);
  10. }

通配符搜索(Wildcard Search)

Lucene 支持两种通配符:问号(?)和星号(*)。你可以使用问号(?)来进行单字符的通配符查询,或者利用星号(*)进行多字符的通配符查询。例如,如果你想搜索 tiny 或者 tony,你就可以使用查询语句 “t?ny”;如果你想查询 Teach, Teacher 和 Teaching,你就可以使用查询语句 “Teach*”。清单3 显示了通配符查询的过程。

清单3:进行通配符查询

Java代码     
  1. //Test wildcard search
  2. public void testWildcardSearch(String indexDirectory)throws Exception{
  3. Directory dir = FSDirectory.getDirectory(indexDirectory,false);
  4. IndexSearcher indexSearcher = new IndexSearcher(dir);
  5. String[] searchWords = {"tex*", "tex?", "?ex*"};
  6. Query query;
  7. for(int i = 0; i < searchWords.length; i++){
  8. query = new WildcardQuery(new Term("title",searchWords[i]));
  9. Hits results = indexSearcher.search(query);
  10. System.out.println(results.length() + "search results for query " + searchWords[i]);
  11. }
  12. }

模糊查询

Lucene 提供的模糊查询基于编辑距离算法(Edit distance algorithm)。你可以在搜索词的尾部加上字符 ~ 来进行模糊查询。例如,查询语句 “think~” 返回所有包含和 think 类似的关键词的文档。清单 4 显示了如果利用 Lucene 的 API 进行模糊查询的代码。

清单4:实现模糊查询

Java代码     
  1. //Test fuzzy search
  2. public void testFuzzySearch(String indexDirectory)throws Exception{
  3. Directory dir = FSDirectory.getDirectory(indexDirectory,false);
  4. IndexSearcher indexSearcher = new IndexSearcher(dir);
  5. String[] searchWords = {"text", "funny"};
  6. Query query;
  7. for(int i = 0; i < searchWords.length; i++){
  8. query = new FuzzyQuery(new Term("title",searchWords[i]));
  9. Hits results = indexSearcher.search(query);
  10. System.out.println(results.length() + "search results for query " + searchWords[i]);
  11. }
  12. }

范围搜索(Range Search)

范围搜索匹配某个域上的值在一定范围的文档。例如,查询 “age:[18 TO 35]” 返回所有 age 域上的值在 18 到 35 之间的文档。清单5显示了利用 Lucene 的 API 进行返回搜索的过程。

清单5:测试范围搜索

Java代码     
    1. //Test range search
    2. public void testRangeSearch(String indexDirectory)throws Exception{
    3. Directory dir = FSDirectory.getDirectory(indexDirectory,false);
    4. IndexSearcher indexSearcher = new IndexSearcher(dir);
    5. Term begin = new Term("birthDay","20000101");
    6. Term end   = new Term("birthDay","20060606");
    7. Query query = new RangeQuery(begin,end,true);
    8. Hits results = indexSearcher.search(query);
    9. System.out.println(results.length() + "search results is returned");
    10. }

Lucene 的四大索引查询 ——bool 域搜索 通配符 范围搜索的更多相关文章

  1. 搜索引擎系列 ---lucene简介 创建索引和搜索初步

    一.什么是Lucene? Lucene最初是由Doug Cutting开发的,2000年3月,发布第一个版本,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎 :Lucene得名于Doug妻子 ...

  2. lucene简介 创建索引和搜索初步

    lucene简介 创建索引和搜索初步 一.什么是Lucene? Lucene最初是由Doug Cutting开发的,2000年3月,发布第一个版本,是一个全文检索引擎的架构,提供了完整的查询引擎和索引 ...

  3. Lucene第二讲——索引与搜索

    一.Feild域 1.Field域的属性 是否分词:Tokenized 是:对该field存储的内容进行分词,分词的目的,就是为了索引. 否:不需要对field存储的内容进行分词,不分词,不代表不索引 ...

  4. Lucene的数值索引以及范围查询

    对文本搜索引擎的倒排索引(数据结构和算法).评分系统.分词系统都清楚掌握之后,本人对数值索引和搜索一直有很大的兴趣,最近对Lucene对数值索引和范围搜索做了些学习,并将主要内容整理如下: 1. Lu ...

  5. lucene复合条件查询案例——查询name域 或 description域 包含lucene关键字的两种方式

    方式一:使用语法表达式查询 //查询name域 或 description域包含lucene关键字 QueryParser queryParser = new QueryParser("na ...

  6. Lucene.Net 优化索引生成,即搜索显示优化

    最近发现站内搜索引擎响应速度很慢,因为刚来公司之前技术员跑了源码什么的都没留下.只好自己手动破解源代码dll查找问题所在! 这个问题代码就暂时不贴了这里只写思路 原逻辑:经过整体分析后发现之前是使用 ...

  7. lucene.net 3.0.3、结合盘古分词进行搜索的小例子(转)

    lucene.net 3.0.3.结合盘古分词进行搜索的小例子(分页功能)   添加:2013-12-25 更新:2013-12-26 新增分页功能. 更新:2013-12-27 新增按分类查询功能, ...

  8. Lucene 06 - 使用Lucene的Query API查询数据

    目录 1 Query对象的创建(方式一): 使用子类对象 1.1 常用的Query子类对象 1.2 常用的Query子类对象使用 1.2.1 使用TermQuery 1.2.2 使用NumericRa ...

  9. lucene&solr学习——索引维护

    1.索引库的维护 索引库删除 (1) 全删除 第一步:先对文档进行分析 public IndexWriter getIndexWriter() throws Exception { // 第一步:创建 ...

随机推荐

  1. DOM对象之查找标签&属性操作

    HTML DOM (文档对象模型) DOM(Document Object Model)是一套对文档的内容进行抽象和概念化的方法. JavaScript对DOM进行了实现,对应于JavaScript中 ...

  2. hdu3987,最小割时求最少割边数

    题意:求最小割时候割边最少的数量.算法:先求dinic一遍,跑出残网络,再把该网络中满流量(残量为0)的边 残量改为1,其他边残量改为无穷,则再跑一次最大流,所得即为答案.(思,最小割有喝多组,但是要 ...

  3. Java使用IText(VM模版)导出PDF,IText导出word(二)

    ===============action=========================== //退款导出word    public void exportWordTk() throws IOE ...

  4. es6 递归 tree

    function loop(data) { let office = data.map(item => { if(item.type == '1' ||item.type == '2') { i ...

  5. collection包1.1.0都升级了什么功能

    collection包1.1.0都升级了什么功能 jianfengye/collection(https://github.com/jianfengye/collection) 这个包喜迎第一个子版本 ...

  6. org.dom4j.IllegalAddException: No such namespace prefix: *** is in scope on: org.dom4j.tree.DefaultElement (dom4j写入XML文件,标签中带【:】(冒号)解决办法)

    用dom4j操作写XML文件,标签中含有冒号,会报 org.dom4j.IllegalAddException: No such namespace prefix: *** is in scope o ...

  7. Dfs学习经验(纸上运行理解DFS)【两道题】

    首先我想吐槽的是,在CSDN上搞了好久还是不能发博客,就是点下发表丝毫反应都没有的,我稍微百度了几次还是没有找到解决方法,在CSDN的BBS上也求助过管理员但是没有收到答复真是烦躁,导致我新生入学以来 ...

  8. foobar2000设置关闭按钮最小化到系统托盘

    1.设置托盘选项: 2.[File]->[Preferences]->[Advanced]->[Display]->[Default User Interface]->[ ...

  9. MMT事务处理来源类型-INV_OBJECT_GENEALOGY.GETSOURCE

    INV_OBJECT_GENEALOGY.GETSOURCE (MTL_MATERIAL_TRANSACTIONS.ORGANIZATION_ID,                           ...

  10. 完整的MVC框架(前端、后台和数据库)

    终于学完了数据库的连接,可以做一个完整的项目了,以前做的练习都没有关联到数据库,没法进行事务. MVC框架 先上图: 老师画的图,有点乱,但是大概意思还是可以理解. 这个练习是简单的存储一个学生读了哪 ...