Lucene--FuzzyQuery与WildCardQuery（通配符）

FuzzyQuery：

创建索引：

IndexWriter writer = new IndexWriter(path, new StandardAnalyzer(), false); 

writer.setUseCompoundFile(false);

Document doc1 = new Document(); 

Document doc2 = new Document(); 

Document doc3 = new Document(); 

Document doc4 = new Document(); 

Document doc5 = new Document(); 

Document doc6 = new Document();

Field f1 = new Field("content", "word", Field.Store.YES,

Field.Index.TOKENIZED); 

Field f2 = new Field("content", "work", Field.Store.YES,

Field.Index.TOKENIZED); 

Field f3 = new Field("content", "seed", Field.Store.YES,

Field.Index.TOKENIZED); 

Field f4 = new Field("content", "sword", Field.Store.YES,

Field.Index.TOKENIZED); 

Field f5 = new Field("content", "world", Field.Store.YES,

Field.Index.TOKENIZED); 

Field f6 = new Field("content", "ford", Field.Store.YES,

Field.Index.TOKENIZED);

doc1.add(f1);

doc2.add(f2);

doc3.add(f3);

doc4.add(f4);

doc5.add(f5);

doc6.add(f6);

writer.addDocument(doc1);

writer.addDocument(doc2);

writer.addDocument(doc3);

writer.addDocument(doc4);

writer.addDocument(doc5);

writer.addDocument(doc6);

writer.close();

注：IndexWriter中的create的变量值一般设为true

搜索：

IndexSearcher searcher = new IndexSearcher(path);

//构建一个Term，然后对其进行模糊查找 

Term t = new Term("content", "work"); 

FuzzyQuery query = new FuzzyQuery(t);

//FuzzyQuery还有两个构造函数，来限制模糊匹配的程度

// 在FuzzyQuery中，默认的匹配度是0.5，当这个值越小时，通过模糊查找出的文档的匹配程度就

// 越低，查出的文档量就越多,反之亦然 

FuzzyQuery query1 = new FuzzyQuery(t, 0.1f); 

FuzzyQuery query2 = new FuzzyQuery(t, 0.1f, 1);

Hits hits = searcher.search(query2); 

for (int i = 0; i  < hits.length(); i++) { 

    System.out.println(hits.doc(i));

}

searcher.close();

模糊搜索的三种构造函数，具体讲一下参数的用法（以第三个为例）；

第一个参数当然是词条对象，第二个参数指的是levenshtein算法的最小相似度，第三个参数指的是要有多少个前缀字母完全匹配：

WildCardQuery：

通配符就更简单了，只要知道“*”表示0到多个字符，而使用“？”表示一个字符就行了：

IndexSearcher searcher=new IndexSearcher(path);

Term t1=new Term("content","?o*");

WildcardQuery query=new WildcardQuery(t1);

Hits hits=searcher.search(query);

for(int i=0;i<hits.length();i++)

{

     System.out.println(hits.doc(i));

}

That“s all！

Lucene--FuzzyQuery与WildCardQuery（通配符）的更多相关文章

Lucene 的四大索引查询 ——bool 域搜索通配符范围搜索
Lucene 的四大索引查询清单1:使用布尔操作符 Java代码 //Test boolean operator blic void testOperator(String indexD ...
Apache Lucene(全文检索引擎)—搜索
目录返回目录:http://www.cnblogs.com/hanyinglong/p/5464604.html 本项目Demo已上传GitHub,欢迎大家fork下载学习:https://gith ...
【转载】Lucene.Net无障碍学习和使用：搜索篇
在上一篇中,我们初步理解了索引的增删改查基本操作.本文着重介绍一下常用的搜索,以及搜索结果的排序和分页.本文的搜索主要是基于前一篇介绍的文本文件的索引,建议下载最后改进的demo对照着看阅读本文,同时 ...
lucene-查询query->WildcardQuery使用通配符搜索
Lucene也提供了通配符的查询,这就是WildcardQuery. package ch11; import org.apache.lucene.analysis.standard.Standard ...
lucene 3.0.2 search 各种各样的Query类型
http://blog.sina.com.cn/s/blog_61d2047c010195mo.html lucene的这种各种各样的查询类型 1.TermQuery 最简单的Qu ...
Lucene系列六：Lucene搜索详解（Lucene搜索流程详解、搜索核心API详解、基本查询详解、QueryParser详解）
一.搜索流程详解 1. 先看一下Lucene的架构图由图可知搜索的过程如下: 用户输入搜索的关键字.对关键字进行分词.根据分词结果去索引库里面找到对应的文章id.根据文章id找到对应的文章 2. L ...
Lucene之模糊、精确、匹配、范围、多条件查询
Lucene的查询方式很丰富,对于数值类型的数据,采取TermRangeQuery的方式,对于String类型的,就可以采取TermQuery等,查询方式了,可以通过采取合适的查询方式,检索到数据. ...
Lucene.Net无障碍学习和使用：搜索篇
一.初步认识搜索先从上一篇示例代码中我们摘录一段代码看看搜索的简单实现: private TopDocs Search(string keyword,string field) { TopDocs ...
后端技术杂谈3：Lucene基础原理与实践
本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial 喜欢的话麻烦点下 ...
基于Lucene的全文检索实践
由于项目的需要,使用到了全文检索技术,这里将前段时间所做的工作进行一个实践总结,方便以后查阅.在实际的工作中,需要灵活的使用lucene里面的查询技术,以达到满足业务要求与搜索性能提升的目的. 一.全 ...

随机推荐

week1-绪论
一 .作业题目仿照三元组或复数的抽象数据类型写出有理数抽象数据类型的描述 (有理数是其分子.分母均为整数且分母不为零的分数). 有理数基本运算: 构造有理数T,元素e1,e2分别被赋以分子.分母值 ...
第十九课 golang中的下划线
在 Golang 里, _ (下划线)是个特殊的标识符. 用在 import 在导包的时候,常见这个用法: 1 2 import _ "net/http/pprof" import ...
php利用curl实现多进程下载文件类
批量下载文件一般使用循环的方式,逐一执行下载.但在带宽与服务器性能允许的情况下,使用多进程进行下载可以大大提高下载的效率.本文介绍PHP利用curl的多进程请求方法,实现多进程同时下载文件. 原理: ...
logger5步走
https://www.cnblogs.com/GGGGGGZX/p/9114378.html'''打印日志11/26/2017 10:44:21 PM bug 24 并写入文件example.log ...
springcloud(九) springboot Actuator + admin 监控
前一章讲的都是Feign项目(调用方)的监控.接下来讲的是服务提供方的监控一.springboot actuator + springboot admin Spring Boot Admin 是一个 ...
正规式->最小化DFA说明
整体的步骤是三步: 一,先把正规式转换为NFA(非确定有穷自动机), 二,在把NFA通过"子集构造法"转化为DFA, 三,在把DFA通过"分割法"进行最小化 ...
oracle忘记sys及system密码
一.忘记除SYS.SYSTEM用户之外的用户的登录密码. 用SYS (或SYSTEM)用户登录. CONN SYS/PASS_WORD AS SYSDBA; 使用如下语句修改用户的密码. ALTER ...
AABB和平面的相交性检测
[AABB和平面的相交性检测]
Servlet和JSP的本质和区别
基本概念 Servlet Servlet是一种服务器端的Java应用程序,具有独立于平台和协议的特性,可以生成动态的Web页面.它担当客户请求(Web浏览器或其他HTTP客户程序)与服务器响应(HTT ...
282 expression and operations添加运算符
［抄题］: 给定一个仅包含数字 0 - 9 的字符串和一个目标值,返回在数字之间添加了二元运算符(不是一元)+, - 或 * 之后所有能得到目标值的情况. "123", 6 - ...

Lucene--FuzzyQuery与WildCardQuery（通配符）

Lucene--FuzzyQuery与WildCardQuery（通配符）的更多相关文章

随机推荐

热门专题