Lucene4.4.0 开发之排序

排序是对于全文检索来言是一个必不可少的功能，在实际运用中，排序功能能在某些时候给我们带来很大的方便，比如在淘宝，京东等一些电商网站我们可能通过排序来快速找到价格最便宜的商品，或者通过排序来找到评论数最高或卖的最好的商品，再比如在Iteye里的博客栏里，每天都会以降序的方式，来显示出最新发出的几篇博客，有了排序，我们就能在某些时候很方便快速的得到某些有效信息，所以说排序功能，无处不在 ^_^。

　　那么，本篇就来看下我们在Lucene中怎么使用其丰富的排序功能。

　　在这之前，我们先来熟悉下lucene中排序的基本知识，在默认情况下，Lucene使用的是以关联性降序的方式为默认的排序方式，这样可以使得我们搜索的结果通常是最优的，因为它会尽可能的使得首先出现的几个结果是与我们搜索的内容最相关，而不需要我们翻页寻找我们最想要的内容，这一点是与数据库相比，是全文检索一个很大的优点。当然，在实际开发中我们也需要根据业务的实际情况来给我们的客户提供多种不同的排序方式。我们先来看下在Lucene中比较特殊的两种基本的排序方式

　　
Sort里的属性 SortField里的属性含义
Sort.INDEXORDER SortField.FIELD_DOC 按照索引的顺序进行排序
Sort.RELEVANCE SortField.FIELD_SCORE 按照关联性评分进行排序

　　我们再来看几个检索时需要用的方法

　　Java代码

　　=========SortField类============

　　//field是排序字段type是排序类型

　　public SortField(String field, Type type);

　　//field是排序字段type是排序类型reverse是指定升序还是降序

　　//reverse 为true是降序 false为升序

　　public SortField(String field, Type type, boolean reverse)

　　=========Sort类============

　　public Sort();//Sort对象构造方法默认是按文档评分排序

　　public Sort(SortField field);//排序的一个SortField

　　public Sort(SortField... fields)//排序的多个SortField可以传入一个数组

　　=========IndexSearche类r========

　　//query是查询的Query对象 filter是过滤 n返回的数量 sort是排序

　　search(Query query, Filter filter, int n, Sort sort)

　　//doDocScores 为true情况下每个命中的结果下都会被评分

　　//doMaxScore 为true情况下对最大分值的搜索结果进行评分

　　search(Query query, Filter filter, int n, Sort sort, boolean doDocScores, boolean doMaxScore)

　　=========SortField类============

　　//field是排序字段type是排序类型

　　public SortField(String field, Type type);

　　//field是排序字段type是排序类型reverse是指定升序还是降序

　　//reverse 为true是降序 false为升序

　　public SortField(String field, Type type, boolean reverse)

　　=========Sort类============

　　public Sort();//Sort对象构造方法默认是按文档评分排序

　　public Sort(SortField field);//排序的一个SortField

　　public Sort(SortField... fields)//排序的多个SortField可以传入一个数组

　　=========IndexSearche类r========

　　//query是查询的Query对象 filter是过滤 n返回的数量 sort是排序

　　search(Query query, Filter filter, int n, Sort sort)

　　//doDocScores 为true情况下每个命中的结果下都会被评分

　　//doMaxScore 为true情况下对最大分值的搜索结果进行评分

　　search(Query query, Filter filter, int n, Sort sort, boolean doDocScores, boolean doMaxScore)

　　1，在还没有进行一点排序前我们先来看下索引里的内容，核心代码如下:

　　Java代码

　　TopDocs topDocs=searcher.search(new MatchAllDocsQuery(),10000);

　　2，使用默认的关联性评分后,核心代码和运行效果图如下:

　　Java代码

　　Sort sort=new Sort();//默认使用关联性评分

　　TopDocs topDocs=searcher.search(new MatchAllDocsQuery(),10000,sort);

　　Sort sort=new Sort();//默认使用关联性评分

　　TopDocs topDocs=searcher.search(new MatchAllDocsQuery(),10000,sort);

　　关于上图中乱码字符原因是因为默认排序情况下lucene是不会对搜索结果进行评分操作的，因为评分操作会降低性能，所以关于score的那一列返回的是NAN的字符串，出于格式的需要，散仙在用DecimalFormat类给其评分结果保留2位小数时，因为是一个特殊字符，所以就出现了上图情况。

3，按照日期降序排序，,核心代码和运行效果图如下:

　　Java代码

　　Sort sort=new Sort(new SortField("date", Type.INT,true));//true为降序排列

　　TopDocs topDocs=searcher.search(new MatchAllDocsQuery(),10000,sort);

　　Sort sort=new Sort(new SortField("date", Type.INT,true));//true为降序排列

　　TopDocs topDocs=searcher.search(new MatchAllDocsQuery(),10000,sort);

　　3，按照价格升序排序，,核心代码和运行效果图如下:

　　Java代码

　　Sort sort=new Sort(new SortField("price", Type.DOUBLE,false));//false为降序排列

　　TopDocs topDocs=searcher.search(new MatchAllDocsQuery(),10000,sort);

　　Sort sort=new Sort(new SortField("price", Type.DOUBLE,false));//false为降序排列

　　TopDocs topDocs=searcher.search(new MatchAllDocsQuery(),10000,sort);

　　4，多字段排序，按照日期降序的情况下，因为id为7和8的日期相同，所以我们就新增一个排序字段按ename升序排列，,核心代码和运行效果图如下:

　　Java代码

　　// Sort sort=new Sort(new SortField("date", Type.INT, true),new SortField("ename", Type.STRING, false));

　　//这两段代码效果一样

　　Sort sort=new Sort(new SortField[]{new SortField("date", Type.INT, true),new SortField("ename", Type.STRING, false)});

　　TopDocs topDocs=searcher.search(new MatchAllDocsQuery(),10000,sort);

　　// Sort sort=new Sort(new SortField("date", Type.INT, true),new SortField("ename", Type.STRING, false));

　　//这两段代码效果一样

　　Sort sort=new Sort(new SortField[]{new SortField("date", Type.INT, true),new SortField("ename", Type.STRING, false)});

　　TopDocs topDocs=searcher.search(new MatchAllDocsQuery(),10000,sort);

　　5，带评分的排序，注意后面两个布尔类型的变量可以控制是否评分，特别是在没有要求需要打分时，建议别开启，大数量时对性能影响较大，检索“编程”得到的结果,默认按评分降序排序，核心代码和运行效果图如下:

　　Java代码

　　Sort sort=Sort.RELEVANCE;

　　TopDocs topDocs=searcher.search(new TermQuery(new Term("bookname", "编程")),null,100,sort,true,true);

　　Sort sort=Sort.RELEVANCE;

　　TopDocs topDocs=searcher.search(new TermQuery(new Term("bookname", "编程")),null,100,sort,true,true);

　　上面的编程,编程因为在切分时编程的tf出现了2次，所以在查询时有较高的得分，所以排在首位。

　　6，注意几点
（1）排序对一个文档里什么域都没存储，使用字符串排序会排在首位
（2）排序对一个文档里什么域都没存储，使用数字类型排序会默认给其赋值为0进行排序
（3）我们可以对数字类型的null值的文档进行代码控制，可以将其设置为最大，所以将会排在最后面，代码如下

　　SortField sortField = new SortField("value", SortField.Type.INT);

　　sortField.setMissingValue(Integer.MAX_VALUE);

Lucene4.4.0 开发之排序的更多相关文章

【转】lucene4.3.0 配置与调试
lucene4.3.0 配置与调试 demo lucene的最新版本是4.3.0, http://www.apache.org/dyn/closer.cgi/lucene/java/4.3.0 luc ...
ASP.NET Core 1.0 开发记录
官方资料: https://github.com/dotnet/core https://docs.microsoft.com/en-us/aspnet/core https://docs.micro ...
用SignalR 2.0开发客服系统[系列2:实现聊天室]
前言交流群:195866844 上周发表了用SignalR 2.0开发客服系统[系列1:实现群发通讯] 这篇文章,得到了很多帮助和鼓励,小弟在此真心的感谢大家的支持.. 这周继续系列2,实现聊天室 ...
用SignalR 2.0开发客服系统[系列3:实现点对点通讯]
前言交流群:195866844 目录: 用SignalR 2.0开发客服系统[系列1:实现群发通讯] 用SignalR 2.0开发客服系统[系列2:实现聊天室] 真的很感谢大家的支持,今天发表系列3 ...
用SignalR 2.0开发客服系统[系列4:负载均衡的情况下使用SignalR]
前言交流群:195866844 目录: 用SignalR 2.0开发客服系统[系列1:实现群发通讯] 用SignalR 2.0开发客服系统[系列2:实现聊天室] 用SignalR 2.0开发客服系统 ...
用SignalR 2.0开发客服系统[系列5:使用SignalR的中文简体语言包和其他技术点]
前言交流群:195866844 目录: 用SignalR 2.0开发客服系统[系列1:实现群发通讯] 用SignalR 2.0开发客服系统[系列2:实现聊天室] 用SignalR 2.0开发客服系统 ...
vue 2.0 开发实践总结之疑难篇
续上一篇文章:vue2.0 开发实践总结之入门篇 ,如果没有看过的可以移步看一下. 本篇文章目录如下: 1. vue 组件的说明和使用 2. vuex在实际开发中的使用 3. 开发实践总结 1. ...
vue2.0 开发实践总结之入门篇
vue2.0 据说也出了很久了,博主终于操了一次实刀. 整体项目采用 vue + vue-router + vuex (传说中的vue 全家桶 ),构建工具使用尤大大推出的vue-cli 后续文 ...
Telerik JustDecompile 2014.1.255.0 开发版（.NET反编译神器，免费下载）
Telerik JustDecompile是Telerik公司推出一个免费的.NET反编译工具,支持插件与Visual Studio 2015~2013集成,还能够创建Visual Studio Pr ...

随机推荐

Asp.net MVC 传递数据从前台到后台，包括单个对象，多个对象，集合
今天为大家分享下 Asp.net MVC 将数据从前台传递到后台的几种方式. 环境:VS2013,MVC5.0框架 1.基本数据类型我们常见有传递 int, string, bool, double ...
Bootstrap 模态框(Modal)插件
页面效果: html+js: <!DOCTYPE html> <html> <head> <meta charset="utf-8"> ...
winform异步加载数据到界面
做一个学习记录. 有两个需求: 1.点击按钮,异步加载数据,不卡顿UI. 2.把获取的数据加载到gridview上面. 对于需求1,2,代码如下: public delegate void ShowD ...
LoadRunner函数百科叒叒叒更新了！
首先要沉痛通知每周四固定栏目[学霸君]由于小编外派公干,本周暂停. 那么这周就由云层君来顶替了,当然要要说下自己做的内容啦,DuangDuang! <LoadRunner函数百科>更新通知 ...
js参数arguments的理解
原文地址:js参数arguments的理解对于函数的参数而言,如下例子 function say(name, msg){ alert(name + 'say' + msg); } say('xiao ...
Twproject Gantt开源甘特图功能扩展
1.Twproject Gantt甘特图介绍 Twproject Gantt 是一款基于 jQuery 开发的甘特图组件,也可以创建其它图表,例如任务树(Task Trees).内置编辑.缩放和 CS ...
JavaScript事件代理和委托（Delegation）
JavaScript事件代理首先介绍一下JavaScript的事件代理.事件代理在JS世界中一个非常有用也很有趣的功能.当我们需要对很多元素添加事件的时候,可以通过将事件添加到它们的父节点而将事件委 ...
css样式之border-radius
border-radius 属性设置边框的园角可能的值:像素,百分比扩展延伸 html代码 <div></div> css代码 div { height: 200px; w ...
【JavaScript】innerHTML、innerText和outerHTML的用法区别
用法: <div id="test"> <span style="color:red">test1</span> tes ...
关于CSS inline-block、BFC以及外边距合并的几个小问题
CSS inline-block和BCF对于初学者来说,总是弄不太明白,下面记录下我在学习这块知识的过程中遇到的几个问题,供大家参考,有不足的地方,欢迎大家批评指正. 一.在什么场景下会出现外边距合并 ...

Lucene4.4.0 开发之排序

Lucene4.4.0 开发之排序的更多相关文章

随机推荐

热门专题