lucene的两种分页操作

基于lucene的分页有两种：

lucene3.5之前分页提供的方式为再查询方式（每次查询全部记录，然后取其中部分记录，这种方式用的最多），lucene官方的解释：由于我们的速度足够快。处理海量数据时，内存容易内存溢出。

lucene3.5以后提供一个searchAfter，这个是在特大数据量采用（亿级数据量），速度相对慢一点，像google搜索图片的时候，点击更多，然后再出来一批。这种方式就是把数据保存在缓存里面。然后再去取。
以下是再查询部分代码：

	/**

	 * 这就是先查询所有的数据，然后去分页数据

     * 注意 这种方式处理海量数据的时候，容易内存溢出

	 * @param query

	 * @param pageIndex--第几页

	 * @param pageSize--每页显示多少数据

	 */

	public void searchPage(String query,int pageIndex,int pageSize) {

		try {

			Directory dir = FileIndexUtils.getDirectory();

			IndexSearcher searcher = getSearcher(dir);

			QueryParser parser = new QueryParser(Version.LUCENE_35,"content",new StandardAnalyzer(Version.LUCENE_35));

			Query q = parser.parse(query);

			TopDocs tds = searcher.search(q, 500);

			//注意 此处把500条数据放在内存里。

			ScoreDoc[] sds = tds.scoreDocs;

			int start = (pageIndex-1)*pageSize;

			int end = pageIndex*pageSize;

			for(int i=start;i<end;i++) {

				Document doc = searcher.doc(sds[i].doc);

				System.out.println(sds[i].doc+":"+doc.get("path")+"-->"+doc.get("filename"));

			}

			searcher.close();

		} catch (org.apache.lucene.queryParser.ParseException e) {

			e.printStackTrace();

		} catch (IOException e) {

			e.printStackTrace();

		}

	}

最后我们来看下使用SearcherAfter进行分页的方式,代码如下（lucene3.5之前不支持该方法）:

	/**

	 * 根据页码和分页大小获取上一次的最后一个scoredocs

	 * @param pageIndex

	 * @param pageSize

	 * @param query

	 * @param searcher

	 * @return

	 * @throws IOException

	 */

	private ScoreDoc getLastScoreDoc(int pageIndex,int pageSize,Query query,IndexSearcher searcher) throws IOException {

		if(pageIndex==1)return null;//如果是第一页就返回空

		int num = pageSize*(pageIndex-1);//获取上一页的最后数量

		TopDocs tds = searcher.search(query, num);

		return tds.scoreDocs[num-1];

	}

	public void searchPageByAfter(String query,int pageIndex,int pageSize) {

		try {

			Directory dir = FileIndexUtils.getDirectory();

			IndexSearcher searcher = getSearcher(dir);

			QueryParser parser = new QueryParser(Version.LUCENE_35,"content",new StandardAnalyzer(Version.LUCENE_35));

			Query q = parser.parse(query);

			//获取上一页的最后一个元素

			ScoreDoc lastSd = getLastScoreDoc(pageIndex, pageSize, q, searcher);

			//通过最后一个元素去搜索下一页的元素

			TopDocs tds = searcher.searchAfter(lastSd,q, pageSize);

			for(ScoreDoc sd:tds.scoreDocs) {

				Document doc = searcher.doc(sd.doc);

				System.out.println(sd.doc+":"+doc.get("path")+"-->"+doc.get("filename"));

			}

			searcher.close();

		} catch (org.apache.lucene.queryParser.ParseException e) {

			e.printStackTrace();

		} catch (IOException e) {

			e.printStackTrace();

		}

	}

本文转载自hu948162999博客,版权归hu948162999所有

lucene的两种分页操作的更多相关文章

SQL Server两种分页的存储过程介绍
由于现在很多的企业招聘的笔试都会让来招聘的写一个分页的存储过程,有的企业甚至要求应聘者用两种方式实现分页,如果没有在实际项目中使用过分页,那么很多的应聘者都会出现一定的问题,下面介绍两种分 ...
PostgreSQL两种分页方法查询时间比较
数据库中存了3000W条数据,两种分页查询测试时间第一种 SELECT * FROM test_table WHERE i_id> limit 100; Time: 0.016s 第二种 SE ...
lucene两个分页操作
基于lucene两个分页: lucene3.5查询方式(每次查询所有记录,然后取当中部分记录.这样的方式用的最多),lucene官方的解释:因为我们的速度足够快. 处理海量数据时.内存easy内存溢出 ...
sql server两种分页方法
方法一: --分页方法一 OrderID,CustomerID, EmployeeID,OrderDate,ShippedDate,ShipName,ShipAddress,Freight from ...
基于layPage分页插件浅析两种分页方式
最近在开发过程中经常用到分页,今天挤出些时间来捋一捋自己的经验在web开发中,一般显示数据列表页时,我们会用到分页控件来显示数据.采用分页一般基于两种不同的需求,一种是数据量不算很大,但是在页面展示 ...
两种方法操作其它mac应用的窗口
(图文基本无关) 如果单纯说简单方便,其使用AppleScript更好,特别是现在有了JS的加入,比如: (* This Apple script will resize any program wi ...
Oracle 分页 ROWNUM 两种分页方法和ROWID用法
一原因一 oracle默认为每个表生成rowmun,rowid字段,这些字段我们称之为伪列测试表 CREATE TABLE A ( AID NUMBER() primary key, ANAME ...
不使用spring的情况下原生java代码两种方式操作mongodb数据库
由于更改了mongodb3.0数据库的密码,导致这几天storm组对数据进行处理的时候,一直在报mongodb数据库连接不上的异常. 主要原因实际上是和mongodb本身无关的,因为他们改的是配置 ...
sqlalchemy和flask-sqlalchemy几种分页操作
sqlalchemy中使用query查询,而flask-sqlalchemy中使用basequery查询,他们是子类与父类的关系假设 page_index=1,page_size=10:所有分页查询 ...

随机推荐

CodeForces 577C Vasya and Petya's Game 数学
题意就是给你一个1到n的范围你每次可以问这个数是否可以被某一个数整除问你要猜多少数才能确定这个数…… 一开始一点思路也没有后来查了一下才知道每个数都可以分为几个质数的整数次幂相乘得到…… #i ...
IntelliJ IDEA 13.1.4新建java web项目
打开软件
python [1:3]
Python下标是以0开始的x[1:3]表示返回集合中下标1至3(不包括3)的元素集合x[:3] 表示返回从开始到下标3(不包括3)的元素集合x[3:]表示返回从下标3到结束的元素集合X[:]表示返回 ...
安卓手机微信页面position: fixed位置错误
今天做项目的时候发现动用position: fixed做弹窗时,用margin-top:50%这样外边距来响应式的控制位置时,在微信里打开页面的弹窗,弹窗在手机上显示的位置和实际上在手机上的位置不一样 ...
借助nginx搭建反向代理服务器小例
1 反向代理: 反向代理(Reverse Proxy)方式是指以代理服务器接收internet上的连接请求,然后将请求转发给内部网络上的服务器,并将从服务器上得到的结果返回给internet上请求连接 ...
iOS 视图控制器生命周期
1.init: 2.viewDidLoad: 3.viewWillAppear: 4.viewDidAppear: 5.viewWillDisappear; 6.viewDidDisappear
Android中的Glide加载图片
注意:在Android Studio的项目的build.gradle中添加: compile 'com.github.bumptech.glide:glide:3.6.1' 然后同步一下目录: 使用 ...
HDU2544-最短路(最短路模版题目)
Problem Description 在每年的校赛里,所有进入决赛的同学都会获得一件很漂亮的t-shirt.但是每当我们的工作人员把上百件的衣服从商店运回到赛场的时候,却是非常累的!所以现在他们想要 ...
bug--Unable to add window –token is not valid; is your activity running?
错误原因是Dialog在show的时候必须要有一个activity作为窗口载体,上面的日志的意思是承载Dialog的activity已经被销毁了,不存在了解决方法: 1.粗暴一点直接try catc ...
解决安装WordPress主题及插件需要输入FTP问题
http://www.zhanghenglei.com/wordpress-ftp-update/ 使用Wordpress程序架构的网站如果需要在网站后台升级.安装主题或者插件的时候,总是会提示需要我 ...

lucene的两种分页操作

lucene的两种分页操作的更多相关文章

随机推荐

热门专题