Lucene 常用名词解析

索引的创建：
IndexWriter: 用于创建索引
Directory: 这个可以用来定义我们的索引是存放在内存中还是在硬盘上
Analyzer: 分词器有几种（）
这个地方需要好好解释下
Document: 存放索引的文档信息，一个Document有多个Field
Field: 域名

索引的搜索过程：
IndexReader: 找到索引
IndexSearcher: 获取索引
Term: 检索过程中的最小单元,可以指定某个域为某个值
Query: 主要用来进行查询（TermQuery(子类）
TopDocs: 用于返回索引的文本信息
ScoreDoc: 所有的文本信息（上面的TopDocs数组）都可以转换文档（通过get方法获取域的存储信息）

queryparser :使用queryparser完成解析搜索请求
基本格式： QueryParser parser=new QueryParser(版本号，"字段名字","分析器实例");
这个字段名字：是指你建立索引所设定的域名
Query q=new parser("关键字");

eg:
QueryParser parser = new QueryParser(Version.LUCENE_35,"content",analyzer);
Query q = parser.parse(query);

IndexSearcher：可以通过它的构造方法来获取你索引存放的位置
TopDocs tds = searcher.search(q, 500);//总共取出来的条数

TopDocs 指向相匹配的搜索条件的前N个搜索结果。它是指针的简单容器指向它们的搜索结果输出的文档。

ScoreDoc是代表一个结果的相关度得分与文档编号等信息的对象。
eg:

Directory dir = FileIndexUtils.getDirectory();

IndexSearcher searcher = getSearcher(dir);

QueryParser parser = new QueryParser(Version.LUCENE_35,"content",analyzer);

Query q = parser.parse(query);

TopDocs tds = searcher.search(q, );//总共取出来的条数

ScoreDoc[] sds = tds.scoreDocs;

int start = (pageIndex-)*pageSize;

int end = pageIndex*pageSize;

for(int i=start;i<end;i++) {

Document doc = searcher.doc(sds[i].doc);

System.out.println("filename:"+doc.get("filename"));

System.out.println("path:"+doc.get("path"));

System.out.println("date:"+doc.get("date"));

System.out.println("size:"+doc.get("size"));

System.out.println("content:"+doc.get("content"));

System.out.println("-------------------------------------------");

}

Lucene 常用名词解析的更多相关文章

[HIS] HIT行业常用名词及缩写定义
[HIS] HIT行业常用名词及缩写定义 1. EHR 居民个人电子健康记录 2. MPI 居民个人主索引 3. HIS 医院管理信息系统 4. CIS 医院临床信息系统 5. P ...
Ext 常用组件解析
Ext 常用组件解析 Panel 定义&常用属性 //1.使用initComponent Ext.define('MySecurity.view.resource.ResourcePanel' ...
Ionic 常用组件解析
Ionic 常用组件解析 $ionicModal(弹出窗口): //创建一个窗口 //此处注意目录的起始位置为app $ionicModal.fromTemplateUrl('app/security ...
Python爬虫beautifulsoup4常用的解析方法总结
摘要如何用beautifulsoup4解析各种情况的网页 beautifulsoup4的使用关于beautifulsoup4,官网已经讲的很详细了,我这里就把一些常用的解析方法做个总结,方便查阅. ...
区块链名词解析：ICO、IFO、IEO和IMO，分别是什么呢？
区块链名词解析:ICO.IFO.IEO和IMO,分别是什么呢?本部分给出了标准答案,但其相当枯燥乏味,建议快进. ICO(Initial Coin Offering),首次代币发行,指区块链项目首次向 ...
java后台常用json解析工具问题小结
若排版紊乱可查看我的个人博客原文地址 java后台常用json解析工具问题小结这里不细究造成这些问题的底层原因,只是单纯的描述我碰到的问题及对应的解决方法 jackson将java对象转json字符 ...
Apache入门篇（二）之apache 2.2.x常用配置解析
一.httpd 2.2.x目录结构 Cnetos 6.10 YUM安装httpd 2.2.x # yum install -y httpd 程序环境主配置文件: /etc/httpd/conf/ht ...
angular-cli.json配置参数解析，常用命令解析
1.angular-cli.json配置参数解析 { "project": { "name": "ng-admin", //项目名称 &qu ...
窗口类WNDCLASSEX名词解析
窗口类WNDCLASSEX名词解析 typedef struct tagWNDCLASSEX{ UINT cbsize; UINT style; WNDPROC lpfnWNDProc; int cb ...

随机推荐

linux不重启挂载磁盘安装grub
挂载.分区.grub 通过给一块新磁盘安装grub回顾磁盘挂载.分区文件系统创建等操作: 该实验基于(CtonOS6.8:kernel:2.6.32-642.15.1.el6.x86_64) 1.通过 ...
使用ofstream输出unicode
void saveWideFileHead(std::ofstream& out)// 写入文件内容前,先写入BOM { char const* const utf16head = " ...
Hibernate学习笔记四
1 整合log4j(了解) l slf4j 核心jar : slf4j-api-1.6.1.jar .slf4j是日志框架,将其他优秀的日志第三方进行整合. l 整合导入jar包 log4j 核心包 ...
【leetcode 简单】第五十二题有效电话号码
给定一个文本文件 file.txt,请只打印这个文件中的第十行. 示例: 假设 file.txt 有如下内容: Line 1 Line 2 Line 3 Line 4 Line 5 Line 6 Li ...
20155330 2016-2017-2 《Java程序设计》第三周学习总结
20155330 2016-2017-2 <Java程序设计>第三周学习总结教材学习内容总结学习目标区分基本类型与类类型理解对象的生成与引用的关系掌握String类和数组理解封 ...
CH03 课下作业
CH03 课下作业缓冲区溢出漏洞实验缓冲区溢出攻击:通过往程序的缓冲区写超出其长度的内容,造成缓冲区的溢出,从而破坏程序的堆栈,造成程序崩溃或使程序转而执行其它指令,以达到攻击的目的. 缓冲区溢出 ...
linux Ubuntu Kali 安装flash
http://jingyan.baidu.com/article/fa4125accdeeec28ad709252.html
java 万能转换器输入SQL 直接得到ArrayList
//java万能List转换器 public static <T> ArrayList<T> ToList(Class<T> clazz,String sql) t ...
BZOJ4034_树上操作_KEY
题目传送门这道题可以树链剖分+线段树. 其他操作模板,第二个操作只需要将x~x+size[x]-1区间加值即可. code: #include <cstdio> #include < ...
CF 547 D. Mike and Fish
D. Mike and Fish http://codeforces.com/contest/547/problem/D 题意: 给定平面上n个点,将这些点染成红或者蓝色,要求每行.每列红色点与蓝色点 ...

Lucene 常用名词解析

Lucene 常用名词解析的更多相关文章

随机推荐

热门专题