lucene是一款很优秀的全文检索的开源库,目前最新的版本是lucene4.4,关于lucene的历史背景以及发展状况,在这里笔者就不多介绍了,如果你真心想学习lucene,想必在这之前你已经对此作过一些了解。

  有很多人知道lucene或者solr,但是却有很少人知道luke,在这里笔者就对luke做一个简单的介绍,Luke是一个用于Lucene搜索引擎的,方便开发和诊断的第三方工具,它可以访问现有Lucene的索引,并允许您显示和修改和调试。luke是google公司最早提供的,对于lucene的直接索引查看很方便,在这之前,如果你想查看下你生成的lucene的索引的全部内容,你得需要写很多代码进行操作,更有甚,也许你只想简简单单的看下生成索引的总数据量,你也得写一段代码才能统计出来,而luke的出现,就为lucene的查看及调试,提供了一个很好的界面操作工具,对lucene及solr生成的索引,可以非常方便的进行查询及调试,不仅如此luke还提供了良好的插件机制,使用者可以自定义某些功能进行安装使用,非常灵活。

  使用luke工具,不仅可以对索引进行直接查看,还可以对索引进行增加,删除,修改,以及优化,还可以是使用不同的分词器,对特定的字段进行分词测试,等等,这一点非常类似solr的管理页面提供的功能,但是二者的侧重点不在一个地方。

  luke工具的使用也非常简单,下载完luke后直接放在某个盘符下然后可以在cmd窗口找到luke工具所在的盘符根路径下,使用java -jar luke.jar就可以启动了,有的luke工具直接双击运行就可以启动,使用时候两种方式都可以试一下,启动之后,点击Browser按钮,找到你的索引路径点OK,即可显示你索引的内容,不过使用luke得注意版本问题,一般来说luke是向后兼容的,但是如果你是4.x的lucene索引,那么你使用3.x的luke工具查看,这样是不行的,反之确实可以的。

Luke安装及使用

1、首先配置好JAVA环境。

2、下载luke:http://www.getopt.org/luke/luke-0.9.2/lukeall-0.9.2.jar

3、双击lukeall-0.9.2.jar。

4、选择索引文件查看。

另外,Luke的plugin中带了一个Analyzer的测试工具。

在Luke中选择plugins标签,再选择Analyzer Tool,就可以使用这个测试Analyzer的工具了。在下拉列表中选择要测试的Analyzer,然后输入要分析的文本,点Analyze,就可以看到分析出来的token了。这个工具可以测试很多analyzer,除了最基本的WhitespaceAnalyzer、StopAnalyzer、SimpleAnalyzer、StandardAnalyzer之外还可以实验KeywordAnalyzer、SnowballAnalyzer、CJKAnalyzer、ChineseAnalyzer等等,可以说是包罗万象了。

写索引和搜索程序之前,都可以用这个工具来比较一下各种Analyzer的运行结果。另外估计如果把自己写的Analyzer编译后加入Luke的jar包的相应位置中,应该也可以测试自己的Analyzer类了。

下载地址:http://download.csdn.net/detail/irfen/7700397#comment

下载完后直接双击即可

lucene开发序之luke神器的更多相关文章

  1. iOS开发笔记 - 界面调试神器Reveal

    http://blog.csdn.net/jackfrued/article/details/50934092     Reveal是iOS开发工具中的神器之一,它能够在应用程序运行过程中调试应用程序 ...

  2. 开发手机APP的神器 --- ionic

      前  言          在如今的生活中,手机已经与我们的生活紧紧的联系在了一起.而手机APP更是其中,重要的一环.今天,影子就为大家介绍一种开发手机APP的超级神器---ionic. ioni ...

  3. lucene索引查看工具luke和文本提取工具Tika

    luke可以方便的查看lucene的索引信息,当然也可以查看solr和es中的索引信息(基于lucene实现). 查看索引前,要注意lucene版本的问题,高版本的lucene用低版本的luke工具就 ...

  4. iOS开发之 - 键盘处理神器 IQKeyboardManager

    平常在开发中,用到输入框的地方不胜其数,当输入框位于屏幕底部时,弹起的键盘很可能覆盖输入框,导致用户看不到输入结果,体验较差...... IQKeyboardManager 可以很简单快捷的解决键盘遮 ...

  5. openresty 前端开发序

    还记得第一次尝试前后端分离的时候,是使用nginx + react 构建的spa应用,后端是java,主要处理业务逻辑逻辑部分,返回json数据,在nginx里面配置好html + js纯静态文件,再 ...

  6. 使用Lucene开发自己的搜索引擎

    1.下载Lucene开发包,请到:http://lucene.apache.org/ 2.在myeclipse环境部署该开发包: 3.代码编写: package Lucene; import java ...

  7. 基于HTML5的SLG游戏开发(序)

          2012年前后,HTML5游戏凭借跨平台.易移植.部署简单.节省成本等优点被炒的火热,经过一两年的快速发展,市场出现了一些成功地HTML5游戏产品,像磊友的<修仙三国>,神奇时 ...

  8. Android | 教你如何用华为HMS MLKit SDK 三十分钟在安卓上开发一个微笑抓拍神器

    Android | 只要三十分钟就可以在手机上开发一个微笑抓拍神器!!! 前言 前段时间Richard Yu在发布会上给大家介绍了华为HMS Core4.0,回顾发布会信息请戳: 华为面向全球发布HM ...

  9. javascript开发后端程序的神器nodejs

    目录 简介 nodejs的历史 nodejs简介 nodejs的运行环境 process 终止进程 env argv CLI交互 exports模块 nodejs API nodejs的框架 简介 j ...

随机推荐

  1. IOS 'NSInternalInconsistencyException', reason: 'Invalid parameter not satisfying: URLString'

    转载自:http://i.cnblogs.com/EditPosts.aspx?postid=4012011 今天想写一个请求的天气,好的,废话不多说,先贴代码: 使用AFNetWorking 发送g ...

  2. Io_Language

    Object ancestor := method ( prototype := self proto if (prototype != Obejct, writeln ("Slots of ...

  3. 关于Intent的七大属性

    原谅我愚昧,Intent七大属性这个概念我也是昨天才接触到,看了一下,都是一些常用的东西,就是没有总结过,那么今天就来简单总结一下. Intent七大属性是指Intent的ComponentName. ...

  4. Hadoop Standalone and Pseudo Mode

    . Required Softwareyum install openssh-server rsync java-1.8.0-openjdk-devel . Setup Hostname/etc/ho ...

  5. rndc: connect failed: 127.0.0.1#953: connection refused

    [root@localhost sbin]# ./named -v bind 9.5.1-p3-v3.0.9 问题现象: [root@localhost sbin]# ./rndc flush -p ...

  6. 创建本地RPM源之更新系统旧版软件mysql

    事情起因 系统版本为Centos6.6 ,因为之前同事没有采用最小化选择性安装,所以系统安装好后自带有mysql5.1的三个安装包: [root@test ~]# rpm -qa | grep mys ...

  7. Google Developers中国网站发布!(转)

    Google Developers 中国网站是特别为中国开发者而建立的,它汇集了 Google 为全球开发者所提供的开发技术资源,包括 API 文档.开发案例.技术培训的视频.并涵盖了以下关键开发技术 ...

  8. EF的TransactionScope

    TransactionScope是一个分布式事务的语句块,被包含起来的语句一起被提交,当出现异常,一起回滚,这都是托管的 当Web没有开启MSDTC服务时候会出现:

  9. C#的垃圾回收机制及弱引用

    在上一篇中,讨论了字符串常量的拘留池和不可变性:对于字符串变量,没有这个特性(或其他DotNet的非托管资源),当我们使用完后就要手动回收,即将变量的值指向null(p=null),然而堆内存中,那个 ...

  10. ssh(Struts2+hibernate+spring)简单分页

    实体类+实体映射+entity(pagebean)+dao层+service层+action层