全文检索(SOLR)前端应用浅析 (转)
最近在一个关于知识管理系统中检索的一个功能方案,找到了一个很好的参考应用方案嘎要的分析一下,希望有类似应用的可以交流交流。
提起全文检索,Lucene的大名估计地球人都知道,通过这么多年的发展,外围的应用是丰富多彩。Solr是在Lucene API的基础上提供了一个WEB形式的方案,Lucid的应用在Solr基础上围绕常见的企业应用进行了封装。
基于Solr的应用前端如何体现
http://www.lucidimagination.com/blog/2010/01/14/solr-search-user-interface-examples/
这篇文章介绍了多种程序语言下实现的各种应用
本文重点分析Lucid自带的ruby源代码实现的应用
Lucid介绍
http://www.lucidimagination.com/downloads 下载LucidWorks Enterprise ,然后安装即可,完成可以浏览效果
主题架构如下:

Solr核心是一部分,集成了LunceneSolr LWE-Core
Lucid定制的增强和界面,提供了丰富的应用层参考,这部分代码使用RUBY写的,不过是运行于JRuby下的
使用过程是先启动的Solr,然后启动的Lucid
代码分析
Examples下有C# Perl Python等的检索服务REST服务等调用参考,如果只是关注于Solr的使用应用可以只参考这部分即可
lwe-core目录下是SOLR服务,使用是JSP编写,运行于Jetty容器中,这部分是大众都使用的,因此不用赘述
Rails目录下是Lucid服务,使用的RUBY编写,搜索、报警、管理作为Plugin独立编写,使用是rails3.0.5,视图层采用的是ERB和HAML两种形式
Ruby相对还说用户还是比较少,如果分析这个部分的内容,因此有一定的难度,以下是一些参:
1、 Rails3相对2的改进比较大,一些命令进行了简化,因此对于这部分需要注意
2、 视图层使用了HAML模板,因此需要了解一下,否则看到这样的视图还真是不明白;浏览器中界面使用的是jquery, jquery-ui等插件
3、 这个程序默认使用的是sqlite3存储数据,而Jruby在Windows下运行这个有些问题,如果需要Jruby直接运行,可换成mysql
4、 至于查看代码使用Netbeans就行,最好使用6的版本,7以后ROR不在直接集成[具体方法是新建一个ROR项目,把nbproject目录拷贝到这个项目目录下,即可用Netbeans打开]
5、 分析这个项目时最好不要安装标准的RUBY版本,否则gem rake等命令前还需要输入jruby–S以便于区分Jruby和Ruby运行环境,很是麻烦
Lucid应用的启动入口是:start "LucidWorks Rails" /B "%JVM%" -cp bin StartUtil start "%JVM%" 1>> ./logs/ruby-stdout.log 2>>./logs/ruby-stderr.log
以上命令行实际上运行的是:[当前目录是rails]
javaw "-Djava.awt.headless=true -Dlog4j.configuration=file:../conf/log4j.xml" -jar ../lib/jruby-complete-1.5.3.jar -r../lib/bundler.jar -S script/rails server -e production -p 8989
其中bundler.jar是管理Gem包依赖的rb文件包
jruby-complete-1.5.3.jar是Jruby解释环境,这个运行环境是承载到JRE中的,因此ruby可以JAVA之间相互调用
Lucid应用效果界面参考
包括了多种数据来源的索引、索引统计信息,检索增强等




详细的内容可以参考安装包下的Docs中“LucidWorks Enterprise User Guide.pdf”,这个对整个的应用有详细的解释
对于 更详细的内容,后续有时间再详细分析
全文检索(SOLR)前端应用浅析 (转)的更多相关文章
- web前端开发浅析
原文地址:http://www.cnblogs.com/babyzone2004/articles/1807381.html 摘 要:前端开发作为一项新的领域,经历的时间随然较短,却显示了强大的生命里 ...
- 全文检索 -- Solr从概念到实战(一)
全文检索: 将整个文本进行“分词”处理,在索引库中为分词得到的每一个词都建立索引,和用户搜索的关键词进行匹配.实现快速查找效果. 传统sql语句实现的局限性: select song_id,song_ ...
- 全文检索~solr的使用
全文检索这个系列在几前年写过lucene的文章,而现在看来它确实已经老了,它的儿子孙子都出来了,已经成为现在检索行列的主流,像solr,elasticsearch等,今天我们主要来看一个solr在as ...
- 全文检索Solr集成HanLP中文分词
以前发布过HanLP的Lucene插件,后来很多人跟我说其实Solr更流行(反正我是觉得既然Solr是Lucene的子项目,那么稍微改改配置就能支持Solr),于是就抽空做了个Solr插件出来,开源在 ...
- 全文检索Solr集成HanLP中文分词【转】
以前发布过HanLP的Lucene插件,后来很多人跟我说其实Solr更流行(反正我是觉得既然Solr是Lucene的子项目,那么稍微改改配置就能支持Solr),于是就抽空做了个Solr插件出来,开源在 ...
- NoSQL:如何使用NoSQL架构构建实时广告系统
JDNoSQL平台是什么 JDNoSQL平台是一个分布式面向列的KeyValue毫秒级存储服务,存储结构化数据和非机构化数据,支持随机读写与更新,灵活的动态列机制,架构上支持水平扩容,提供高并发.低延 ...
- 一个简单的Redis结合Spring MVC架构以及实现过程
为了加快开发人员对公司项目的理解.更加容易入手和对公司项目的整体把控. 整体框架 首先介绍公司项目的整体框架,闲话少说,直接上图 整体性能分析 这就是公司的一个整体的架构,为了开发人员对架构的侧重点的 ...
- 【面试经验分享】java面试中的那些潜规则
1.大纲 潜规则1:面试的本质不是考试,而是告诉面试官你会做什么 很多刚入行的小伙伴特别容易犯的一个错误,不清楚面试官到底想问什么,其实整个面试中面试官并没有想难道你的意思,只是想通过提问的方式来知道 ...
- 全文检索引擎 Solr 部署与基本原理
全文检索引擎 Solr 部署与基本原理 搜索引擎Solr环境搭建实例 关于 solr , schema.xml 的配置说明 全文检索引擎Solr系列-–全文检索基本原理 一.搜索引擎Solr环境搭建实 ...
随机推荐
- ADSL
ADSL属于DSL技术的一种,全称Asymmetric Digital Subscriber Line( 非对称数字用户线路),亦可称作非对称数字用户环路.是一种新的数据传输方式. ADSL技术提供的 ...
- 重写(Override) 重载(Overload)
重写(Override) 重写是子类对父类的允许访问的方法的实现过程进行重新编写, 返回值和形参都不能改变.即外壳不变,核心重写! 重载(Overload)- 参数必须不同 重载(overloadin ...
- 【bzoj3451】Tyvj1953 Normal 期望+树的点分治+FFT
题目描述 给你一棵 $n$ 个点的树,对这棵树进行随机点分治,每次随机一个点作为分治中心.定义消耗时间为每层分治的子树大小之和,求消耗时间的期望. 输入 第一行一个整数n,表示树的大小接下来n-1行每 ...
- BZOJ.3998.[TJOI2015]弦论(后缀自动机)
题目链接 \(Description\) 给定字符串S,求其第K小子串.(若T=0,不同位置的相同子串算1个:否则算作多个) \(Solution\) 建SAM,处理出对于每个节点,它和它的所有后继包 ...
- 模板 树上求LCA 倍增和树链剖分
//233 模板 LCA void dfs(int x,int f){ for(int i=0;i<E[x].size();i++){ int v = E[x][i]; if(v==f)cont ...
- Fiddler_解决Fiddler查看Post参数中文乱码的问题
解决Fiddler查看Post参数中文乱码的问题 今天一个同事问我,为什么用Fiddler查看Post的中文参数,是一堆乱码,如下: 需要在注册表中增加一个键值: HKEY_CURRENT_USER\ ...
- Sublime Text 2 快捷键(转)
文件 File 新建文件 Ctrl + N 打开文件 Ctrl + O 打开最近关闭的文件 Ctrl + Shift + T 保存 Ctrl + S 另存为… Ctrl + Shift + S 关闭文 ...
- 让Win2008+IIS7+ASP.NET支持10万并发请求
今天下午17点左右,博客园博客站点出现这样的错误信息: Error Summary: HTTP Error 503.2 - Service Unavailable The serverRuntime@ ...
- 使用Puppeteer进行数据抓取(二)——Page对象
page对象是puppeteer最常用的对象,它可以认为是chrome的一个tab页,主要的页面操作都是通过它进行的.Google的官方文档详细介绍了page对象的使用,这里我只是简单的小结一下. 客 ...
- [转]Twemproxy 介绍与使用
Twemproxy是一种代理分片机制,由Twitter开源.Twemproxy作为代理,可接受来自多个程序的访问,按照路由规则,转发给后台的各个Redis服务器,再原路返回.该方案很好的解决了单个Re ...