Solr的原理及使用】的更多相关文章

文章原理链接:http://blog.csdn.net/xiaoyu411502/article/details/44803859 自己稍微总结:全文检索主要有两个过程:创建索引,搜索索引 创建索引:1.让分词组件分词进行分词处理2.语言处理组件:主要是对得到的词元(Token)做一些同语言相关的处理3.将得到的词(Term)传给索引组件(Indexer). 搜索索引:1.用户输入查询语句 读懂用户搜索意思2.对查询语句进行词法分析,语法分析,及语言处理.3.搜索索引,得到符合语法树的文档.4.…
原文出自:http://sbp810050504.blog.51cto.com/2799422/1423199 无论是垂直搜索,还是通用搜索引擎,对外提供搜索服务其压力都比较大,经常有垂直电商在做活动的时候服务器宕机.对面访问压力比较大的情况,一般的应对方法就是[集群]+[负载均衡].Solr提供了两种解决方案来对应访问压力.其一是Replication,其一是SolrCloud. Replication采用了master/slave  模式,用读写分离的思想来提高对外服务能力.但本质上还是单兵…
一.缓存原理 缓存,带来急速性能体验! Solr提供了一系列的内置缓存来优化查询性能.Solr的缓存原理主要涉及以下4个方面: 1.缓存大小及缓存置换法 从缓存大小的角度来看,不能将缓存设置的太大,否则它会消耗JVM大量的内存.Solr能将所有的缓存对象都保存到内存中,不会溢写到磁盘中.为了控制缓存大小,Solr要求为每一个缓存都设置一个缓存对象的数量上限.当达到上限时,Solr将会采用最久未使用[Least Recently Used, LRU]置换法或最近最少使用[Least Frequen…
1.Solr的简介Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口.用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引:也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果. 2.工作原理solr是基于Lucence开发的企业级搜索引擎技术,而lucence的原理是倒排索引.那么什么是倒排索引呢?接下来我们就介绍一下lucence倒排索引原理.假设有两篇文章1和2:文章1的内容为:老超在卡子门工作,我也是.文…
前面已经讲过 如果安装及配置Solr服务器了, 那么现在我们就来正式在代码中使用Solr.1,这里Solr主要是怎么使用的呢?  当我们在前台页面搜索商品名称关键词时, 我们这时是在Solr库中去查找相应的商品信息, 然后将搜索关键词高亮. 2,那么Solr库中的商品信息又是如何添加的呢?  当我们在给商品上架的时候, 将商品信息update 到mysql数据库中的bbs_product表中, 然后同样的将相应的信息 添加到Solr库中. 接下来就看代码的具体实现吧: 一, 商品上架我们在这里点…
由于solr底层使用lucene,所以很多概念与lucene相同,下面是几个常用的概念: * Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须转化为Document对象存放. * Field:Document中的一个字段,相当于数据库中的Column ,Field是lucene比较多概念一个术语,详细见后. * 个参数:索引存放的路径,分析器和是否重新创建索引.特别注意的一点,当IndexWriter执行完addDocument方法后,一定要记得调用自…
1.开篇语2.概述3.渊源4.初识Solr5.Solr的安装6.Solr分词顺序7.Solr中文应用的一个实例8.Solr的检索运算符 [开篇语]按照惯例应该写一篇技术文章了,这次结合Lucene/Solr来分享一下开发经验. Lucene是一个使用Java语言写的全文检索开发包(API),利用它可以实现强大的检索功能,它的详细介绍大家可以去Google上搜索一下,本文重点放在Solr相关的讨论上. [概述]目前国内研究Solr的人不多,而且大多是因为项目开发需要.Solr师承Lucene,为…
Solr高亮 原理 做搜索时,高亮是很常见的需求,那么Solr肯定也为高亮提供了支持.先解释下Solr高亮的原理,在我们设置了需要高亮显示的Field之后,查询得到的返回结果会多出来下面的内容: "highlighting": { "519": { "Artist_Name": [ "<em>周杰伦</em>" ] } } 其实就是多了highlighting的字段,并没有改变原来返回的字段内容. Js…
什么是Solr搜索 我们经常会用到搜索功能,所以也比较熟悉,这里就简单的介绍一下搜索的原理. 当然只是介绍solr的原理,并不是搜索引擎的原理,那会更复杂. 流程图 这是一个非常简单的流程图: User:即需要搜索的用户. Raw Data:需要搜索的内容,当然是源数据,可能是文本文件,可能是数据库的数据,可能是XML等等. Index:有格式的数据. 其实从图中可以看出来: Solr搜索非常类似于读写数据库的过程. Solr搜索最主要的两个问题(细节已经封装好): 怎样从元数据合理组织格式化成…
2010-10 目 录 1 1.1 1.2 1.2.1 1.2.2 1.2.3 1.2.4 1.2.5 1.2.6 1.2.7 1.3 1.3.1 1.3.2 1.4 1.4.1 1.4.2 1.4.3 1.5 1.5.1 1.5.2 1.6 2 2.1 2.1.1 2.1.2 2.1.3 2.2 2.2.1 2.2.2 2.3 2.3.1 2.3.2 2.4 2.4.1 2.4.2 3 3.1 3.1.1 3.1.2 3.2 3.2.1 3.2.2 3.2.3 3.3 3.3.1 3.3.2…