Solr 文章集成
Solr 文章集成
- solr原理
- solr wiki: http://wiki.apache.org/solr/
- 分布式全文检索系统SolrCloud简单介绍 http://my.oschina.net/004/blog/175768
- collection,shard。core,leader,replica
- solr组件图。http://www.solr.cc/blog/?
attachment_id=106
- 索引组件,检索组件:solrconfig配置
- 流水线各组件,schema.xml配置
- 数据导入时,先更新到leader再同步到replica
- solr数据提交分为两种,软提交和硬提交,是否开启随时提交在solrconfig中配置
- solr机群的机器数量最好提前规划
- 构建索引分词。
- Solr之中文分词。 http://blog.csdn.net/zhu_tianwei/article/details/46711511
- 在schema.xml中配,在相关wiki中非常具体
- 配置同义词词典,停用词词典,扩展词词词典,查询&索引,停用词。同义词filter等。
from=y1.7-2">http://v.youku.com/v_show/id_XNTgwODU4MTgw.html?from=y1.7-2
- query分词。
- 分词叫做analyzer
- Solr 使用自己定义 Query Parser
http://blog.chenlb.com/2010/08/solr-use-custom-query-parser.html
- 查询參数。
- Solr查询具体解释http://www.cnblogs.com/johnwood/p/3449118.html
- Solr 使用自己定义 Query Parser. http://www.jisu3d.com/2010/0526/22459.html
查询结果排序。
Ranked retrieval
- 全然匹配排在首位 http://chenzhenianqing.cn/articles/888.html
- Solrj 排序样例汇总。http://blog.sina.com.cn/s/blog_4d58e3c00101h5xc.html
- Solr搜索的排序打分规则探讨 http://elastos.org/redmine/boards/23/topics/348
- Solr设定不同字段的权重,依据相关度和业务字段综合排序搜索
http://outofmemory.cn/java/solr/search-function-query-effect-result-order - Solr In Action 笔记(2) 之评分机制(类似性计算) http://www.cnblogs.com/rcfeng/p/4067896.html
相关搜索。Spell-checking
- solr 百度相关搜索类似功能的实现 http://www.sxt.cn/u/2715/blog/4240
- Solr搜索配置关联词synonyms。 http://my.oschina.net/baowenke/blog/104019
- 小试 solr 的 spellcheck。
http://blog.chenlb.com/2009/02/try-solr-spellcheck.html
8.solr3.4 高亮(highlight),拼写检查(spellCheck),匹配类似(moreLikeThis) 应用实践 http://bastengao.iteye.com/blog/1197651 - http://yingbin920.iteye.com/blog/1568769
- 结果高亮。
- solr学习笔记四:了解solr查询语法。http://www.guoweiwei.com/archives/830,也是通过文件进行配置。
- 高亮及自己主动完毕。
- Faceting
- Autosuggest
- 结果统计Stats,url參数中。添加stats=true
- More Like This component,类似文档搜索。
- Debug component。debug模式开启,查看返回结果具体參数。&debugQuery=true。
- solr cloud
- solr在初始化一个collection的时候,能够设置好sharedNumber,Shard Splitting,在shared保存文档达到阈值,或接收到API的命令。能够split为多个。
- shared split:http://host:port/solr/admin/collections?collection=[your_collection_name]&shard=[shard_name]&action=SPLITSHARD
- Cache及冷启动
- Solr缓存 http://www.solr.cc/blog/?p=999
- Filter Cache http://www.solr.cc/blog/?p=239
- 改进Solr性能 http://blog.csdn.net/zhangshuliai/article/details/8022547
- SolrJ演示样例
- 使用solr的系统。
- 简单搜索系统组成总结
http://www.wklken.me/posts/2014/06/09/search-system.html - 使用 Apache Solr 实现更加机灵的搜索,第 1 部分: 基本特性和 Solr 模式 http://www.ibm.com/developerworks/cn/java/j-solr1/
- 简单搜索系统组成总结
文档资料
- csdn pdf: http://www.csdn.net/tag/solr
- 优酷资料: http://i.youku.com/solrcn
solr配置文件
schema.xml: solr的实例,有多少字段。每一个字段是什么类型,每一个字段怎样分词。
http://wiki.apache.org/solr/SchemaXmlsolrconfig:索引的配置,缓存用多大,哪些地方用缓存,用哪些检索的分析器。
性能调优
- Solr 性能因素 http://www.solr.cc/blog/?p=58
- Solr调优參考 http://itindex.net/detail/40572-solr
- solr性能调优(taobaoer推荐)http://xiaoyezi1128.iteye.com/blog/560685
- Solr调优參考 http://www.blogjava.net/conans/articles/379550.html
- Solr调优參考(三篇)
http://itindex.net/detail/37725-solr - 假设一个分片的全部机器都宕机了,是会报异常的,假设不想报异常查询參数加上params.setParam(“shards.tolerant”, true)
- Solr优化官方文档,http://blog.csdn.net/babydavic/article/details/8701327
jvm配置
- 參考solr in action第12章。要配置执行堆栈大小上下限以及垃圾回收參数。
- solr query日志挖掘。
.
Solr 文章集成的更多相关文章
- Solr学习笔记之2、集成IK中文分词器
Solr学习笔记之2.集成IK中文分词器 一.下载IK中文分词器 IK中文分词器 此文IK版本:IK Analyer 2012-FF hotfix 1 完整分发包 二.在Solr中集成IK中文分词器 ...
- Solr04 - 在Jetty和Tomcat上部署Solr单机服务
目录 1 准备安装环境 2 通过内部Jetty服务器启动 3 通过配置Tomcat服务器启动 3.1 删除不需要的应用 3.2 修改服务端口 3.3 部署solr.war 3.4 扩展: 虚拟目录发布 ...
- Solr In Action 中文版 第一章(四、五)
1.1 功能概览1. 4 最后,让我们再依照以下的分类.高速的过一下Solr的主要功能: ·用户体验 ·数据建模 ·Solr 4的新功能 在本书中.为你的用户提供良好的搜索体验 ...
- 威胁预警|Solr velocity模板注入远程命令执行已加入watchbog武器库,漏洞修补时间窗口越来越短
概述 近日,阿里云安全团队监测到挖矿团伙watchbog更新了其使用的武器库,增加了最新Solr Velocity 模板注入远程命令执行漏洞的攻击方式,攻击成功后会下载门罗币挖矿程序进行牟利.建议用户 ...
- solr +zookeeper+tomcat 集群搭建
最近需要搭建一个cloudSolr集群,写下记录.基础环境是在centos6.5 64bit 3个下载地址: 1. 下载Solr-4.x http://lucene.apache.org/solr/d ...
- Solr调研总结
http://wiki.apache.org/solr/ Solr调研总结 开发类型 全文检索相关开发 Solr版本 4.2 文件内容 本文介绍solr的功能使用及相关注意事项;主要包括以下内容:环境 ...
- solr教程,值得刚接触搜索开发人员一看
http://blog.csdn.net/awj3584/article/details/16963525 Solr调研总结 开发类型 全文检索相关开发 Solr版本 4.2 文件内容 本文介绍sol ...
- Solr总结
http://www.cnblogs.com/guozk/p/3498831.html Solr调研总结 开发类型 全文检索相关开发 Solr版本 4.2 文件内容 本文介绍solr的功能使用及相关注 ...
- 【转载】solr教程,值得刚接触搜索开发人员一看
转载:http://blog.csdn.net/awj3584/article/details/16963525 Solr调研总结 开发类型 全文检索相关开发 Solr版本 4.2 文件内容 本文介绍 ...
随机推荐
- VS打开文件,解决方案资源管理器自动定位到文件位置
打开 工具-->选项-->项目和解决方案-->常规,勾选“在解决方案资源管理器中跟踪活动项”
- react随笔-1(为什么在react使用jq无法正确渲染组件位置)
今天心血来潮,打开了sublime想玩玩react,然后大家都知道的先引入一大串 就是在百度静态资源库里找到的. 然后贴html代码 对的,没错,就这么一行,毕竟只是测试嘛 然后js代码 大家一定要注 ...
- [LUOGU] P2886 [USACO07NOV]牛继电器Cow Relays
https://www.luogu.org/problemnew/show/P2886 给定无向连通图,求经过k条边,s到t的最短路 Floyd形式的矩阵乘法,同样满足结合律,所以可以进行快速幂. 离 ...
- python_装饰器——迭代器——生成器
一.装饰器 1.什么是装饰器? 器=>工具,装饰=>增加功能 1.不修改源代码 2.不修改调用方式 装饰器是在遵循1和2原则的基础上为被装饰对象增加功能的工具 2.实现无参装饰器 1.无参 ...
- shelve -- 用来持久化任意的Python对象
这几天接触了Python中的shelve这个module,感觉比pickle用起来更简单一些,它也是一个用来持久化Python对象的简单工具.当我们写程序的时候如果不想用关系数据库那么重量级的东东去存 ...
- prototype 和function关系等总结
js提供了一些内置类,如Array String Function等,只要有类就有原型. 1,function ,属性包括 arguments, caller,length,name ,prototy ...
- 在C#代码中应用Log4Net系列教程(附源代码)地址
在博客园看到一篇关于Log4Net使用教程,比较详细,感谢这位热心的博主 博客园地址:http://www.cnblogs.com/kissazi2/archive/2013/10/29/339359 ...
- hdu 3879 最大密集子图(点和边均带权)(模板)
/* 最大权闭合图,可以用最大密集子图来解速度更快复杂度低 题解:胡伯涛<最小割模型在信息学竞赛中的应用> 点和边均带权的最大密集子图 s-i,权为U=点权绝对值和+边的所有权值 i-t, ...
- 【ZJOI2017 Round1练习】D2T2 iqtest(排列组合)
题意: 思路: 根据欧拉定理,a^(phi(n)-1)为a mod n的逆元 ..]of longint; s,ans,x,mo,k,phi,tmp:int64; i,m,n,j:longint; f ...
- HDU 4622 (后缀自动机)
HDU 4622 Reincarnation Problem : 给一个串S(n <= 2000), 有Q个询问(q <= 10000),每次询问一个区间内本质不同的串的个数. Solut ...