solr基本入门
一直想接触下搜索,虽然之前也玩了下solr,但一直没深入,所以也都忘得差不多了,现在solr都6.1了,发展真快。重新拾起,记录下也好,为以后出问题查找起来快一点。
1、搜索最重要的概念就是倒排索引, 通过分词,建立 分词后的一个一个 词 的倒排索引。
solr环境搭建
1、solr 6 需要 jdk1.8 和tomcat 8, 下载jdk1.8,下载solr6.1,下载 zookeeper 3.4.8,并按步骤 安装配置好 jdk 和 zookeeper (参考 http://www.cnblogs.com/xunux/p/4596216.html )
2、参考 solr 文档 Solr Quick Start( http://lucene.apache.org/solr/quickstart.html ), 着手 使用, 强调一下,在windows 环境下,由于没有 post 脚本 ,所以需要 使用 post.jar 来提交文档,
参考官方文档 (https://cwiki.apache.org/confluence/display/solr/Post+Tool#PostTool-Windows), 注意提交文档时最好指定文档类型,比如 json,pdf,html等,用 -Dtype=xxx来指定,或者
-Dauto=true 来自动识别提交的文档类型。
bin/post start -c gettingstarted -e cloud -nopromt
bin/post stop -all
bin/post delete -c xxx
3、部署 solrcloud + tomcat + zookeeper 部署。
1、部署好zookeeper, 3个节点,端口分别是 127.0.0.1:2181,127.0.0.1:2182,127.0.0.1:2183 。
2、部署 solr 到 tomcat
1、 复制 solr 下的 D:\developer\solr-6.1.0\server\solr-webapp\webapp 目录 到 tomcat 的webapp 目录下,并改为 solr
2、 将 D:\developer\solr-6.1.0\server\lib\ext 目录下的 jar 复制到 tomcat-8.0.26\webapps\solr\WEB-INF\lib 目录下
3、 复制 "D:\developer\solr-6.1.0\server\resources\log4j.properties" 到 webapps\solr\WEB-INF\classes 目录中(如果没有classes则创建)
4、 复制 "D:\developer\solr-6.1.0\server\solr" 目录 到 一个目录下,并命名为 solr_home(存放配置及索引数据)
5、 打开 tomcat-8.0.26\webapps\solr\WEB-INF\web.xml 文件修改。
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/put/your/solr/home/here</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
6、 将 welcome-file-list 的 welcome-file值 由 index.html 修改为 ./index.html
<welcome-file-list>
<welcome-file>./index.html</welcome-file>
</welcome-file-list>
7、 添加 solr 的dist 目录下的 dataimporthandler相关jar 到tomcat solr 项目的lib目录。
8、 修改 tomcat 的 catalina.bat 文件,在第二行加入
set "JAVA_OPTS=%JAVA_OPTS% -Xmx1024m -Xms256m -DzkHost=127.0.0.1:2181,127.0.0.1:2182,127.0.0.1:2183"
9、复制 3个部署好的 tomcat ,改改相关参数即可。
3、创建 schema.xml(managed-schema)、solrconfig.xml、db-data-config.xml, 通过solr 的 "D:\developer\solr-6.1.0\server\scripts\cloud-scripts\zkcli.bat" 脚本将配置上传到zookeeper,重启solr即可。
4、DIH自动从数据库导入建立索引
5、
参考文档:
1、 Solr5.4.0部署到Tomcat http://www.cnblogs.com/walk-the-Line/p/5150773.html
2、 solr多字段搜索,排序打分规则 http://www.gaoxueping.com/archives/783
solr基本入门的更多相关文章
- Solr安装入门、查询详解
Solr安装入门:http://www.importnew.com/12607.html 查询详解:http://www.360doc.com/content/14/0306/18/203871_35 ...
- Solr安装入门
Solr安装入门:http://www.importnew.com/12607.html 查询详解:http://www.360doc.com/content/14/0306/18/203871_35 ...
- 【solr专题之一】Solr快速入门
一.Solr学习相关资料 1.官方材料 (1)快速入门:http://lucene.apache.org/solr/4_9_0/tutorial.html,以自带的example项目快速介绍发Solr ...
- Solr的入门知识
一.Solr的简介 Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务.Solr可以独立运行在Jetty.Tomcat等这些Servlet容器中.都 ...
- Solr快速入门
1. 什么是Solr Solr是基于lucene的全文检索服务器.不同于lucene工具包,solr是一个web应用,运行在servlet容器,屏蔽了底层细节,并对外提供服务. 点我lucene快速入 ...
- 【solr专题之中的一个】Solr高速入门
一.Solr学习相关资料 1.官方材料 (1)高速入门:http://lucene.apache.org/solr/4_9_0/tutorial.html.以自带的example项目高速介绍发Solr ...
- Solr快速入门(一)
概述 本文档介绍了如何获取和运行Solr,将各种数据源收集到多个集合中,以及了解Solr管理和搜索界面. 首先解压缩Solr版本并将工作目录更改为安装Solr的子目录.请注意,基本目录名称可能随Sol ...
- 【solr专题之一】Solr快速入门 分类: H4_SOLR/LUCENCE 2014-07-02 14:59 2403人阅读 评论(0) 收藏
一.Solr学习相关资料 1.官方材料 (1)快速入门:http://lucene.apache.org/solr/4_9_0/tutorial.html,以自带的example项目快速介绍发Solr ...
- Solr介绍 入门练习
1.1 Solr是什么 Solr是一个基于全文检索的企业级应用服务器. 全文检索:可以输入一段文字,通过分词检索数据!!(复习) 应用服务器:它是单独的服务. 1.2 Solr能做什么 它就是用于做全 ...
随机推荐
- python学习笔记-import utils报错
今天遇到一个坑爹的问题,查找了半天原因,终于解决了,在此特地记录一下. 运行环境:Windows eclipse 我在eclipse中配置了python的运行环境,在eclipse中编写python代 ...
- Microsoft Windows* SDK May 2010 或较新版本(兼容 2010 年 6 月 DirectX SDK)GPU Detect
原文链接 下载代码样本 特性/描述 日期: 2016 年 5 月 5 日 GPU Detect 是一种简短的示例,演示了检测系统中主要显卡硬件(包括第六代智能英特尔® 酷睿™ 处理器产品家族)的方式. ...
- (转)socket Aio demo
原文地址: https://my.oschina.net/tangcoffee/blog/305656 参考文档: http://my.oschina.net/u/862897/blog/164425 ...
- 轻量级C#编辑器RoslynPad
简介 RoslynPad是一个Apache 2.0协议开源的轻量级C#编辑器.支持自动完成,语法提示,修改建议等功能.很适合平时随手写个C#程序看看运行结果. 目前版本:0.10.1,无需保存也可以运 ...
- windows系统下fis3安装教程
注意:在安装fis3前必须安装node和npm,详情请见官网http://nodejs.org node版本要求 0.8.x,0.10.x, 0.12.x,4.x,6.x,不在此列表中的版本不予支持. ...
- phoneGap+cordova+ionic混合app开发环境搭建
参考链接:http://www.w2 bc.com/article/177257 待补充
- codevs 1388 砍树
时间限制: 1 s 空间限制: 256000 KB 题目等级 : 黄金 Gold 题目描述 Description 伐木工人米尔科需要砍倒M米长的木材.这是一个对米尔科来说很容易的工作,因为他有一 ...
- [LeetCode] Number of Segments in a String 字符串中的分段数量
Count the number of segments in a string, where a segment is defined to be a contiguous sequence of ...
- Url重写——伪静态实现
简述: 在我们浏览网站的时候,很多都是以.html结尾的.难道这些都是静态网页么?其实不是的,它们很多是伪静态 那么什么是伪静态?顾名思义,就是假的静态页面.通过某种设置让你看成是静态的. Q:为何要 ...
- Python小白的发展之路之Python基础(一)
Python基础部分1: 1.Python简介 2.Python 2 or 3,两者的主要区别 3.Python解释器 4.安装Python 5.第一个Python程序 Hello World 6.P ...