一直想接触下搜索,虽然之前也玩了下solr,但一直没深入,所以也都忘得差不多了,现在solr都6.1了,发展真快。重新拾起,记录下也好,为以后出问题查找起来快一点。

1、搜索最重要的概念就是倒排索引, 通过分词,建立 分词后的一个一个 词 的倒排索引。

solr环境搭建

1、solr 6 需要 jdk1.8 和tomcat 8, 下载jdk1.8,下载solr6.1,下载 zookeeper 3.4.8,并按步骤 安装配置好 jdk 和 zookeeper (参考 http://www.cnblogs.com/xunux/p/4596216.html )

2、参考 solr 文档  Solr Quick Start( http://lucene.apache.org/solr/quickstart.html ), 着手 使用, 强调一下,在windows 环境下,由于没有 post 脚本 ,所以需要 使用 post.jar 来提交文档,

参考官方文档 (https://cwiki.apache.org/confluence/display/solr/Post+Tool#PostTool-Windows), 注意提交文档时最好指定文档类型,比如 json,pdf,html等,用 -Dtype=xxx来指定,或者

-Dauto=true 来自动识别提交的文档类型。

bin/post start -c gettingstarted -e cloud -nopromt
bin/post stop -all
bin/post delete -c xxx

3、部署 solrcloud + tomcat + zookeeper 部署。

  1、部署好zookeeper, 3个节点,端口分别是 127.0.0.1:2181,127.0.0.1:2182,127.0.0.1:2183 。

  2、部署 solr 到 tomcat

    1、 复制 solr 下的 D:\developer\solr-6.1.0\server\solr-webapp\webapp 目录 到 tomcat 的webapp 目录下,并改为 solr

    2、 将 D:\developer\solr-6.1.0\server\lib\ext 目录下的 jar 复制到 tomcat-8.0.26\webapps\solr\WEB-INF\lib 目录下

    3、 复制  "D:\developer\solr-6.1.0\server\resources\log4j.properties" 到 webapps\solr\WEB-INF\classes 目录中(如果没有classes则创建)

    4、 复制 "D:\developer\solr-6.1.0\server\solr" 目录 到 一个目录下,并命名为 solr_home(存放配置及索引数据)

    5、 打开 tomcat-8.0.26\webapps\solr\WEB-INF\web.xml 文件修改。

<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/put/your/solr/home/here</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
    将<env-entry-value>中的内容改成你的solr_home路径,这里是D:/solr_home

    6、 将 welcome-file-list 的 welcome-file值 由 index.html 修改为 ./index.html

<welcome-file-list>
<welcome-file>./index.html</welcome-file>
</welcome-file-list>

    7、 添加 solr 的dist 目录下的 dataimporthandler相关jar 到tomcat solr 项目的lib目录。

    8、 修改 tomcat 的 catalina.bat 文件,在第二行加入

set "JAVA_OPTS=%JAVA_OPTS% -Xmx1024m -Xms256m -DzkHost=127.0.0.1:2181,127.0.0.1:2182,127.0.0.1:2183"

    9、复制 3个部署好的 tomcat ,改改相关参数即可。

  3、创建 schema.xml(managed-schema)、solrconfig.xml、db-data-config.xml, 通过solr 的 "D:\developer\solr-6.1.0\server\scripts\cloud-scripts\zkcli.bat" 脚本将配置上传到zookeeper,重启solr即可。

4、DIH自动从数据库导入建立索引

5、

参考文档:

1、 Solr5.4.0部署到Tomcat http://www.cnblogs.com/walk-the-Line/p/5150773.html

2、 solr多字段搜索,排序打分规则 http://www.gaoxueping.com/archives/783

solr基本入门的更多相关文章

  1. Solr安装入门、查询详解

    Solr安装入门:http://www.importnew.com/12607.html 查询详解:http://www.360doc.com/content/14/0306/18/203871_35 ...

  2. Solr安装入门

    Solr安装入门:http://www.importnew.com/12607.html 查询详解:http://www.360doc.com/content/14/0306/18/203871_35 ...

  3. 【solr专题之一】Solr快速入门

    一.Solr学习相关资料 1.官方材料 (1)快速入门:http://lucene.apache.org/solr/4_9_0/tutorial.html,以自带的example项目快速介绍发Solr ...

  4. Solr的入门知识

      一.Solr的简介 Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务.Solr可以独立运行在Jetty.Tomcat等这些Servlet容器中.都 ...

  5. Solr快速入门

    1. 什么是Solr Solr是基于lucene的全文检索服务器.不同于lucene工具包,solr是一个web应用,运行在servlet容器,屏蔽了底层细节,并对外提供服务. 点我lucene快速入 ...

  6. 【solr专题之中的一个】Solr高速入门

    一.Solr学习相关资料 1.官方材料 (1)高速入门:http://lucene.apache.org/solr/4_9_0/tutorial.html.以自带的example项目高速介绍发Solr ...

  7. Solr快速入门(一)

    概述 本文档介绍了如何获取和运行Solr,将各种数据源收集到多个集合中,以及了解Solr管理和搜索界面. 首先解压缩Solr版本并将工作目录更改为安装Solr的子目录.请注意,基本目录名称可能随Sol ...

  8. 【solr专题之一】Solr快速入门 分类: H4_SOLR/LUCENCE 2014-07-02 14:59 2403人阅读 评论(0) 收藏

    一.Solr学习相关资料 1.官方材料 (1)快速入门:http://lucene.apache.org/solr/4_9_0/tutorial.html,以自带的example项目快速介绍发Solr ...

  9. Solr介绍 入门练习

    1.1 Solr是什么 Solr是一个基于全文检索的企业级应用服务器. 全文检索:可以输入一段文字,通过分词检索数据!!(复习) 应用服务器:它是单独的服务. 1.2 Solr能做什么 它就是用于做全 ...

随机推荐

  1. 【转】XenServer架构之XAPI的调用流程

    XAPI 调用是使用XML-RPC协议通过网络发送到安装有XenServer 的主机上.XAPI对象的引用不保证对象的永久标识符,引用不允许对象进行相等比较.对同一物体的两个引用,不保证是文本相同的. ...

  2. WWW读取安卓外部音乐文件

    需求分析 使用Everyplay(2121-1540版本)录屏,在升级SDK之后,遇到个问题,调用安卓原生的mediaplay进行播放音乐,在录屏时无法录制到声音,所以想到的解决办法是在Unity中播 ...

  3. spring.net 框架分析(三)ContextRegistry.GetContext()

    我们通过ContextRegistry.GetContext()建立了一个IApplicationContext得实例,那么这个实例具体是怎么建立的了. 我们来分析一下容器实例建立的过程: 我们在配置 ...

  4. JavaScript自动生成博文目录导航

    转载于:JavaScript自动生成博文目录导航 我们在写博客的时候,如果博文里面有目录,会给人结构清晰.一种一目了然的感觉,看目录就知道这篇博文要讲解的内容,并且点击目录标题就可以跳转到 具体的内容 ...

  5. 1205索引使用explain

    -- 转自博客http://blog.sina.com.cn/s/blog_75a2f94f0101ddhb.html01type类型type按照从最佳类型到最坏类型进行排序,该字段和ref字段相结合 ...

  6. java-读取javabean中所有属性和属性的类型

    /** * java读取文件中的属性类型 * @param model * @return * @throws Exception */ public static Map<String,Str ...

  7. HTML 字符实体 &lt; &gt: &amp;等

    在 HTML 中,某些字符是预留的. 在 HTML 中不能使用小于号(<)和大于号(>),这是因为浏览器会误认为它们是标签. 如果希望正确地显示预留字符,我们必须在 HTML 源代码中使用 ...

  8. oracle 修改字符集支持中文

    1.登录sys关闭服务 [oracle@t-e ~]$ export ORACLE_SID=kamiltest1 [oracle@t-e ~]$ sqlplus / as sysdba SQL> ...

  9. <Script>放置位置

    html文件是自上而下的执行方式 css引入执行加载时,程序仍然往下执行 script脚本是则中断线程,待该script脚本执行结束之后程序才继续往下执行 页面效果实现类的js放在body之前,动作, ...

  10. py-faster-rcnn之从solver文件创建solver对象,建立pythonlayer

    faster-rcnn在训练阶段,根据一个solver的prototxt文件创建相应的网络.仅凭一个prototxt就创建网络?其实还涉及到自定义的PythonLayer. 比如lib/rpn/anc ...