tomcat

以tomcat 7为例，位置/work/apache-tomcat-7.0.55

Solr 3.6.2

基本配置

Solr 3.6.2。须要JDK 6/JDK7支持。

下载Solr 3.6.2。解压后，位置：/work/apache-solr-3.6.2。

在tomcat的conf/Catalina/localhost文件夹下，新建solr.xml文件，内容例如以下：

<Context docBase="/work/apache-solr-3.6.2/example/webapps/solr.war" privileged="true" allowLinking="true" crossContext="true">

   <Environment name="solr/home" type="java.lang.String" value="/work/apache-solr-3.6.2/example/multicore" override="true" />

</Context>

拷贝example/solr/conf文件夹下的内容，到example/multicore/core0/conf文件夹下，

启动tomcat。訪问：http://localhost:8080/solr/，出现solr界面，则solr的core0基本配置已经完毕。

tomcat优化配置：

<Connector port="9090" protocol="org.apache.coyote.http11.Http11NioProtocol"

  executor="tomcatThreadPool"

  connectionTimeout="20000"

  maxThreads="5000" minSpareThreads="50"

  acceptCount="5000" enableLookups="false"

  compressableMimeType="text/html,text/xml,text/javascript,text/css,text/plan"

  compression="on" compressionMinSize="2048" disableUploadTimeout="true"

  redirectPort="8443" URIEncoding="UTF-8"

/>

索引文件位置：core0/data。能够使用du -sh 查看索引大小。

分词器

Lucene3.2-3.6，须要IK Analyzer 2012 U6。

下载IK分词器。在multicore下新建lib文件夹，把IK jar放置到lib文件夹下。比如：IKAnalyzer2012_u6.jar。然后改动multicore下得solr.xml文件，在solr节点中添加属性： sharedLib="lib" 就可以。

假设须要配置扩展词库和停止词库，则须要到tomcat的webapps/solr/WEB_INF文件夹下新建classes文件夹，把IKAnalyzer.cfg.xml和对应的字典文件放置在这个文件夹中，IKAnalyzer.cfg.xml的内容例如以下：

<?xml version="1.0" encoding="UTF-8"?>

<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">

<properties>

	<comment>IK Analyzer Configure</comment>

	<!--用户能够在这里配置自己的扩展字典 -->

	<entry key="ext_dict">dic1.dic;dic2.dic;</entry> 

	<!--用户能够在这里配置自己的扩展停止词字典-->

	<entry key="ext_stopwords">stopword.dic;</entry>

</properties>

字典文件的配置方式为：无BOM的UTF-8编码方式。

注意：有人把IKAnalyzer.cfg.xml和相关配置文件，放到multicore/lib文件夹下。这是不生效的。

然后，在schema.xml中。配置类型：text_general 使用 IK中文分词，配置节点例如以下：

<fieldType name="text_general" class="solr.TextField">

  <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>

  <analyzer type="index">

  <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" useSmart="false"/>

  <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true"/>

  <filter class="solr.SynonymFilterFactory" synonyms="index_synonyms.txt" ignoreCase="true" expand="false"/>

  <filter class="solr.LowerCaseFilterFactory"/>

  </analyzer>

  <analyzer type="query">

  <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" useSmart="true"/>

  <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true"/>

  <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>

  <filter class="solr.LowerCaseFilterFactory"/>

  </analyzer>

</fieldType>

则全部使用text_general类型的field都会使用IK分词。

关于这样的字段类型的原始配置例如以下：

<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">

  <analyzer type="index">

	<tokenizer class="solr.StandardTokenizerFactory"/>

	<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />

	<!-- in this example, we will only use synonyms at query time

	<filter class="solr.SynonymFilterFactory" synonyms="index_synonyms.txt" ignoreCase="true" expand="false"/>

	-->

	<filter class="solr.LowerCaseFilterFactory"/>

  </analyzer>

  <analyzer type="query">

	<tokenizer class="solr.StandardTokenizerFactory"/>

	<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />

	<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>

	<filter class="solr.LowerCaseFilterFactory"/>

  </analyzer>

</fieldType>

停止词库

指的是指文本中出现频率非常高，但实际意义又不大的词，主要指副词、虚词、语气词等。如“是”、“而是”等。它主要用在信息检索中。

在为文本或网页建立索引的时候。会去掉这些词。

扩展词库

与自己的业务相关的词库。会作为独立词进行处理。比如：http://blog.csdn.net/shihuacai/article/details/8494360

主从

solrconfig.xml，master机器配置：

<requestHandler name="/replication" class="solr.ReplicationHandler">

<lst name="master">

<str name="replicateAfter">startup</str>

<str name="replicateAfter">optimize</str>

<str name="confFiles">schema.xml</str>

<str name="commitReserveDuration">00:00:30</str>

<str name="numberToKeep">1</str>

</lst>

</requestHandler>

solrconfig.xml，slave机器配置：

<requestHandler name="/replication" class="solr.ReplicationHandler">

<lst name="slave">

<str name="masterUrl">http://ip:8080/solr/core0/replication</str>

<str name="pollInterval">00:00:10</str>

<str name="compression">external</str>

<str name="httpConnTimeout">5000</str>

<str name="httpReadTimeout">10000</str>

</lst>

</requestHandler>

关于compression，有人这样说：external 非常easy有索引大小不正确, 压缩文件损坏这2个问题, 导致复制无法进行, 且一直复制失败, 測试下来internal没不论什么问题；只是我每遇到过。

很多其它内容參考网址：http://wiki.apache.org/solr/SolrReplication 。

Solr 4.9.0

基本配置

Solr 4.9。须要JDK7支持。

下载Sorl 4.9，解压后。位置：/work/solr-4.9.0。

solr\dist\solr-4.9.0.war至tomcat\webapps，并更名为solr.war

重新启动tomcat。solr.war自己主动部署，改动webapps\solr\WEB-INF\web.xml中的solrHome，例如以下:

    <env-entry>

       <env-entry-name>solr/home</env-entry-name>

       <env-entry-value>/work/solr-4.9.0/example/multicore</env-entry-value>

       <env-entry-type>java.lang.String</env-entry-type>

    </env-entry>

复制solr-4.9.0\example\lib\ext\*.jar至tomcat\lib

复制solr-4.9.0\example\resources\log4j.properties至tomcat\lib

重新启动tomcat，訪问：http://localhost:8080/solr/，出现solr界面，则solr的基本配置已经完毕。

其它部分和3.6.2类似。

分词器

下载IK Analyzer分词器。lucene4.X和solr4.X的IK Analyzer 要用以下这个版本号IK Analyzer 2012FF_hfl。

jar包放在tomcat/webapps/solr/WEB-INF/lib文件夹下，xml和dic放在tomcat/webapps/solr/WEB-INF/classes文件夹下。

其它。也就是IKAnalyzer.cfg.xml、shema.xml的内容配置，和3.6.2类似，不赘述。

另外。注意，在solr4.9中使用的IK分词器jar包，在schema.xml中应该这样配置：

<fieldType name="text_general" class="solr.TextField">

	<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>

	<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>

</fieldType>

英文在IK Analyzer 2012FF_hfl中以及没有org.wltea.analyzer.solr包了。

这个我还不确认是在IK Analyzer 2012FF_hfl中就没有了，还是我下载的jar包不全...

主从

和3.6.2类似，不赘述。

Solr3.6.2和Solr4.9.0经常使用配置的更多相关文章

Solr4.8.0源码分析(25)之SolrCloud的Split流程
Solr4.8.0源码分析(25)之SolrCloud的Split流程(一) 题记:昨天有位网友问我SolrCloud的split的机制是如何的,这个还真不知道,所以今天抽空去看了Split的原理,大 ...
Solr4.8.0源码分析(24)之SolrCloud的Recovery策略(五)
Solr4.8.0源码分析(24)之SolrCloud的Recovery策略(五) 题记:关于SolrCloud的Recovery策略已经写了四篇了,这篇应该是系统介绍Recovery策略的最后一篇了 ...
Solr4.8.0源码分析(23)之SolrCloud的Recovery策略(四)
Solr4.8.0源码分析(23)之SolrCloud的Recovery策略(四) 题记:本来计划的SolrCloud的Recovery策略的文章是3篇的,但是没想到Recovery的内容蛮多的,前面 ...
Solr4.8.0源码分析(22)之SolrCloud的Recovery策略(三)
Solr4.8.0源码分析(22)之SolrCloud的Recovery策略(三) 本文是SolrCloud的Recovery策略系列的第三篇文章,前面两篇主要介绍了Recovery的总体流程,以及P ...
Solr4.8.0源码分析(21)之SolrCloud的Recovery策略(二)
Solr4.8.0源码分析(21)之SolrCloud的Recovery策略(二) 题记: 前文<Solr4.8.0源码分析(20)之SolrCloud的Recovery策略(一)>中提 ...
Solr4.8.0源码分析(20)之SolrCloud的Recovery策略(一)
Solr4.8.0源码分析(20)之SolrCloud的Recovery策略(一) 题记: 我们在使用SolrCloud中会经常发现会有备份的shard出现状态Recoverying,这就表明Solr ...
Solr4.8.0源码分析(14)之SolrCloud索引深入(1)
Solr4.8.0源码分析(14) 之 SolrCloud索引深入(1) 上一章节<Solr In Action 笔记(4) 之 SolrCloud分布式索引基础>简要学习了SolrClo ...
Solr4.8.0源码分析(15) 之 SolrCloud索引深入(2)
Solr4.8.0源码分析(15) 之 SolrCloud索引深入(2) 上一节主要介绍了SolrCloud分布式索引的整体流程图以及索引链的实现,那么本节开始将分别介绍三个索引过程即LogUpdat ...
Solr4.8.0源码分析(19)之缓存机制(二)
Solr4.8.0源码分析(19)之缓存机制(二) 前文<Solr4.8.0源码分析(18)之缓存机制(一)>介绍了Solr缓存的生命周期,重点介绍了Solr缓存的warn过程.本节将更深 ...

随机推荐

Codeforces Round #345 (Div. 1) A - Watchmen 容斥
C. Watchmen 题目连接: http://www.codeforces.com/contest/651/problem/C Description Watchmen are in a dang ...
error C2556: 'const char &MyString::operator [](int)' : overloaded function differs only by return type from 'char &MyString::operator [](int)'
char & operator[](int i);const char & operator[](int i);/*const char & operator(int i);* ...
（转）DLL中导出函数的两种方式(dllexport与.def文件)
DLL中导出函数的两种方式(dllexport与.def文件)http://www.cnblogs.com/enterBeijingThreetimes/archive/2010/08/04/1792 ...
控制台+Owin搭建WebAPI接口服务
当没有iis环境.想快速启动几个api接口测试又觉得新建一个api项目麻烦?来使用控制台做宿主,快速改几个api测试吧! 1.新建控制台项目 2.安装以下相关依赖 Microsoft.AspNet.W ...
基于t-io的MI工具实现
原文:https://my.oschina.net/u/2984386/blog/1630300 背景介绍 t-io是一款国产开源的网络编程框架,主要是特点:简单,易上手,AIP封装通俗易懂,适合一般 ...
SqlServer查看对象(表、存储过程、函数)在哪些地方被引用或引用哪些地方
对象(如表)-->右键-->查看依赖关系依赖于[]的对象:列出哪些存储过程.函数引用了该表 []依赖的对象:列出该存储过程.函数依赖了哪些表.函数.存储过程
Netty游戏服务器之四protobuf编解码和黏包处理
我们还没讲客户端怎么向服务器发送消息,服务器怎么接受消息. 在讲这个之前我们先要了解一点就是tcp底层存在粘包和拆包的机制,所以我们在进行消息传递的时候要考虑这个问题. 看了netty权威这里处理的办 ...
zxing生成二维码和读取二维码
当然,首先要导入zxing的jar包. 生成二维码代码: package com.imooc.zxing; import java.io.File; import java.nio.file.Path ...
C/C++ 宏定义中#、##、#@的区别
#表示:对应变量字符串化 ##表示:把宏参数名与宏定义代码序列中的标识符连接在一起,形成一个新的标识符连接符#@:它将单字符标记符变换为单字符,即加单引号.例如: #define B(x) #@x ...
jquery元素节点操作
jquery元素节点操作创建节点 var $div = $('<div>'); var $div2 = $('<div>这是一个div元素</div>'); 插入 ...

Solr3.6.2和Solr4.9.0经常使用配置

tomcat

Solr 3.6.2

基本配置

分词器

停止词库

扩展词库

主从

Solr 4.9.0

基本配置

分词器

主从

Solr3.6.2和Solr4.9.0经常使用配置的更多相关文章

随机推荐

热门专题