solr4.5安装配置 linux+tomcat6.0+mmseg4j-1.9.1分词
首先先介绍下solr的安装配置
solr下载地址 (我这用的solr-4.5.0)
运行环境
- JDK 1.5或更高版本 下载地址(Solr 4以上版本,要求JDK 1.6) 我用的JDK1.6 )
- 一个java servlet容器,如Tomcat 下载地址 (我用的Tomcat 6,注:JDK1.7 跟Tomcat 7貌似有兼容性问题,记于 2013.12.12)
- 分词mmseg4j 下载地址 (我用的1.9)
为防止大家各种目录搞混,安装前先告诉大家我自己所创建使用的目录
整个运行环境我创建了四个目录,分别用于
1、solr源码保存,位于/down/solr
2、solr web运行环境,位于/usr/local/tomcat/webapps
3、solr 实例运行环境,位于/usr/local/solr
4、jdk,位于/usr/java/jdk1.6.0_13
接下来的各种配置,将以此目录进行说明。
安装步骤(这里以jdk1.6 tomcat6.0 为例,他们的安装方式不属于此文的讲解范围)
- 停止的servlet容器
从下载的solr包中复制solr.war到你的servlet容器的webapps目录
cp /down/solr/example/webapps/solr.war /usr/local/tomcat/webapps/solr
从下载的solr包中复制示例Solr的文件夹到您的solr实例环境。
cp /down/solr/example/solr /usr/local/solr
- 打开 etv/profile 文件,添加如下配置,请修改为你的jdk安装目录:

export JAVA_HOME=/usr/java/jdk1..0_13 export JAVA_BIN=/usr/java/jdk1..0_13/bin export PATH=$PATH:$JAVA_HOME/bin export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar export JAVA_HOME JAVA_BIN PATH CLASSPATH

设置你的solr_home目录,也就是前面所述“solr 实例运行环境"所在目录 /usr/local/solr,打开以下文件,修改solr_home目录
vi /usr/local/tomcat/webapps/solr/WEB-INF/web.xml
找到如下配置,取消注释,修改value为 /usr/local/solr
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/usr/local/solr/</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>- 另外还有一处要修改,但本人第一次配置solr的时候没改此处一样能运行,后面不知道那个环节路径错了,导致无法运行,也没去深究,修改以下配置就能运行
打开下面文件vi /usr/local/solr/collection1/conf/solrconfig.xml
修改此处路径为绝对路径
<lib dir="/down/solr/contrib/extraction/lib" regex=".*\.jar" />
<lib dir="/down/solr/dist/" regex="solr-cell-\d.*\.jar" /> <lib dir="/down/solr/contrib/clustering/lib/" regex=".*\.jar" />
<lib dir="/down/solr/dist/" regex="solr-clustering-\d.*\.jar" /> <lib dir="/down/solr/contrib/langid/lib/" regex=".*\.jar" />
<lib dir="/down/solr/dist/" regex="solr-langid-\d.*\.jar" /> <lib dir="/down/solr/contrib/velocity/lib" regex=".*\.jar" />
<lib dir="/down/solr/dist/" regex="solr-velocity-\d.*\.jar" /> 启动Servlet容器。
打开http://localhost:8080/solr/admin solr管理后台,验证是否安装成功。
- servlet容器可能已经开始的端口不是8080其他在...检查servlet容器的文档,如果你不知道这是什么。
- 如果已经在该端口上运行一个servlet容器,你可能无法启动。关闭另外一个或更改你是在运行的端口。
有关使用一个以上的索引,或者Solr中的多于一个实例的工作信息,请参阅MultipleIndexes。
有关于tomcat的英文配置讲解原版:http://wiki.apache.org/solr/SolrTomcat
以上步骤,配置完毕,并验证成功后,继续来配置mmseg4j分词 下载地址
首先,在你创建的solr实例目录下,新建lib,dic两个文件夹,一个用于存放jar文件(lib),一个用于存放词库(dic)
cd /usr/local/solr mkdir lib mkdir dic
解压你下载的mmseg4j ,将mmseg4j /dist目录下的jar文件拷贝至刚新建的lib文件夹,将mmseg4j /data目录下的文件拷贝纸刚新建的dic文件夹
打开 /usr/local/solr/collection1/conf/solrconfig.xml文件,添加配置
<lib dir="/usr/local/solr/lib" />
打开 /usr/local/solr/collection1/conf/schema.xml文件,分别在相应位置添加如下配置。
<field name="simple" type="textSimple" indexed="true" stored="true"/>
<field name="complex" type="textComplex" indexed="true" stored="true"/>
<field name="MaxWord" type="textMaxWord" indexed="true" stored="true"/> <copyField source="simple" dest="text" />
<copyField source="complex" dest="text"/>
<copyField source="MaxWord" dest="text"/> <fieldType name="textComplex" class="solr.TextField">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="/usr/local/solr/dic"/>
</analyzer>
</fieldType>
<fieldType name="textMaxWord" class="solr.TextField">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="usr/local/solr/dic"/>
</analyzer>
</fieldType>
<fieldType name="textSimple" class="solr.TextField">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="usr/local/solr/dic"/>
</analyzer>
</fieldType>
OK,到此为止词库已经配置成功,重启tomcat打开 http://localhost:8080/solr/admin 试试分词效果吧,各种配置的详解将在后面的文章进行说明。
solr4.5安装配置 linux+tomcat6.0+mmseg4j-1.9.1分词的更多相关文章
- Linux下安装配置MongoDB 3.0.x 版本数据库
说明: 操作系统:CentOS 5.X 64位 IP地址:192.168.21.128 实现目的: 安装配置MongoDB数据库 具体操作: 一.关闭SElinux.配置防火墙 1.vi /etc/s ...
- Ubuntu14.04 安装配置Hadoop2.6.0
目前关于Hadoop的安装配置教程书上.官方教程.博客都有很多,但由于对Linux环境的不熟悉以及各种教程或多或少有这样那样的坑,很容易导致折腾许久都安装不成功(本人就是受害人之一).经过几天不断尝试 ...
- [转] Ubuntu 12.04下LAMP安装配置 (Linux+Apache+Mysql+PHP)
我是一个Linux新手,想要安装一台Ubuntu 12.04版的Linux服务器,用这台服务器上的LAMP套件来运行我自己的个人网站.LAMP套件就是 “Linux+Apache+Mysql+PHP这 ...
- Centos 7环境下安装配置Hadoop 3.0 Beta1简记
前言 由于以前已经写过一篇Centos 7环境下安装配置2.8的随笔,因此这篇写得精简些,只挑选一些重要环节记录一下. 安装环境为:两台主机均为Centos 7.*操作系统,两台机器配置分别为: 主机 ...
- VMware虚拟机下安装RedHat Linux 9.0
从这一篇文章开始我和大家一起学习Linux系统.不管是什么样的系统,必须安装上才能谈使用对吧. Linux版本 安装Linux之前需要了解一下Linux系统的安装版本. Linux的版本分为内核版本和 ...
- ubuntu18.04安装配置opencv3.4.0
1.安装配置相关工具及依赖库 sudo apt-get install build-essential # 必须的,gcc编译环境 sudo apt-get install cmake git lib ...
- Win10 安装配置 MongoDB 4.0 踩坑记
redis 官方没有 Windows 版的,微软维护的已经好久没更新了,所以就在想着换成 MongoDB. 于是一趟被我复杂化的踩坑之旅就开始了,同时也记录一下,避免有人遇见跟我一样的问题. 首先在 ...
- Linux项目部署 jdk tomcat 安装配置 linux下 failed connect to localhost:8080;Connection refused
ONBOOT=yes 5.安装wget (1)安装 yum -y install wget (2) 查看版本 wget --version或 wget -V 一.安装jdk 配置 (1)安 ...
- XAMPP 的安装配置(Linux 版)
--姜庭华 msn: jaimejth@live.cn --博客:http://blog.csdn.net/jaimejth 软件下载在以下网站 http://www.apachefriends.o ...
随机推荐
- 3D游戏编程大师技巧──环境搭建
刚开微博,想借助这个平台与大家交流,写下自己的学习记录,希望得到大家的批评指正. 好了,进入主题.这段时间对游戏编程很感兴趣,于是在网友的推荐下开始学习<3D游戏编程大师技巧>这本书.今天 ...
- HTTP的客户端识别与cookie机制
本文是<HTTP权威指南>的读书笔记 Web服务器可能同时在与数千个客户端同时进行会话,服务器需要记录下它们在与谁交谈,而不是认为所有的请求都来自于匿名客户端.在HTTP中可以有以下几种方 ...
- This is US 我们的生活
温情暖心剧 看点在于真实,能让人找到不少共鸣像极了平淡而操蛋的生活,不断交织着苦涩和甘甜,柴米油盐.酸甜苦辣.嬉笑打闹.悲欢离合.温情又不尽如人意 this is us,our life 生活有如柠檬 ...
- Life Is A Funny Proposition After All
你们有没有坐下思考,感到疑惑 ,静静思考,我们为什么在这里 ,生活为什么如此这般 这个问题让无数聪明人喝酒买醉,这是最最奇怪的事情,他们都想弄清楚,科学家们可以展示上千种不同的理论,但从未证明这是为什 ...
- Javascript模块化编程(一):模块的写法
Javascript模块化编程(一):模块的写法 作者: 阮一峰 原文链接:http://www.ruanyifeng.com/blog/2012/10/javascript_module.html ...
- powershell例子
例子如下: $ErrorActionPreference="Stop" function getlist{ ls D:\tmp2|select name,extension,ful ...
- 《转载》使用org.w3c.dom.Element的setTextContent()、getTextContent()方法时出现编译错误
今天在更新项目后进行编译时,出现如下错误一堆: 编译错误 Google之,在stackoverflow上看到如下的解决方法: I came here with the same problem. Ev ...
- 序列化多个form表单内容同时提交
一.首先将表单主体序列化为json对象. 方法: //将表单序列化为json,这里加了个jQuery的扩展方法 $.fn.serializeJson = function () { var resul ...
- SSH使用详解
一.SSH基础 (1)什么是SSH? 传统的网络服务程序,如:ftp.pop和telnet在本质上都是不安全的,因为它们在网络上用明文传送口令和数据,别有用心的人非常容易就可以截获这些口令和数据.而且 ...
- debian命令行删除postgresql数据库
创建数据库 $ createdb odoo-test 删除数据库 $ dropdb odoo-test