Solr与mmseg4J的整合】的更多相关文章

mmseg4j是一个很好的中文分词器,solr与mmseg4j的整合也非常简单.如下: 第一步:下载mmseg4j的jar包,网上搜索一下有很多下载地址,如下是csdn上的一个连接:http://download.csdn.net/detail/nrs12345/6986585 第二步:将下载的mmseg4j-analysis-1.9.1.jar.mmseg4j-core-1.9.1.jar.mmseg4j-solr-2.2.0.jar这三个jar包复制到tomcat下的webapps/solr…
Solr与mmseg4j部署   一. solr安装 1. 下载solr http://www.apache.org/dyn/closer.cgi/lucene/solr/ 2. apache-solr-1.4.1.zip解压,复制dist/apache-solr-1.4.1.war到TOMCAT_HOME/webapps下,改名为solr.war,启动tomcat; 3. 在控制台看到启动完毕关闭tomcat,有报错不用管; 4. 进入TOMCAT根目录,创建文件夹solr_home, 将ap…
1.solr自带的分词器远远满足不了中文分词的需求,经查使用最多的分词器是solr是mmseg4j分词器,具体整合大家可以参考 https://github.com/zhuomingliang/mmseg4j 一定要注意版本 2.将这两个包直接拷贝到tomcat下的solr/lib中 3.在solr/java里新建dic目录将词库拷贝进去 4.直接在浏览器http://127.0.0.1:8080/solr即可如下分词结果 ok,分词整合完毕!…
第一次尝试着去写一个系列的教程,希望自己能坚持下去,也希望自己能够通过博客的编写来加深自己对solr搜索的理解. Solr与Tomcat的整合网上有很多教程,我就以我的整合为例来讲述一下我的整合过程,我在整合的过程中用的是solr4.10 第一步:下载solr的源码包,下载地址:<a>http://mirrors.hust.edu.cn/apache/lucene/solr/</a>,在这可以选择你想要的版本 第二步:下载solr-4.10.4.zip,解压缩该文件. 第三步:so…
solr集成mmseg4j分词 mmseg4j https://code.google.com/p/mmseg4j/ https://github.com/chenlb/mmseg4j-solr 作者blog http://blog.chenlb.com/category/mmseg4j mmseg4j 用 Chih-Hao Tsai 的 MMSeg 算法(http://technology.chtsai.org/mmseg/ )实现的中文分词器,并实现 lucene 的 analyzer 和…
1.下载 solr版本必须和lucene版本一致,这个链接http://archive.apache.org/dist/lucene/是apache子项目库,在这里可以下载lucene,我这里使用的是5.0版本 注意6.0之后,官方推荐使用jdk8,tomcat8了. 2.启动 solr默认使用内置的jetty来启动,如下找到解压目录,直接用cmd命令进入, solr默认启动的端口是8393,直接在浏览器输入http://127.0.0.1:8983/solr/即可访问,如下 所以这里只是启动,…
solr与tomcat整合有两种方法: 方法一:其整合步骤如下: 1.将solr中的example中的solr拷贝到要作为服务器的位置(我当前创建的目录为D:\Develop\solr\home) 2.将相应的solr的web程序也拷贝出来放在相应的目录(我当前创建的目录为D:\Develop\solr\server) 3.修改solr-->home文件夹中的solrconfig.xml设置data的路径 4.设置相应的tomcat的context,并为context设置相应的环境变量,说明so…
前言 虽然windows下, tomcat和solr整合起来灰常的方便, 但是, 一般像这种东西, 都很少部署在windows中, 更多的是部署到linux中去. 其实, 步骤是一样的, 这里, 我在centos 中再部署一次. 下包 下载地址还是之前的那个: http://mirror.bit.edu.cn/apache/lucene/solr/ 下载下来之后, 放到centos中的 /home/elvin/Downloads 文件下. elvin 是我的用户名. 为了与第一篇对应, 我按照第…
最近在研究solr,这里只记录一下eclipse中构建solr项目,添加core,整合mysql,添加中文分词器的过程. 版本信息:solr版本6.2.0+tomcat8+jdk1.8 推荐阅读:solr中文官方文档 参考:solr6.2从环境部署到与mysql整合到中文分词器到solrJ的使用 在eclipse中构建solr项目: 1.下载solr-6.2.0.zip,官网下载地址:http://lucene.apache.org/solr/downloads.html. 2.在eclipse…
默认Solr提供的分词组件对中文的支持是不友好的,比如:“VIM比作是编辑器之神”这个句子在索引的的时候,选择FieldType为”text_general”作为分词依据时,分词效果是: 它把每一个词都分开了,可以想象如果一篇文章这样分词的搜索的体验效果非常差.能够和Solr集成的中文分词组件有很多,比如:mmseg4j.IkAnalyzer.ICTCLAS等等.各有各的特点.这篇文章讲述如何整合Solr与mmseg4j.mmeseg4j最新版本是1.9.1,下载解压,提取其中的三个文件:mms…