solr-6.4.2安装+分词器配置
一、solr安装
solr下载地址:http://archive.apache.org/dist/lucene/solr/6.4.2/
1、解压solr软件包:
tar xf solr-6.4.2.tgz
2、copy需要的文件以及jar包
将solr项目copy到tomcat的webapps目录下并命名为solr
cp -r solr-6.4.2/server/solr-webapp/webapp /data/tomcat/webapps/solr
将solr-6.4.2/server/lib/ext/目录下的jar文件复制到solr/WEB-INF/lib/目录下
cp solr-6.4.2/server/lib/ext/* /data/tomcat/webapps/solr/WEB-INF/lib/
将solr-6.4.2/dist/目录下的solr-dataimporthandler-6.4.2.jar和solr-dataimporthandler-extras-6.4.2.jar文件复制到solr/WEB-INF/lib/目录下
cd solr-6.4.2/dist/
cp solr-dataimporthandler-6.4.2.jar solr-dataimporthandler-extras-6.4.2.jar /data/tomcat/webapps/solr/WEB-INF/lib/
3、创建solr的家目录并去web.xml中配置
将solr-6.4.2/server/solr目录复制到data目录下并更名为solr-home
cp -r solr-6.4.2/server/solr /data/solr-home
vim /data/tomcat/webapps/solr/WEB-INF/web.xml修改solr-home的目录位置
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/data/tomcat/solr-home</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
4、在tomcat下的solr项目的WEB-INF下创建classes目录,然后把solr-6.4.2/server/resources下的log4j.properties粘贴过去
mkdir /data/tomcat/pre_publish_solr/webapps/solr/WEB-INF/classes
cp solr-6.4.2/server/resources/log4j.properties /data/tomcat/webapps/solr/WEB-INF/classes/
把solr-6.4.2/server/lib下的metrics-core-3.1.2.jar、metrics-ganglia-3.1.2.jar、metrics-graphite-3.1.2.jar、metrics-jetty9-3.1.2.jar、metrics-jvm-3.1.2.jar这几个jar包放到tomcat下的solr项目的WEB-INF/lib目录下。否则会抛出异常
cd solr-6.4.2/server/lib
cp metrics-core-3.1.2.jar metrics-ganglia-3.1.2.jar metrics-graphite-3.1.2.jar metrics-jetty9-3.1.2.jar metrics-jvm-3.1.2.jar /data/tomcat/webapps/solr/WEB-INF/lib/
5、配置solr的访问权限
solr默认限制了对solr资源的访问,在tomcat中solr下修改web.xml:
本人的修改方法是注释掉了禁止追踪,保留了Enable everything but TRACE,访问时正常的
<!--security-constraint>
<web-resource-collection>
<web-resource-name>Disable TRACE</web-resource-name>
<url-pattern>/</url-pattern>
<http-method>TRACE</http-method>
</web-resource-collection>
<auth-constraint/>
</security-constraint-->
二、分词器配置
solr-6.4.2配置中文分词器IK Analyzer
1、将ik-analyzer-solr6.x.jar复制到tomcat\webapps\solr\WEB-INF\lib目录下
2、将stopword.dic、IKAnalyzer.cfg.xml复制到tomcat\webapps\solr\WEB-INF\classes
3、修改schema文件,打开solr_home\new_core\conf\managed-schema文件,添加IK分词器配置
<fieldType name="text_ik" class="solr.TextField">
<!--索引时候的分词器-->
<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<!--查询时候的分词器-->
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
solr-6.4.2安装+分词器配置的更多相关文章
- 真分布式SolrCloud+Zookeeper+tomcat搭建、索引Mysql数据库、IK中文分词器配置以及web项目中solr的应用(1)
版权声明:本文为博主原创文章,转载请注明本文地址.http://www.cnblogs.com/o0Iris0o/p/5813856.html 内容介绍: 真分布式SolrCloud+Zookeepe ...
- Solr入门之(8)中文分词器配置
Solr中虽然提供了一个中文分词器,但是效果很差,可以使用IKAnalyzer或Mmseg4j 或其他中文分词器. 一.IKAnalyzer分词器配置: 1.下载IKAnalyzer(IKAnalyz ...
- solr英文使用的基本分词器和过滤器配置
solr英文应用的基本分词器和过滤器配置 英文应用分词器和过滤器一般配置顺序 索引(index): 1:空格 WhitespaceTokenizer 2:过滤词(停用词,如:on.of.a.an ...
- Solr IK分词器配置
下载地址:https://search.maven.org/search?q=com.github.magese 分词器配置: 参考:https://www.cnblogs.com/mengjinlu ...
- 2.IKAnalyzer 中文分词器配置和使用
一.配置 IKAnalyzer 中文分词器配置,简单,超简单. IKAnalyzer 中文分词器下载,注意版本问题,貌似出现向下不兼容的问题,solr的客户端界面Logging会提示错误. 给出我配置 ...
- Solr6.5.0配置中文分词器配置
准备工作: solr6.5.0安装成功 1.去官网https://github.com/wks/ik-analyzer下载IK分词器 2.Solr集成IK a)将ik-analyzer-solr6.x ...
- solr常用操作及集成分词器或cdh集群部署说明
首先,如果是从http://lucene.apache.org/solr/下载的solr,基本都是自带集成的jetty服务,不需要单独搭建tomcat环境,但是要注意jdk版本,直接解压通过cmd命令 ...
- 聊聊 elasticsearch 之分词器配置 (IK+pinyin)
系统:windows 10 elasticsearch版本:5.6.9 es分词的选择 使用es是考虑服务的性能调优,通过读写分离的方式降低频繁访问数据库的压力,至于分词的选择考虑主要是根据目前比较流 ...
- Elasticsearch初步使用(安装、Head配置、分词器配置)
目录 返回目录:http://www.cnblogs.com/hanyinglong/p/5464604.html 1.ElasticSearch简单说明 a.ElasticSearch是一个基于Lu ...
随机推荐
- VA使用技巧
Reserved String Meaning Date $DATE$ Year/month/day formatted as %04d/%02d/%02d $DAY$ Day of month ...
- Atitit.linq java的原理与实现 解释器模式
Atitit.linq java的原理与实现 解释器模式 1. Linq from where 的实现1 2. Where expr 的实现1 3. Attilax的一点变化2 4. 解释器模式的 ...
- Scrapy系列教程(3)------Spider(爬虫核心,定义链接关系和网页信息抽取)
Spiders Spider类定义了怎样爬取某个(或某些)站点.包含了爬取的动作(比如:是否跟进链接)以及怎样从网页的内容中提取结构化数据(爬取item). 换句话说.Spider就是您定义爬取的动作 ...
- php类库PHP QR Code 二维码
php类库PHP QR Code 二维码 php类库PHP QR Code 二维码 php类库PHP QR CodePHP QR Code is open source (LGPL) library ...
- h264 ES流文件通过计算first_mb_in_slice区分帧边界
本人因为近期在读取h264文件的时候,遇到怎样读取完整一帧数据的问题.通过使用elecard stream analyzer工具,以及结合<新一代视频压缩编码标准--H264/AVC>(第 ...
- Fantasy of a Summation n个数,k层重复遍历相加。求它的和%mod的值;推导公式+快速幂
/** 题目:Fantasy of a Summation 链接:https://vjudge.net/contest/154246#problem/L 题意:n个数,k层重复遍历相加.求它的和%mo ...
- DWR相关知识
解决问题:服务器给前台推送消息 用途:聊天,微信签到墙,设备报警
- 依赖Spring的情况下,Java Web项目如何在启动时加载数据库中的数据?
原文:https://blog.csdn.net/u012345283/article/details/39558537 原文:https://blog.csdn.net/wandrong/artic ...
- POJ 1815 Friendship(最小割)
http://poj.org/problem? id=1815 Friendship Time Limit: 2000MS Memory Limit: 20000K Total Submissio ...
- 框架应用:Mybatis - 开发详述
ORM框架 在实际开发中,工程中本质的任务是从数据库中获取数据,然后对数据进行操作,又或者写入数据.开发时语言是大多是面向对象的工程语言,这个时候就必须进行工程语言和数据库连接语言的转换,也就是所谓的 ...