本章重点介绍CentOS7 下部署Solr7 ,添加核心Core配置,Dataimport导入,中文分词的相关操作。
一、准备工作
    演示环境是在虚拟机下安装的CentOS7、java JDK8、apache-tomcat-8.5.29。
    在CentOS7 下安装jdk8以及tomcat8.5 的安装方法可以搜索相关教程,这里不再赘述。
    注意:solr6.0以上,官方建议使用jdk8,tomcat8。
二、下载 solr-7.3.0
    官网 http://www.apache.org/dyn/closer.lua/lucene/solr/7.3.0 找合适的镜像下载solr ,并上传到虚拟机。
    也可以使用wget 直接下载 
#cd /usr/local
# wget http://mirrors.shu.edu.cn/apache/lucene/solr/7.3.0/solr-7.3.0.zip

  看到如上图所示
  等待几分钟,下载完成后在当前目录(/usr/local)下解压
#unzip solr-7.3.0.zip
#cd solr-7.3.0
    注:若提示unzip command not found ,请先安装zip、unzip命令,再解压。
#yum install -y unzip zip  
三、与tomcat结合部署Solr7
  1.进入solr7解压后的目录后,复制并重命名solr-7.3.0目录里的server/solr-webapp/webapp文件夹到tomcat的webapps目录为solr7。
    演示环境的tomcat 安装目录为/usr/local/java/apache-tomcat-8.5.29
# cd solr-7.3.0
# cp -r server/solr-webapp/webapp /usr/local/java/apache-tomcat-8.5.29/webapps/solr7

      
 2.将需要的jar包,复制到部署的solr7 的WEB-INF/lib/ 下
    将server/lib/ext/下的所有jar复制到 /usr/local/java/apache-tomcat-8.5.29/webapps/solr7/WEB-INF/lib/下
# cd server/lib/ext/
# ll
# cp * /usr/local/java/apache-tomcat-8.5.29/webapps/solr7/WEB-INF/lib/

   将server/lib/metrics* 开头的5个jar复制到 /usr/local/java/apache-tomcat-8.5.29/webapps/solr7/WEB-INF/lib/下
# cd ..
# ll
# cp metrics-* /usr/local/java/apache-tomcat-8.5.29/webapps/solr7/WEB-INF/lib/

3.复制log4j配置文件
  把server/resources/目录下的log4j.properties,复制到刚才部署的solr7的WEB-INF/,要创建一个classes的目录
# mkdir /usr/local/java/apache-tomcat-8.5.29/webapps/solr7/WEB-INF/classes
# cp ../resources/log4j.properties /usr/local/java/apache-tomcat-8.5.29/webapps/solr7/WEB-INF/classes

   

4.创建solr home
  复制并重命名solr-7.3.0/servier/solr为/usr/local/solr7home
# cd  ../../
# cp -r server/solr /usr/local/solr7home
# ls /usr/local/solr7home

5.将tomcat/webapps下的solr7与新建的solr7home关联
  a.需要修改tomcat里solr7/WEB-INF/web.xml文件
# vim  /usr/local/java/apache-tomcat-8.5.29/webapps/solr7/WEB-INF/web.xml

  b.找到solr/home的env-entry(如下图所示),打开注释,修改env-entry-value值为新建的solr7home
     
 c.然后到最下方,将这一段注释掉,不然会报403错误,完成后保存退出
     
6.启动tomcat
# /usr/local/java/apache-tomcat-8.5.29/bin/start.sh
  在电脑上访问下服务器的solr服务,演示环境的ip为192.168.1.220
  访问http://192.168.1.220:8080/solr7/index.html,出现如下页面表示solr服务搭建好了。
     
四、添加solr核心Core配置
    在管理页面,点击Core Admin,选择AddCore,添加核心
         
     name:自定义的名字,建议和instanceDir保持一致
     instanceDir: solrhome目录下的实例类目
     dataDir:默认填data即可
     config:指定配置文件,new_core/conf/solrconfig.xml
     schema:指定schema.xml文件,new_core/conf/schema文件(实际上是managed-schema文件)
    注意:红色框内的内容,instanceDir and dataDir need to exist before you can create the core
    要求在创建solr核心时,instanceDir实例目录在sold home 中存在
    如果instanceDir实例目录不存在,点击添加会有如下提示,但会在solr/home中多一个instanceDir实例目录。
    
a.将solr7home/configsets/sample_techproducts_configs/目录下的conf 拷贝到 mycore 目录下,目录结构:mycore/conf/
b.将contrib目录,dist目录拷贝到solrhome目录中
# cd /usr/local/solr7home/
# mv new_core micro
# ll
# cp -r configsets/sample_techproducts_configs/conf mycore/
# ll
# cp -r /usr/local/solr-7.3.0/contrib ./
# cp -r /usr/loacl/solr-7.3.0/dist ./
# ll
c.修改mycore/config/solrconfig.xml
  将文件中<lib dir="${solr.install.dir:../../../..}.." 替换为 <lib dir=“/usr/local/solr7home/…."
# vim mycore/config/solrconfig.xml

  替换后结果如下:
       
  d.刷新页面,点击Core Admin 添加Core,instanceDir就是刚才配置的目录mycore,出现下图所示表示solr核心创建成功
      
五、Dataimport(导入数据)
     点击Dataimport 时,出现 The solrconfig.xml file for this index does not have an operational DataImportHandler defined!
     解决如下:
  a.复制sorl7home/dist/solr-dataimporthandler*.jar和mysql的jdbc驱动mysql-connector-java-5.1.42.jar 到tomcat的webapps/solr7/WEB-INF/lib/下
# ll dist/
# cp -r dist/solr-dataimporthandler-* /usr/local/java/apache-tomcat-8.5.29/webapps/solr7/WEB-INF/lib/
# vim mycore/config/solrconfig.xml

 b.在mycore/config/solrconfig.xml添加DataImportHandler
     
 c.在mycore/conf/ 目录下创建data-config.xml(数据库配置和对应的字段)
     
   目录结构如下:
     
 d.重启tomcat,再次访问,如果出现下图内容则说明配置成功
      
  e.添加数据库中对应的Field(注意solr已经存在的field 不需要添加 ,具体可在managed-schema中查看已有的field),
     然后数据才能完整的导入。否则导入数据进行query 查询的时候只有id ,_version_两个字段。
       
 f. 数据导入
   Command:full_import:全量导入;delta_import:增量导入。
   Clean:在索引开始构建之前是否删除之前的索引,默认为true
   Commit:在索引完成之后是否提交。默认为true
   Execute:执行导入
   Refresh Status:刷新后才能看到数据发生了变化(点一次刷新一次)
   选择 全量导入,Execute执行,Refresh Status刷新查看状态,其他都选默认即可。
六、中文分词
   1.将solr 自带的中文分词jar复制到,tomcat的webapps/solr7/WEB-INF/lib/ 下managed-schema
# cd  /usr/local/solr7home/
# cp contrib/analysis-extras/lucene-libs/lucene-analyzers-smartcn-7.3.0.jar /usr/local/java/apache-tomcat-8.5.29/webapps/solr7/WEB-INF/lib
# vim mycore/confg/managed-schema

  2.在mycore/confg/managed-schema 添加如下内容
    <!--text  Chinese -->
    <fieldType name="text_cn" class="solr.TextField" positionIncrementGap="100">
      <analyzer type="index">
        <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
      </analyzer>
      <analyzer type="query">
        <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
      </analyzer>
    </fieldType>
     
   3.重启tomcat
      

Centos7下单机部署Solr7.3的更多相关文章

  1. CentOS7下单机部署RabbltMQ环境的操作记录

    一.RabbitMQ简单介绍在日常工作环境中,你是否遇到过两个(多个)系统间需要通过定时任务来同步某些数据?你是否在为异构系统的不同进程间相互调用.通讯的问题而苦恼.挣扎?如果是,那么恭喜你,消息服务 ...

  2. centos7 下zookeeper 部署 单机多实例模式

    centos7 下zookeeper 部署 本文参考https://www.linuxidc.com/Linux/2016-09/135052.htm 1.创建/usr/local/zookeeper ...

  3. Hadoop生态圈-CentOs7.5单机部署ClickHouse

    Hadoop生态圈-CentOs7.5单机部署ClickHouse 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 到了新的公司,认识了新的同事,生产环境也得你去适应新的集群环境,我 ...

  4. centos7 下 安装部署nginx

    centos7 下 安装部署nginx 1.nginx安装依赖于三个包,注意安装顺序 a.SSL功能需要openssl库,直接通过yum安装: #yum install openssl b.gzip模 ...

  5. 记录centos7下tomcat部署war包过程

    记录centos7下tomcat部署war包过程 1.官网下载tomcat安装包.gz结尾的 2.上传到/usr/local/ ,并解压到tomcat目录下 3.进入tomcat/bin目录,运行./ ...

  6. CentOS 7下单机部署RabbltMQ环境的操作记录

    一. RabbitMQ简单介绍 在日常工作环境中,你是否遇到过两个(多个)系统间需要通过定时任务来同步某些数据?你是否在为异构系统的不同进程间相互调用.通讯的问题而苦恼.挣扎?如果是,那么恭喜你,消息 ...

  7. CentOS7下OpenLDAP部署

    OpenLDAP作为开源的LDAP服务,可用于搭建统一认证平台,在很多企业内部应用比较广泛,本文将介绍在CentOS7下OpenLDAP的部署. 环境: CentOS 7.4 OpenLDAP 2.4 ...

  8. Nextcloud私有云盘在Centos7下的部署笔记

    搭建个人云存储一般会想到ownCloud,堪称是自建云存储服务的经典.而Nextcloud是ownCloud原开发团队打造的号称是“下一代”存储.初一看觉得“口气”不小,刚推出来就重新“定义”了Clo ...

  9. centos7下docker 部署javaweb

    LXC linux container 百度百科:http://baike.baidu.com/link?url=w_Xy56MN9infb0hfYObib4PlXm-PW02hzTlCLLb1W2d ...

随机推荐

  1. C语言基础总结 分类: iOS学习 c语言基础 2015-06-11 10:08 23人阅读 评论(0) 收藏

    //欲练此功必先自宫!!!     //第一天:C语言的基础     //进制     //2进制, 10进制, 8进制, 16进制     //注:8进制数前加0, 16进制数前加0x        ...

  2. Jsonp的实现

    JSONP(JSON with Padding)是JSON的一种“使用模式”,可用于解决主流浏览器的跨域数据访问的问题. 由于同源策略,一般来说位于 server1.com 的网页无法与不是 serv ...

  3. test20181016 B君的第一题

    题意 分析 考场爆零做法 考虑位数少的一定更小,高位小的一定更少. 然后计算一定位数下不同数字的个数,然后从高到低依次确定数位. 特例:如果确定的高位的后缀出现了x,那么要把x调整到后缀去,这样一定更 ...

  4. 南阳oj-ASCII码排序-用了一个晚上

    #include <iostream> #include <sstream> #include <stdio.h> #include <string> ...

  5. 个人博客:有态度的HBase/Spark/BigData

    个人博客:有态度的HBase/Spark/BigData 关于我 本人范欣欣,男,就职于网易杭州研究院后台技术中心数据库技术组,专注于HBase的开发运维,热衷于MySQL等相关数据库技术.联系方式: ...

  6. tomcat源码阅读之日志记录器(Logger)

    UML图: 1.Logger接口中定义了日志的级别:FATAL.ERROR.WARNING.INFORMATION.DEBUG,通过接口函数getVerbosity获取日志级别,setVerbosit ...

  7. 【转】每天一个linux命令(6):rmdir 命令

    原文网址:http://www.cnblogs.com/peida/archive/2012/10/27/2742076.html 今天学习一下linux中命令: rmdir命令.rmdir是常用的命 ...

  8. python之 序列与字典遍历

    在Python中有六种内建的序列:列表.元组.字符串.Unicode字符串.buffer对象和xrange对象.在这里暂时只讨论字符串.列表和元组的遍历. 一. 序列遍历 序列有两种遍历:一种通过值 ...

  9. Oracle误删除表空间的恢复

    对于误删除表空间的恢复,本文通过基于数据库的时间点恢复和基于表空间的时间点恢复分别加以讨论 一 通过基于数据库的时间点恢复被误删除的表空间 1 需要注意的事项 a 基于数据库的时间点恢复将会回退整个数 ...

  10. ASP.NET中将数据作为XML数据发送 使用 Request.InputStream 接收

    将数据作为XML数据发送,例如:public void PostXml(string url, string xml){byte[] bytes = Encoding.UTF8.GetBytes(xm ...