solr服务中集成IKAnalyzer中文分词器、集成dataimportHandler插件

昨天已经在Tomcat容器中成功的部署了solr全文检索引擎系统的服务；今天来分享一下solr服务在海量数据的网站中是如何实现数据的检索。

在solr服务中集成IKAnalyzer中文分词器的步骤：

1、下载IKAnalyzer分词器的压缩包并解压；

2、将IKAnalyzer压缩包中的jar包复制到Tomcat容器中已经部署的solr项目中的WEB-INF/lib目录下；

3、在Tomcat容器的solr项目中的WEB-INF/目录创建一个classes目录(默认该目录是不存在的，需手动创建)，并将分词器压缩包中的配置文件、自定义词典、通用词典三个文件拷贝到classes目录中；

4、找到solr的家目录，即solrHome目录，修改solrHome/collection1/conf/schema.xml文件中定义IK域的类型、定义自定义域配置内容；

　　<!-- IKAnalyzer-->

    <fieldType name="text_ik" class="solr.TextField">

    <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>

    </fieldType>

    <!--IKAnalyzer Field-->

    <field name="content_ik" type="text_ik" indexed="true" stored="true" />

5、重新启动Tomcat容器，检验是否配置成功，如果出现以下界面中的内容，则集成成功，可以看到我们刚才在solrHome的配置文件中配置的自定义域和IK域的类型。

使用dataimportHandler插件批量导入数据，在solr服务中集成dataimportHandler插件的步骤：

1、找到solrHome/collection1目录，创建一个lib目录，将插件所依赖的jar包和数据库驱动包拷贝到lib目录下(dataimportHandler插件依赖的jar包可以在下载好的solr压缩包中找到)；

插件依赖的jar包在dist目录下：

2、找到solrHome/collection1/conf/solrconfig.xml文件，添加如下配置内容：

  <requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">

  <lst name="defaults">

  <str name="config">data-config.xml</str>

  </lst>

  </requestHandler>

3、根据创建的数据表在solrHome/collection1/conf/schema.xml配置文件中配置业务域(温馨提示：业务域根据数据表的字段名称来配置);

　　 <!--product-->

    <field name="product_name" type="text_ik" indexed="true" stored="true"/>

    <field name="product_price"  type="float" indexed="true" stored="true"/>

    <field name="product_description" type="text_ik" indexed="true" stored="false" />

    <field name="product_picture" type="string" indexed="false" stored="true" />

    <field name="product_catalog_name" type="string" indexed="true" stored="true" />

    <field name="product_keywords" type="text_ik" indexed="true" stored="false" multiValued="true"/>

    <copyField source="product_name" dest="product_keywords"/>

    <copyField source="product_description" dest="product_keywords"/>

4、需要创建一个文件名称为data-config.xml的配置文件，并且拷贝到solrHome/collection1/conf目录下；data-config.xml文件中的配置内容如下(温馨提示：根据自己的需求的来添加配置内容，如数据库连接的参数信息，数据库中表字段的名称等)：

<?xml version="1.0" encoding="UTF-8" ?>

<dataConfig>

<dataSource type="JdbcDataSource"

          driver="com.mysql.jdbc.Driver"

          url="jdbc:mysql://localhost:3306/solr"

          user="root"

          password="123"/>

<document>
　　<!-- column代表数据表中的字段名称，name代表配置文件中的业务域的name属性值名称 -->

    <entity name="product" query="SELECT pid,name,catalog_name,price,description,picture FROM products ">

        <field column="pid" name="id"/>

        <field column="name" name="product_name"/>

        <field column="catalog_name" name="product_catalog_name"/>

        <field column="price" name="product_price"/>

        <field column="description" name="product_description"/>

        <field column="picture" name="product_picture"/>

    </entity>

</document>

</dataConfig>

5、重启Tomcat容器，检验插件是否集成成功，如果集成成功，则会看到如下界面，看到成功界面后，就可以导入指定数据表中的数据，导入操作在下图中已表明：

[后续会更新京东站内搜索-solr架构案例，有需要的朋友可以继续关注！！！]

solr服务中集成IKAnalyzer中文分词器、集成dataimportHandler插件的更多相关文章

Solr学习笔记之2、集成IK中文分词器
Solr学习笔记之2.集成IK中文分词器一.下载IK中文分词器 IK中文分词器此文IK版本:IK Analyer 2012-FF hotfix 1 完整分发包二.在Solr中集成IK中文分词器 ...
Lucene系列四：Lucene提供的分词器、IKAnalyze中文分词器集成、扩展 IKAnalyzer的停用词和新词
一.Lucene提供的分词器StandardAnalyzer和SmartChineseAnalyzer 1.新建一个测试Lucene提供的分词器的maven项目LuceneAnalyzer 2. 在p ...
Solr的学习使用之（三）IKAnalyzer中文分词器的配置
1.为什么要配置? 1.我们知道要使用Solr进行搜索,肯定要对词语进行分词,但是由于Solr的analysis包并没有带支持中文的包或者对中文的分词效果不好,需要自己添加中文分词器:目前呼声较高的是 ...
2.IKAnalyzer 中文分词器配置和使用
一.配置 IKAnalyzer 中文分词器配置,简单,超简单. IKAnalyzer 中文分词器下载,注意版本问题,貌似出现向下不兼容的问题,solr的客户端界面Logging会提示错误. 给出我配置 ...
我与solr(六)--solr6.0配置中文分词器IK Analyzer
转自:http://blog.csdn.net/linzhiqiang0316/article/details/51554217,表示感谢. 由于前面没有设置分词器,以至于查询的结果出入比较大,并且无 ...
【solr】solr5.0整合中文分词器
1.solr自带的分词器远远满足不了中文分词的需求,经查使用最多的分词器是solr是mmseg4j分词器,具体整合大家可以参考 https://github.com/zhuomingliang/mms ...
Solr集成IK中文分词器
1.将IKAnalyzer-2012-4x.jar拷贝到example\solr-webapp\webapp\WEB-INF\lib下: 2.在schema.xml文件中添加fieldType: &l ...
Solr 安装与集成IK中文分词器
创建wangchuanfu core 1. 在example目录下创建wangchuanfu-solr文件夹: 2. 将./solr下的solr.xml拷贝到wangchuanfu-solr目录下 ...
solr 7.7.0配置中文分词器的数据类型
<dynamicField name="*_is" type="pints" indexed="true" stored=" ...

随机推荐

H5实现摇一摇技术总结
摇一摇遇到的问题一.如何对摇晃效果进行反馈刚开始的处理方式是,摇晃过程中不做任何处理,但后来反馈说这种效果不好,好像就没有摇动一样,如果声音也不响的话,就真的和什么都没发生一样. 后来想了想,加入 ...
实例操作JSONP原理
絮语:按这个步骤走,你就会明白JSONP是什么鬼. 1.工程目录: ng-mywork demo.html test.js 2.nginx的server配置 server { listen ; ser ...
ASP.NET Core的路由[4]：来认识一下实现路由的RouterMiddleware中间件
虽然ASP.NET Core应用的路由是通过RouterMiddleware这个中间件来完成的,但是具体的路由解析功能都落在指定的Router对象上,不过我们依然有必要以代码实现的角度来介绍一下这个中 ...
SQL Server-聚焦UNIOL ALL/UNION查询（二十三）
前言本节我们来看看有关查询中UNION和UNION ALL的问题,简短的内容,深入的理解,Always to review the basics. 初探UNION和UNION ALL 首先我们过一遍 ...
redis 学习笔记（1）
redis持久化 snapshot数据快照(rdb) 这是一种定时将redis内存中的数据写入磁盘文件的一种方案,这样保留这一时刻redis中的数据镜像,用于意外回滚.redis的snapshot的格 ...
【NLP】前戏：一起走进条件随机场（一）
前戏:一起走进条件随机场作者:白宁超 2016年8月2日13:59:46 [摘要]:条件随机场用于序列标注,数据分割等自然语言处理中,表现出很好的效果.在中文分词.中文人名识别和歧义消解等任务中都有 ...
CSS 3学习——transition 过渡
以下内容根据官方规范翻译以及自己的理解整理. 1.介绍这篇文档介绍能够实现隐式过渡的CSS新特性.文档中介绍的CSS新特性描述了CSS属性的值如何在给定的时间内平滑地从一个值变为另一个值. 2.过渡 ...
SSH框架和Redis的整合(2)
5. 添加功能的实现新建一个Action:RClasAction,实现向Redis添加课程数据,并同步到MySQL. package com.school.action; import java.u ...
NSURLSession详解
导语现在NSURLConnection在开发中会使用的越来越少,iOS9已经将NSURLConnection废弃,现在最低版本一般适配iOS7,所以也可以使用. NSURLConnection相对于 ...
Mysql - 性能优化之子查询
记得在做项目的时候, 听到过一句话, 尽量不要使用子查询, 那么这一篇就来看一下, 这句话是否是正确的. 那在这之前, 需要介绍一些概念性东西和mysql对语句的大致处理. 当Mysql Server ...

solr服务中集成IKAnalyzer中文分词器、集成dataimportHandler插件

solr服务中集成IKAnalyzer中文分词器、集成dataimportHandler插件的更多相关文章

随机推荐

热门专题