Solr通过配DIH对数据库数据做索引

1 加入相关jar包

将2个相关jar包复制到/opt/solr-7.7.1/server/solr-webapp/webapp/WEB-INF/lib文件夹下

jar包名称
solr-dataimporthandler-extras-7.7.1.jar
solr-dataimporthandler-7.7.1.jar

jar包所在位置/opt/solr-7.7.1/dist

并将连接oracle的jar包也复制到该目录下

2 配置Core下的solrconfig.xml文件

/opt/solr-7.7.1/server/solr/article_core/conf/solrconfig.xml

加入到<config></config>标签内

<!-- import date-->

<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">

　　<lst name="defaults">

　　　　<str name="config">data-config.xml</str>

　　</lst>

</requestHandler>

3 在conf中创建data-config.xml

/opt/solr-7.7.1/server/solr/article_core/conf中

<?xml version="1.0" encoding="UTF-8" ?>

<dataConfig>

    <dataSource type="JdbcDataSource"

        driver="oracle.jdbc.driver.OracleDriver"

        url="jdbc:oracle:thin:@ip地址:1521:ORCL"

        user="连接数据库用户名"

        password="连接数据库密码"/>

    <document>

        <entity name="bookInfo" query="SELECT

            BOOK_ID,

            TITLE_CN,

            TITLE_EN,

            KEYWORDS_CN,

            KEYWORDS_EN

            from

            EL.T_BOOK_INFO">

            <field column="BOOK_ID" name="id"/>

            <field column="TITLE_CN" name="titleCn"/>

            <field column="TITLE_EN" name="titleEN"/>

            <field column="KEYWORDS_CN" name="keywordsCn"/>

            <field column="KEYWORDS_EN" name="keywordsEn"/>

        </entity>

    </document>

</dataConfig>

4在schema.xml中添加域

<field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" /> 

<field name="titleCn" type="text_ik" indexed="true" stored="true" required="true" multiValued="false" /> 

<field name="titleEn" type="text_ik" indexed="true" stored="true" required="true" multiValued="false" /> 

<field name="keywordsCn" type="text_ik" indexed="true" stored="true" required="true" multiValued="false" /> 

<field name="keywordsEn" type="text_ik" indexed="true" stored="true" required="true" multiValued="false" />

其中field中的name值与data-config.xml中的name值一样

5重启solr服务

bin/solr restart

执行添加 10万条数据大概用时1m30s

Solr通过配DIH对数据库数据做索引的更多相关文章

【Solr】数据库数据导入索引库
目录分析框图配置数据库与solrconfig.xml 回到顶部分析框图框图画的粗糙!勿喷啊!勿喷啊! 回到顶部配置数据库与solrconfig.xml Dataimport插件可以批量把数 ...
通过读取excel数据和mysql数据库数据做对比（二）-代码编写测试
通过上一步,环境已搭建好了. 下面开始实战, 首先,编写链接mysql的函数conn_sql.py import pymysql def sql_conn(u,pwd,h,db): conn=pymy ...
使用 Solr 创建 Core 并导入数据库数据
1. 输入 http://localhost:8080/solr/index.html 来到 Solr 的管理界面: 2. 点击左侧 Core Admin --> Add Core,然后输入自己 ...
通过读取excel数据和mysql数据库数据做对比（一）-win环境准备
要想操作excel和mysql首先需要安装python,然后是安装excel和mysql插件: 第一步安装python: 直接百度搜索,下载安装就可以了. 第二步安装excel插件: 首先到这个htt ...
如何通过 Docker 部署 Logstash 同步 Mysql 数据库数据到 ElasticSearch
在开发过程中,我们经常会遇到对业务数据进行模糊搜索的需求,例如电商网站对于商品的搜索,以及内容网站对于内容的关键字检索等等.对于这些高级的搜索功能,显然数据库的 Like 是不合适的,通常我们采用 E ...
solr 7+tomcat 8 + mysql实现solr 7基本使用(安装、集成中文分词器、定时同步数据库数据以及项目集成)
基本说明 Solr是一个开源项目,基于Lucene的搜索服务器,一般用于高级的搜索功能: solr还支持各种插件(如中文分词器等),便于做多样化功能的集成: 提供页面操作,查看日志和配置信息,功能全面 ...
在Linux环境下，将Solr部署到tomcat7中，导入Mysql数据库数据，定时更新索引
什么是solr solr是基于Lucene的全文搜索服务器,对Lucene进行了扩展优化. 准备工作首先,去下载以下软件包: JDK8:jdk-8u60-linux-x64.tar.gz TOMCA ...
solr 简单搭建数据库数据同步（待续）
原来在别的公司负责过文档检索模块的维护(意思就是不是俺开发的啦). 所以就略微接触和研究了下文档检索. 文档检索事实上是全文检索.是通过一种技术把N多文档进行一定规律的分割归类,然后创建易于搜索的索引 ...
solr导入数据库数据-tinyint数据转boolean
solr在导入mysql数据库数据时,遇到一个问题:数据类型为tinyint的数据对应不到solr中的数据类型,因此就需要将tinyint转一下. 修改schema.xml文件,如下: 1.添加boo ...

随机推荐

CATIA 基础详解第01章 CATIA初认识
1.1 CATIA V5产品介绍 CATIA V5是基于美国IBM公司与法国达索系统公司(Dassault Systèmes)软件解决方案推出的新一代产品,它致力于满足以设计流程为中心的设计需求.它提 ...
StretchDIBits速度测试(HALFTONE)
StretchDIBits速度测试(HALFTONE) 下面实验中显示窗口大小为1024*768,拉伸模式设为HALFTONE. 一.单通道图像 (1) 保持图像高度为1024,宽度从24到2024递 ...
Jenkins之发布报错“error: RPC failed; curl 18 transfer closed with outstanding read data remaining”
报错信息: error: RPC failed; curl transfer closed with outstanding read data remaining fatal: The remote ...
python学习之IO:
输入输出兼程IO操作,有同步(速度不匹配时四等)和异步(轮询和消息通知,复杂而高效) 一文件操作函数: 文件打开:f=open("文件路径“,“操作类型 r/rb/w/a”,"编 ...
Django的模型与字段
Django的模型,包含字段field和操作方法,每个模型在数据库中映射为一张表. 基本原则: 每个model在django中是一个Python类每个model都是django.db.models. ...
一个简单的注册页面,基于JS
<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title> ...
sql中的exsits和not exsits
select * from table where exsits(sql语句) : 括号中sql语句有数据则返回这些相关id的数据集 select * from table where not ex ...
验证 .NET 4.6 的 SIMD 硬件加速支持的重要性
SIMD 的意思是 Single Instruction Multiple Data.顾名思义,一个指令可以处理多个数据. .NET Framework 4.6 推出的 Nuget 程序包 Syste ...
Ubuntu14.04 32位安装Youcompleteme
前一段时间在ubuntu16.04 64位上安装了vim插件Youcompleteme,花了两三天才弄好.今天在ubuntu14.04 32位上安装同样的插件,才知道之前所做的安装原来是多么的简单.今 ...
Java Web应用中获取用户请求相关信息，如：IP地址、操作系统、浏览器等信息
引入jar包 <dependency> <groupId>eu.bitwalker</groupId> <artifactId>UserAgentUti ...