将数据库表导入到solr索引
将数据库表导入到solr索引
编辑solrcofnig.xml添加处理器
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
<lst name="defaults">
<str name="config">data-config.xml</str>
</lst>
</requestHandler>
创建一个名为data-config.xml的文件并保存如下内容到conf目录(也就是solrconfig.xml的目录)
<dataConfig>
<dataSource type="JdbcDataSource"
driver="com.mysql.jdbc.Driver"
url="jdbc:mysql://localhost/dbname"
user="user-name"
password="password"/>
<document>
<entity name="id"
query="select id,name,desc from mytable">
</entity>
</document> </dataConfig>
编辑schema.xml文件,保证文件中有'id','name','desc'等fields。并更改data-config.xml的详细信息。
将JDBC的jar驱动文件放到/lib文件夹中(tomcat/webapps/solr/WEB-INF/lib)
运行命令 http://solr-host:port/solr/dataimport?command=full-import进行全量索引,每次进行全量索引时,会将数据清空,如果不想清空需要添加clean=false。例如http://solr-host:port/solr/dataimport?command=full-import&clean=false
在字段名和field明不同的时候添加索引
修改data-config.xml,如下所示
<dataConfig>
<dataSource type="JdbcDataSource"
driver="com.mysql.jdbc.Driver"
url="jdbc:mysql://localhost/dbname"
user="user-name"
password="password"/>
<document>
<entity name="id"
query="select id,name,desc from mytable">
<field column="id" name="solr_id"/>
<field column="name" name="solr_name"/>
<field column="desc" name="solr_desc"/>
</entity>
</document>
</dataConfig>
写入solr的字段为'solr_id', 'solr_name', solr_desc'。所以schema.xml中必须要要这几个field。
运行 http://solr-host:port/dataimpor?command=full-import 建立索引
配置多个表建立索引
修改data-config如下:
<dataConfig>
<dataSource type="JdbcDataSource"
driver="com.mysql.jdbc.Driver"
url="jdbc:mysql://localhost/dbname"
user="user-name"
password="password"/>
<document>
<entity name="outer"
query="select id,name,desc from mytable">
<field column="id" name="solr_id"/>
<field column="name" name="solr_name"/>
<field column="desc" name="solr_desc"/>
<entity name="inner"
query="select details from another_table where id ='${outer.id}'">
<field column="details" name="solr_details"/>
</entity>
</entity>
</document>
</dataConfig>
schema.xml应该包含solr_details的字段
运行full-import
mysql配置
下载mysql的JDBC的jar,并拷贝到/lib的文件夹
修改data-config为如下
<dataConfig>
<dataSource type="JdbcDataSource" driver="com.mysql.jdbc.Driver"
url="jdbc:mysql://ip:3306/dbname"
user="username"
password="password"/>
<document name="products">
<entity
......
</entity> </document>
</dataConfig>
DataImportHandler支持的命令
abort          http://<host>:<port>/solr/dataimport?command=abort          终止命令
delta-import   http://<host>:<port>/solr/dataimport?command=delta-import   增量
full-import    http://<host>:<port>/solr/dataimport?command=full-import    全量
reload-config  http://<host>:<port>/solr/dataimport?command=reload-config  重新加载配置
status         http://<host>:<port>/solr/dataimport?command=status         状态查询
												
											将数据库表导入到solr索引的更多相关文章
- Solr 07 - Solr从MySQL数据库中导入数据 (Solr DIH的使用示例)
		
目录 1 加入数据导入处理器的jar包 2 加入数据库驱动包 3 配置solrconfig.xml文件 3.1 配置lib标签 - 加入驱动jar包 3.2 配置requestHandler标签 - ...
 - U8API——向U8数据库表导入数据
		
一.打开API资源管理器 替换两个引用 打开应用实例,选择相应的功能 复制相应的封装类到自己的目录下 在数据库新建临时表,与目标表相同 数据导入: 思路:先将要导入的数据导入到与U8目标表相同的临时表 ...
 - SqlServer数据库表导入SqlLite数据库表保持日期时间类型字段的格式
		
在写查询功能的过程中遇到一个这样的问题:按日期范围查询,sql语句是:where dt>=用户选择起始日期&&dt<=用户选择结束日期.数据库中的数据如图1,我选择的测试数 ...
 - access数据库表导入到oracle
		
1.本机安装access数据库 25M左右2.创建ODBC数据源,要选择oracle C:\Windows\SysWOW64\odbcad32.exe 3.打开要导入的 .mdb文件 右键表--> ...
 - mysql数据库 表 导入导出
		
1.导出表结构 mysqldump --no-data -h192.168.222.11 -uroot -proot --databases db01 db02 db30>file.sql 2. ...
 - 数据库表中不建索引,在插入数据时,通过sql语句防止重复添加
		
sql 语句 INSERT IGNORE INTO table(aaa,bbb) SELECT '1111','2222' FROM DUAL WHERE NOT EXISTS( ' ) mybati ...
 - Solr 4.4.0利用dataimporthandler导入postgresql数据库表
		
将数据库edbstore的edbtore schema下的customers表导入到solr 1. 首先查看customers表字段信息 edbstore=> \d customers Tabl ...
 - SAP中的数据库表索引
		
数据库表中的索引可以加快查询的速度.索引是数据库表字段的有序副本.附加的字段包含指向真实数据库表行的指针.排序可以使访问表行的速度变快,例如,可以使用二分搜索.数据库表至少有一个主索引,由它的key字 ...
 - oralce 超过1亿条数据的数据库表清理实践
		
2018-08-18 16:58 无腿鸟 阅读(331) 评论(0) 编辑 收藏 问题:当一个表的数据量超过一亿条,要删除其中的5000w条,如何处理. 如果直接使用delete语句,会涉及到到大量的 ...
 
随机推荐
- 用c#开发微信(2)扫描二维码,用户授权后获取用户基本信息 (源码下载)
			
本文将介绍基于Senparc.Weixin微信开发框架来实现网页授权来获取用户基本信息.先生成包含授权及回调url信息的二维码:用户用微信扫描之后,被要求授权以获取Ta的用户基本信息:用户授权后,通过 ...
 - NodeJS http 模块
			
#4 NodeJS http 模块 工作目录 server.js var http = require('http'); var fs = require('fs'); var path = requ ...
 - 团队项目--站立会议DAY5
			
第五次站立会议记录: 参会人员:张靖颜,钟灵毓秀,何玥,赵莹,王梓萱 项目进展: 1.张靖颜:继续对钟灵毓秀和赵莹同学编写的代码进行进一步审核及辅助. 2.钟灵毓秀:继续完善相关功能代码,逐步整理出各 ...
 - 深入理解c++构造函数, 复制构造函数和赋值函数重载(operator=)
			
注 以下代码编译及运行环境均为 Xcode 6.4, LLVM 6.1 with GNU++11 support, Mac OS X 10.10.2 调用时机 看例子 // // main.cpp / ...
 - 【WEB API项目实战干货系列】- 导航篇(十足干货分享)
			
在今天移动互联网的时代,作为攻城师的我们,谁不想着只写一套API就可以让我们的Web, Android APP, IOS APP, iPad APP, Hybired APP, H5 Web共用共同的 ...
 - atitit.添加win 系统服务 bat批处理程序服务的法总结instsrv srvany  java linux
			
atitit.添加win 系统服务 bat批处理程序服务的法总结instsrv srvany java linux 系统服务不同于普通视窗系统应用程式.不可能简简单单地通过运行一个EXE就启动视窗系 ...
 - iOS开发---集成百度地图
			
由于iOS MapKit框架很多情况并不能满足我们的需求,我们可以选择集成百度地图,那该如何操作呢? 申请Key 登录百度API管理中心申请Key http://lbsyun.baidu.com/ap ...
 - java生成生成图片缩略图
			
/** * */ package com.fkhwl.fkhserver.core.utils; import java.awt.Image; import java.awt.image.Buffer ...
 - Easyui-datagrid groupview分组后勾选问题
			
上面datagrid对应的代码如下: $('#tbCheckOut').datagrid({ title: '待分配库位', iconCls: 'icon-search', width: 1112, ...
 - UHF桌面式发卡器
			
UHF桌面式发卡器: http://www.rr-rfid.com/index.php/pro_view/95 本文用菊子曰发布