solr dataimport
solrconfig.xml
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
<lst name="defaults">
<str name="config">data-config.xml</str>
<str name="df">text</str>
</lst>
</requestHandler>
solrconfig.xml同一个目录下增加 data-config.xml 文件
<dataConfig>
<dataSource type="JdbcDataSource" name="ds-1"
driver="com.microsoft.sqlserver.jdbc.SQLServerDriver"
url="jdbc:sqlserver://localhost;databaseName=My_DB;responseBuffering=adaptive;"
user="you name"
password="you password"/>
<dataSource type="JdbcDataSource" name="ds-2"
driver="com.mysql.jdbc.Driver"
url="jdbc:mysql://db2-host/dbname"
user="db_username"
password="db_password"/>
<dataSource type="FileDataSource" name="ds-3" encoding="UTF-8" /> <document>
<!--add filed for match sql column to solr column-->
<entity name="product" dataSource="ds-1"
query="select top 1 * from Product"
transformer="RegexTransformer,DateFormatTransformer" >
<field column="Id" name="id"/>
<entity name="productCategory" dataSource="ds-1"
query="select top 1 * from Code_Category_Product
Where Id=${product.CategoryId}">
<field column="Id" name="categoryid"/>
<field column="Description" name="category"/>
</entity>
<field column="Name" name="name" />
<field column="Description" name="description" />
<field column="UnitPrice" name="unitprice"/>
<field column="Status" name="status"/>
<field column="CreatedTime" name="createdtime" dateTimeFormat="M/d/yyyy h:m:s a"/>
<field column="Name" regex=".*Product1" name="name_py" />
</entity> <!--atch sql column to solr column in the sql query-->
<entity name="product2" dataSource="ds-1"
query="select Id as id,
CategoryId,
Name as name,
Description as description,
UnitPrice as unitprice,
Status as status,
CreatedTime as createdTime from Product
Where Id=10000000002">
<entity name="productCategory" dataSource="ds-1"
query="select top 1 * from Code_Category_Product
Where Id=${product2.CategoryId}">
<field column="Id" name="categoryid"/>
<field column="Description" name="category"/>
</entity>
</entity> <entity name="product3" dataSource="ds-3"
processor="XPathEntityProcessor"
stream="true"
forEach="/products/product | /products/item"
url="D:\Solr\solr-NewRMS\example\conf\products.xml"
transformer="RegexTransformer,DateFormatTransformer" >
<field column="id" xpath="/products/product/id" />
<field column="name" xpath="/products/product/@name" />
<field column="name_py" xpath="/products/product/name_py" />
<field column="createdtime" xpath="/products/product/createdtime" dateTimeFormat="yyyy-MM-dd'T'hh:mm:ss'Z'" />
<field column="tag" xpath="/products/product/tag" splitBy=","/>
<field column="description" regex="/products/product/description" />
</entity> </document>
</dataConfig>
data-config.xml同一个目录下增加 products.xml
<products>
<product name="product1001">
<id>1001</id>
<createdtime>2011-11-07T17:05:14</createdtime>
<description><![CDATA[this is 1001 desc]]></description>
<tag>tag11,tag22</tag>
</product>
<product name="product1002">
<id>1002</id>
<name_py>是</name_py>
<createdtime>2012-11-07T17:05:14</createdtime>
<description><![CDATA[this is 1002 description]]></description>
<tag>tag1</tag>
<tag>tag2</tag>
</product>
</products>
数据库:Product


如果不想把之前的数据清除 取消 Clean 选项
在Entity中选择运行项
点击Execute, 一段时间后点击Refresh Status查看运行结果
可以去Query中查看是否已经插入数据

solr dataimport的更多相关文章
- Solr学习笔记之3、Solr dataimport - 从SQLServer导入数据建立索引
Solr学习笔记之3.Solr导入SQLServer数据建立索引 一.下载MSSQLServer的JDBC驱动 下载:Microsoft JDBC Driver 4.0 for SQL Server ...
- 威胁快报|Solr dataimport成挖矿团伙新型利用方式
概述 近日,阿里云安全团队监测到挖矿团伙利用solr dataimport RCE(CVE-2019-0193)作为新的攻击方式对云上主机进行攻击,攻击成功后下载门罗币挖矿程序进行牟利.该团伙使用的恶 ...
- Solr Dataimport配置
参考资料: https://cwiki.apache.org/confluence/display/solr/Uploading+Structured+Data+Store+Data+with+the ...
- solr dataimport中遇到的问题
1.windows的tomcat是没有catalina.out的,可以通过修改start.bat和catalina.bat的方式让日志输出到catalina.out 2.按照网上搜到的资料配置好sol ...
- Linux下安装使用Solr
Linux下安装使用Solr 1.首先下载Solr.mmseg4j分词包.tomcat并解压,这用google.百度都可以搜索得到下载地址. 2.因为要使用到中文分词,所以要设置编码,进入tomcat ...
- solr连接数据库配置
一般要搜索的信息都是被存储在数据库里面的,但是我们不能直接搜数据库,所以只有借助Solr将要搜索的信息在搜索服务器上进行索引,然后在客户端供客户使用. 一.链接数据库 1. SQL配置 拿SQL Se ...
- 将数据库表导入到solr索引
将数据库表导入到solr索引 编辑solrcofnig.xml添加处理器 <requestHandler name="/dataimport" class="org ...
- solr导入mysql数据库
感谢ITeye的博主viskyzz分享的经验,笔者基本参考ta的方法.然而,解决中间出现的问题时也融入了自己的经验. 查看ta的原文请戳: http://tbwuming.iteye.com/blog ...
- SOLR (全文检索)
SOLR (全文检索) http://sinykk.iteye.com/ 1. 什么是SOLR 官方网站 http://wiki.apache.org/solr http://wiki.apach ...
随机推荐
- JMeter - 实时结果 - InfluxDB和Grafana - 第1部分 - 基本设置
概述: 在本文中,我将解释如何使用JMeter + InfluxDB + Grafana获得实时性能测试结果. 请注意,此主题太大,无法涵盖一篇文章中的所有内容.所以,我试图提供与TestAutoma ...
- 移动Web开发规范概述
以下规范建议,均是Alloyteam在日常开发过程中总结提炼出的经验,规范具备较好的项目实践,强烈推荐使用. 字体设置 使用无衬线字体 body { font-family: "Helvet ...
- Restful 3 -- 序列化组件(GET/PUT/DELETE接口设计)、视图优化组件
一.序列化组件 基于上篇随笔的表结构,通过序列化组件的ModelSerializer设计如下三个接口: GET 127.0.0.1:8000/books/{id} # 获取一条数据,返回值:{} PU ...
- mycat分片规则之分片枚举(sharding-by-intinfile)
mycat分片规则之分片枚举(sharding-by-intinfile) http://blog.51cto.com/goome/2058959 mycat安装及分片初体验 https://blog ...
- JS——两个原生选择器
1. document.querySlector() 2.document.querySlectorAll() <!DOCTYPE html> <html lang="en ...
- 简单的dp(dp专题)
题目链接:https://vjudge.net/contest/216347#problem/C Alice gets two sequences A and B. A easy problem ...
- Hadoop 3节点集群无法成功启动zookeeper
今天在集群上跑程序的时候遇到了zookeeper无法成功启动的问题,先分别启动了主节点和从节点的zookeeper进程,并且通过jps也看到zookeeper进程已经启动了,但通过指令查看进程状态的时 ...
- 打印机设置dns
1.登录打印机网页:打印机的ip 2.点击网络--网络标识--设置DNS
- java与模式读后总结
一 老规则边看边写书上的代码,磨磨蹭蹭三个多星期终于把一本1000+的java与模式看完了. 于是,在这里贴上自己对每个模式的思考和总结,其实这个东西在我边看边写的时候已经写了一大半,博文再写一次算是 ...
- vscode 插件todo-highlight
简介 Highlight TODO,FIXME or any annotations within your code. 资源 https://marketplace.visualstudio.com ...