solr6.4.1搜索引擎(2)首次同步mysql数据库

尚未成功启动solr的，请参考我的另一篇文章：http://www.cnblogs.com/zhuwenjoyce/p/6506359.html（solr6.4.1 搜索引擎启动eclipse启动）

本篇文章主要介绍如何同步mysql数据库

添加core命名为core3（之前试验了好几个都失败了…）

注意，这里的两个输入框*Dir如果不指定目录，那么默认这个core3目录将应该在solrhome根目录下，instanceDir和dataDir必须是两个已存在的目录

我这里的core3目录是D:\solr\solrhome\core3（这个core3目录也要先建立出来）

先不要点击按钮Add Core,因为会报错：

Error CREATEing SolrCore 'core3': Unable to create core [core3] Caused by: Can't find resource 'solrconfig.xml' in classpath or 'D:\solr\core3'

为了避免这个错误，我们首先需要为这个core3做一些准备工作，包括要把Add Core中的solrconfig.xml和schema.xml文件都创建出来。主要分为以下几步：

第一步：创建solrconfig.xml

因为是同步数据库，所以找的是db目录下的solrconfig.xml, D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\solrconfig.xml

（上图工具使用的是一个windows搜索器：Everything.exe）

复制D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\solrconfig.xml黏贴到D:\solr\solrhome\core3目录下。

修改D:\solr\solrhome\core3\solrconfig.xml，把<lib dir= 标签这7个节点里的${solr.install.dir:../../../..}替换为本地solr根目录D:/solr/solr-6.4.1

第二步：创建db-data-config.xml

因为在D:\solr\solrhome\core3\solrconfig.xml中，提到使用db-data-config.xml来导入数据

所以同理，复制db目录下的db-data-config.xml到D:\solr\solrhome\core3\目录下

重点1：db-data-config.xml中，url地址中的&符号必须替换为&否则会报错：

Data Config problem: 对实体 "useUnicode" 的引用必须以 ';' 分隔符结尾。

以下是我本地的db-data-config.xml文件

重点2：所有field标签的name值都必须存在于schema.xml中！（参考第三步：创建schema.xml）

第三步：创建schema.xml

复制D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\managed-schema黏贴为D:\solr\solrhome\core3\schema.xml，这个schema.xml就是Add Core界面的schema文件。

重点1：schema.xml文件定义了所有我们需要在数据库中同步过来的字段，其中db-data-config.xml中导入的字段必须要存在于该schema.xml中所以schema.xml文件决定了在整个solr应用中，所有的字段必须不能重复！建议在solr中对字段命名时采用表名_字段名方式。

重点2：schema.xml文件中所有的<field标签中required="true"属性标志着你所有在solr中的查询都必须有一个字段是这些字段，而且必须有值，否则报错：SolrException missing required field: id

重点3：当点击Add Core按钮之后，原先的D:\solr\solrhome\core3\schema.xml文件将被删除，随之增加D:\solr\solrhome\core3\conf\managed-schema（注意，没有后缀名）

以下是我本地的managed-schema文件

注意，不要缺失<uniqueKey>w10_id</uniqueKey>标签，否则会报错：

core3: org.apache.solr.common.SolrException:org.apache.solr.common.SolrException: QueryElevationComponent requires the schema to have a uniqueKeyField.

第四步：复制stopwords_*.txt文件到D:\solr\core3\lang\目录下

所有的D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\lang\stopwords_*.txt文件

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\lang\stopwords_el.txt

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\lang\stopwords_en.txt

it;id;hy;lv;hu;pt;tr;de;hi;da;cz;th;sv; 等等txt文件，总共有31个

第五步：复制以下文件到D:\solr\core3\lang\目录下

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\lang\contractions_it.txt

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\lang\contractions_ca.txt

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\lang\contractions_ga.txt

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\lang\contractions_fr.txt

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\lang\hyphenations_ga.txt

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\lang\stemdict_nl.txt

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\lang\stoptags_ja.txt

第六步：复制elevate.xml到conf目录下

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\elevate.xml复制到D:\solr\core3\conf

第七步：复制以下文件到D:\solr\core3\目录下

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\protwords.txt

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\synonyms.txt

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\stopwords.txt

D:\solr\solr-6.4.1\example\example-DIH\solr\db\conf\currency.xml

第八步：重启tomcat，访问solr，增加core

增加一个core就相当于增加了一个数据库，solr本就支持数据库集群，支持以json格式存储数据

点击Core Admin菜单，输入core信息，点击Add Core按钮：

建立成功之后可以查看core3的位置信息：

ps: 如果启动过程中有遇到*.lock文件而报错，那么删除该lock文件重新建立一遍既可成功。

第九步：gui界面导入mysql数据库

下拉框选择刚刚建立的core3,选中Dataimport菜单

先检查core3加载的db-data-config.xml文件是否有效，点击Reload按钮校验，当出现信息No information available时则表示校验通过。

初次导入选择full-import全量导入模式，点击Execute按钮执行数据导入，页面右边显示Indexing since则表示正在导入中，在导入过程中，点击Refresh Status则会显示详细的导入信息（Requests,Fetched,Skipped），如下图右图所示：

如果导入失败，需要重来一遍，在选择勾选clean选项（清除之前所有导入索引）外，也可以考虑直接删除数据文件，地址在core3根目录下，有个data文件夹：D:\solr\solrhome\core3\data。

注意勾选上选项 Auto-Refresh Status，这个会自动帮你刷新数据导入状态信息，信息大概变化如下：

请求第一个entity，我这里是w10，数据10万量的表

请求第二个entity，我这里是w100, 数据100万量的表

请求第三个entity，我这里是w1000, 数据1000万量的表

导入成功后，信息界面显示如下：

数据导入成solr索引成功，总共花费了5分钟06秒。这时候就可以去掉勾选项Auto-Refresh Status

第十步：gui界面查看导入数据

选择core3，点击菜单Query，什么查询条件都不要加，点击Execute Query按钮

查询出solr同步数据如下，表示同步mysql数据成功：

上图中，http地址表示此次查询可以使用这样的get请求方式，其中status 0 表示查询成功，params表示此次查询使用的查询参数。这里显示的全都是默认值。response里的数据代表查询到的数据，可以看到已经查询成功。

第十一步：solr数据状态

选择core4，点击overview，当在tomcat重启后，有可能出现上图中的optimize now，并且Optimized状态显示为叉叉，这是solr在告诉你这个core4的数据索引并没有按照solr的索引排序以达到最佳查询状态，只需要点击optimize now进行索引重新排序就可以了。

但是注意，这需要花费一定时间，所以会损失性能，当然，重新排序后，性能会提高。

solr6.4.1搜索引擎(2)首次同步mysql数据库的更多相关文章

solr6.4.1搜索引擎(3)增量同步mysql数据库
尚未实现首次同步mysql数据库的,请参考我的另一篇文章http://www.cnblogs.com/zhuwenjoyce/p/6512378.html(solr6.4.1搜索引擎同步mysql数据 ...
solr6.4.1搜索引擎同步mysql数据库
尚未成功启动solr的,请参考我的另一篇文章:http://www.cnblogs.com/zhuwenjoyce/p/6506359.html(solr6.4.1 搜索引擎启动eclipse启动) ...
Logstash同步mysql数据库信息到ES
@font-face{ font-family:"Times New Roman"; } @font-face{ font-family:"宋体"; } @fo ...
使用canal增量同步mysql数据库信息到ElasticSearch
本文介绍如何使用canal增量同步mysql数据库信息到ElasticSearch.(注意:是增量!!!) 1.简介 1.1 canal介绍 Canal是一个基于MySQL二进制日志的高性能数据同步系 ...
使用go-mysql-elasticsearch同步mysql数据库信息到ElasticSearch
本文介绍如何使用go-mysql-elasticsearch同步mysql数据库信息到ElasticSearch. 1.go-mysql-elasticsearch简介 go-mysql-elasti ...
使用logstash同步mysql数据库信息到ElasticSearch
本文介绍如何使用logstash同步mysql数据库信息到ElasticSearch. 1.准备工作 1.1 安装JDK 网上文章比较多,可以参考:https://www.dalaoyang.cn/a ...
Elasticsearch学习(2) windows环境下Elasticsearch同步mysql数据库
在上一章中,我们已经能够通过spring boot来使用Elasticsearch,但是由于我们习惯性的将数据写入mysql,所以为了解决这个问题,Elasticsearch为我们提供了一个插件log ...
如何通过 Docker 部署 Logstash 同步 Mysql 数据库数据到 ElasticSearch
在开发过程中,我们经常会遇到对业务数据进行模糊搜索的需求,例如电商网站对于商品的搜索,以及内容网站对于内容的关键字检索等等.对于这些高级的搜索功能,显然数据库的 Like 是不合适的,通常我们采用 E ...
django无法同步mysql数据库 Error:1064
[问题] 具体问题:新建django工程,使用django的manage.py的 migrate命令进行更改. 在初始化数据库表时,失败,错误信息为 django.db.migrations.exce ...

随机推荐

『Python CoolBook』数据结构和算法_多变量赋值&“*”的两种用法
多变量赋值 a = [1,2,(3,4)] b,c,d = a print(b,c,d) b,c,(d,e) = a print(b,c,d,e) 1 2 (3, 4) 1 2 3 4 a = &qu ...
数据结构与算法之PHP排序算法（堆排序）
一.堆的定义堆通常是一个可以被看做一棵树的数组对象,其任一非叶节点满足以下性质: 1)堆中某个节点的值总是不大于或不小于其父节点的值: 每个节点的值都大于或等于其左右子节点的值,称为大顶堆.即:ar ...
Jquery获取元素方法
Jquery 获取元素的方法分为两种:jQuery选择器.jQuery遍历函数. 1.获取本身: a.只需要一种jQuery选择器选择器实例说明 #Id $('#myId') ID选择器: 可以 ...
2015-10-05 js3
Javascript 实例2九九乘法表 var s = ""; s += "<table>"; for (var i = 1; i < 10; ...
JavaScript（ES6）学习笔记-Set和Map数据结构（一）
一.Set 1.ES6 提供了新的数据结构 Set.它类似于数组,但是成员的值都是唯一的,没有重复的值. Set 本身是一个构造函数,用来生成 Set 数据结构. , , , , ']); s; // ...
Python---遍历序列的各种方式
本文主要列举使用for循环遍历类似list结果的方式,因为老是使用for e in w_list真的是太没创意了,这显然不是我的风格,嘿嘿... 1. for item in s: 遍历s中的元素 2 ...
jdbc从基础到优化
package com.xk.demotest.tools; import java.io.IOException; import java.io.InputStream; import java.s ...
Windows查看Java内存使用情况
Windows查看Java程序运行时内存使用情况 1.在cmd命令窗口输入 jconsole ,弹出Java监视和管理控制台窗口 2.连接本地进程,首先需要知道想查看的进程ID ( pid ) 在c ...
cocos2d-x学习笔记(斗地主代码）
满足百度百科上的出牌规则,电脑可以随着玩家出牌. 百度网盘地址:链接: https://pan.baidu.com/s/1eRLpvJ8 提取密码: tf8w
Power BI和 Visio 集成优缺点
Power BI 的 Visio 自定义视觉,这个功能是非常值得让人兴奋的,小悦相信这是一个非常重要的开发,不仅适用于 Visio,也适用于Power BI.现在已经有越来越多的可视化,它们以更简洁的 ...

solr6.4.1搜索引擎(2)首次同步mysql数据库

solr6.4.1搜索引擎(2)首次同步mysql数据库的更多相关文章

随机推荐

热门专题