Canal——写入到ES中数据错乱

问题描述

　　使用canal-adapter写入elasticSearch数据时，数据是写入了elasticSearch了，但出现了mysql表中的数据和elasticSearch中索引中的数据错乱的问题，即把A列的数据放到了B列中的。

研究了半天，发现是因为我在测试过程中，换过另外1个数据库，这2个库中的列不一致导致的。

因为canal会通过tsdb维护了一个当前数据库内表结构，具体配置如下：

我这里(tsdb使用的是本地的h2数据库)。

我有2个数据库，首先在第1个库测试验证，是正常的，然后换成在第2个库测试验证，就出问题了，

因为第1个库时已经缓存了表结构信息，第2个库还是拿的第1个库的表结构进行处理的。

理解canal tsdb的功能需要先看懂官方对tsdb的介绍和实现
https://github.com/alibaba/canal/wiki/TableMetaTSDB

解决方案

知道原因了就好解决了，既然是用H2存储表结构的，那删除它，然后重启服务就好了，因为会重新加载最新的表结构

cd canal/conf/db1

rm -rf h2.mv.db

后续优化

在使用HA功能的同时，如果开启tsdb的话，一定要将tsdb设置为集中式的，也就是不要使用本地的h2了，而是使用集中化的mysql数据库，保证两台canal连接的是同一个数据库。

这样的话才能够满足在进行DDL和HA切换的时候不会出现异常。

Canal——写入到ES中数据错乱的更多相关文章

转【es中数据节点和主机】
在生产环境下,如果不修改elasticsearch节点的角色信息,在高数据量,高并发的场景下集群容易出现脑裂等问题. 默认情况下,elasticsearch集群中每个节点都有成为主节点的资格,也都存储 ...
如何将爬取的数据写入ES中
前面章节一直在说ES相关知识点,现在是如何实现将爬取到的数据写入到ES中,首先的知道ES的python接口叫elasticsearch dsl 链接:https://github.com/elasti ...
Elasticsearch准实时索引实现（数据写入到es分片并存储到文件中的过程）
溢写到文件系统缓存当数据写入到ES分片时,会首先写入到内存中,然后通过内存的buffer生成一个segment,并刷到文件系统缓存中,数据可以被检索(注意不是直接刷到磁盘) ES中默认1秒,refr ...
1.scrapy爬取的数据保存到es中
先建立es的mapping,也就是建立在es中建立一个空的Index,代码如下:执行后就会在es建lagou 这个index. from datetime import datetime fr ...
关于使用Binlog和canal来对MySQL的数据写入进行监控
先说下Binlog和canal是什么吧. 1.Binlog是mysql数据库的操作日志,当有发生增删改查操作时,就会在data目录下生成一个log文件,形如mysql-bin.000001,mysql ...
Swoole 中使用 Context 类管理上下文，防止发生数据错乱
前面的文章中,我们说过:不能使用类静态变量 Class::$array / 全局变量 global $_array / 全局对象属性 $object->array / 其他超全局变量 $GLOB ...
《项目经验》--通过js获取前台数据向一般处理程序传递Json数据，并解析Json数据，将前台传来的Json数据写入数据库表中
先看一下我要实现的功能界面: 这个界面的功能在图中已有展现,课程分配(教师教授哪门课程)在之前的页面中已做好.这个页面主要实现的是授课,即给老师教授的课程分配学生.此页面实现功能的步骤已在页面 ...
通过js获取前台数据向一般处理程序传递Json数据，并解析Json数据，将前台传来的Json数据写入数据库表中
摘自:http://blog.csdn.net/mazhaojuan/article/details/8592015 通过js获取前台数据向一般处理程序传递Json数据,并解析Json数据,将前台传来 ...
ElasticSearch 学习记录之分布式文档存储往ES中存数据和取数据的原理
分布式文档存储 ES分布式特性屏蔽了分布式系统的复杂性集群内的原理垂直扩容和水平扩容真正的扩容能力是来自于水平扩容–为集群添加更多的节点,并且将负载压力和稳定性分散到这些节点中 ES集群特点 ...

随机推荐

python 2.7安装pygame报错解决办法pygame-1.9.4-cp27-cp27m-win_amd64.whl is not a supported wheel on this platform.
python下载python安装包 https://www.lfd.uci.edu/~gohlke/pythonlibs/#pygame 下载完后进入cmd命令行执行安装,报错: pygame-1.9 ...
usb相关
https://github.com/daynix/UsbDk/tree/master/UsbDk 更应该关注下libusb
能用的单纯形法python代码
网上找了一些代码,发现有一些是不能用的,出现错误说集合为空 1.网上出现了好多次,但是不能用的,只能部分模型能用,比如例子中所示原链接:https://www.jianshu.com/p/b233c ...
CSS实现宽度自适应100%，宽高16:9的比例的圖片或者矩形
前言图片的大小是多少,宽度一定,高度要始终自自适应为16:9. 解决 1通过js,程序算出绝对高度再进行设置.这是解决问题最容易想到的方法. 2.我们的原则是能用css实现的功能尽量用css,这有利 ...
2019牛客多校E Androgynos——自补图&&构造
题目给出一个 $n$,判断是否存在 $n$ 个顶点的自补图,如果存在,输出边和映射. 分析一个无向图若同构于它的补图,则称该图为自补图. 定理:一个自补图一定存在 $4k$ 或 $4k+1$ 个顶 ...
BZOJ 5496: [2019省队联测]字符串问题 (后缀数组+主席树优化建图+拓扑排序)
题意略分析考场上写了暴力建图40分溜了-(结果只得了30分) 然后只要优化建边就行了首先给出的支配关系无法优化,就直接A向它支配的B连边. 考虑B向以B作为前缀的所有A连边,做一遍后缀数组,两 ...
python执行ad_hoc
import shutil from collections import namedtuple from ansible.parsing.dataloader import DataLoader f ...
Material icons 全图标一览
Material icons 全图标一览 2018年12月17日 16:52:55 boywcx 阅读数 3090 版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog. ...
springBoot怎样访问静态资源?+静态资源简介
1.静态资源怎样通过浏览器访问静态资源? 注意:不需要加static目录.因为只是告诉springboot目录,而不是静态资源路劲. 这时访问路径就需要加上/static
学院管理系统（mysql版）
需求用户角色,讲师＼学员, 用户登陆后根据角色不同,能做的事情不同,分别如下讲师视图管理班级,可创建班级,根据学员qq号把学员加入班级可创建指定班级的上课纪录,注意一节上课纪录对应多条学员的上 ...