Bboss is a good elasticsearch Java rest client. It operates and accesses elasticsearch in a way similar to mybatis.

BBoss Environmental requirements

JDK requirement: JDK 1.7+

Elasticsearch version requirements: 1.x,2.X,5.X,6.X,+

Spring boot： 1.x,2.x,+

kafka2x-Elasticsearch 数据同步工具demo

兼容 kafka_2.12-2.3.0 系列版本 ,使用本demo所带的应用程序运行容器环境，可以快速编写，打包发布可运行的数据导入工具

支持的 kafka_2.12-2.3.0 系列版本到elasticsearch数据同步

kafka低版本（kafka_2.12-0.10.2.0系列版本）同步工具案例地址：https://gitee.com/bbossgroups/kafka1x-elasticsearch

支持的Elasticsearch版本： 1.x,2.x,5.x,6.x,7.x,+

支持海量PB级数据同步导入功能

使用参考文档

导入maven坐标

<dependency>
  <groupId>com.bbossgroups.plugins</groupId>
  <artifactId>bboss-elasticsearch-rest-kafka2x</artifactId>
  <version>5.9.9</version>
  <scope>compile</scope>
</dependency>

构建部署

准备工作

需要通过gradle构建发布版本,gradle安装配置参考文档：

https://esdoc.bbossgroups.com/#/bboss-build

下载源码工程-基于gradle

https://github.com/bbossgroups/kafka2x-elasticsearch

从上面的地址下载源码工程，然后导入idea或者eclipse，根据自己的需求，修改导入程序逻辑

org.frameworkset.elasticsearch.imp.Kafka2ESdemo

如果需要测试和调试导入功能，运行Kafka2ESdemo的main方法即可即可：

public class Dbdemo {
	public static void main(String args[]){
		Kafka2ESdemo dbdemo = new Kafka2ESdemo();
		boolean dropIndice = true;//CommonLauncher.getBooleanAttribute("dropIndice",false);//同时指定了默认值

		dbdemo.scheduleTimestampImportData(dropIndice);
	}
    .....
}

修改es配置-kafka2x-elasticsearch\src\main\resources\application.properties

修改完毕配置后，就可以进行功能调试了。

测试调试通过后，就可以构建发布可运行的版本了：进入命令行模式，在源码工程根目录kafka2x-elasticsearch 下运行以下gradle指令打包发布版本

release.bat

运行作业

gradle构建成功后，在build/distributions目录下会生成可以运行的zip包，解压运行导入程序

linux：

chmod +x restart.sh

./restart.sh

windows: restart.bat

作业jvm配置

修改jvm.options，设置内存大小和其他jvm参数

-Xms1g

-Xmx1g

作业参数配置

在使用kafka2x-elasticsearch时，为了避免调试过程中不断打包发布数据同步工具，可以将部分控制参数配置到启动配置文件resources/application.properties中,然后在代码中通过以下方法获取配置的参数：

#工具主程序
mainclass=org.frameworkset.elasticsearch.imp.Kafka2ESdemo

# 参数配置
# 在代码中获取方法：CommonLauncher.getBooleanAttribute("dropIndice",false);//同时指定了默认值false
dropIndice=false

在代码中获取参数dropIndice方法：

boolean dropIndice = CommonLauncher.getBooleanAttribute("dropIndice",false);//同时指定了默认值false

另外可以在resources/application.properties配置控制作业执行的一些参数，例如工作线程数，等待队列数，批处理size等等：

queueSize=50
workThreads=10
batchSize=20

在作业执行方法中获取并使用上述参数：

int batchSize = CommonLauncher.getIntProperty("batchSize",10);//同时指定了默认值
int queueSize = CommonLauncher.getIntProperty("queueSize",50);//同时指定了默认值
int workThreads = CommonLauncher.getIntProperty("workThreads",10);//同时指定了默认值
importBuilder.setBatchSize(batchSize);
importBuilder.setQueue(queueSize);//设置批量导入线程池等待队列长度
importBuilder.setThreadCount(workThreads);//设置批量导入线程池工作线程数量

elasticsearch技术交流群:166471282

elasticsearch微信公众号:bbossgroup

码云项目：kafka2x-elasticsearch

磁力搜索网站导航2020更新

https://www.cnblogs.com/cilisousuo/p/12099547.html

kafka2x-Elasticsearch 数据同步工具demo的更多相关文章

Oracle和Elasticsearch数据同步
Python编写Oracle和Elasticsearch数据同步脚本标签: elasticsearchoraclecx_Oraclepython数据同步 Python知识库一.版本 Pyth ...
基于 MySQL Binlog 的 Elasticsearch 数据同步实践原
一.背景随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品.订单等数据的多维度检索. 使用 Elasticsearch 存储业务数据可以 ...
Neo4j与ElasticSearch数据同步
Neo4j与ElasticSearch数据同步针对节点删除,加了一些逻辑,代码地址背景需要强大的检索功能,所有需要被查询的数据都在neo4j. 方案在Server逻辑中直接编写.后端有一个St ...
基于MySQL Binlog的Elasticsearch数据同步实践
一.为什么要做随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品.订单等数据的多维度检索. 使用 Elasticsearch 存储业务数 ...
环境篇：数据同步工具DataX
环境篇:数据同步工具DataX 1 概述 https://github.com/alibaba/DataX DataX是什么? DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 ...
Linux实战教学笔记21:Rsync数据同步工具
第二十一节 Rsync数据同步工具标签(空格分隔): Linux实战教学笔记-陈思齐 ---本教学笔记是本人学习和工作生涯中的摘记整理而成,此为初稿(尚有诸多不完善之处),为原创作品,允许转载,转载 ...
Rsync数据同步工具
Rsync数据同步工具什么是Rsync? Rsync是一款开源的.快速的.多功能的,可以实现全量及增量的本地或原程数据同步备份 ...
Spark记录-阿里巴巴开源工具DataX数据同步工具使用
1.官网下载下载地址:https://github.com/alibaba/DataX DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL.Oracle.SqlSe ...
rsync数据同步工具的配置
rsync数据同步工具的配置 1. rsync介绍 1.1.什么是rsync rsync是一款开源的快速的,多功能的,可实现全量及增量的本地或远程数据同步备份的优秀工具.Rsync软件适用于 unix ...

随机推荐

【安卓逆向】反编译ELF的另类技巧
IDA 反编译 ObjDump反编译 ObjDump是ndk环境自带的一个脚本,在android-ndk-r10c/toolchains/arm-linux-androideabi-4.9/prebu ...
mpvue 小程序使用wx.request请求数据
1.创建src下创建utils/wx-request.js const host = 'http://10.0.0.6:8081' function request (url, method, dat ...
java读/写文件
读取文件参考:https://blog.csdn.net/weixin_42129373/article/details/82154471 写入文件参考:https://blog.csdn.net/B ...
Linux - curl 基本使用
1. 概述我接触过的很多服务端调试, 接口测试, 最终都落到了这个地方简答介绍 curl 的使用尽量循序渐进, 因为我也不太熟悉大概会提到的命令 curl curl -v curl -s cu ...
使用docker容器时遇到的2个问题
最近项目在centOS7服务器上用docker部署了几个服务,在运行的时候发现,总是过一段时间,容器内的根目录就变为只读而无法写入了. 经过调查都是因为docker/devicemapper/devi ...
Go并发介绍
1. 进程.线程.协程进程(Process),线程(Thread),协程(Coroutine,也叫轻量级线程) 进程进程是一个程序在一个数据集中的一次动态执行过程,可以简单理解为“正在执行的程序” ...
数据提取之JSON与JsonPATH
数据提取之JSON与JsonPATH JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,它使得人们很容易的进行阅读和编写.同时也方便了机器进行解析和生成.适 ...
前端之HTML基础篇
HTML基础篇目录本章内容: 简介 1. ...
Subroutine 子程序 Perl 第四章
子程序的定义是全局的,不需要事先声明.若重复定义子程序,后面的覆盖前面的. sub marine { $n +=1; print " Hello ,sailor number $_ ! &q ...
ASP.NET Core搭建多层网站架构【0-前言】
2020/01/26, ASP.NET Core 3.1, VS2019 摘要:基于ASP.NET Core 3.1 WebApi搭建后端多层网站架构目录 0-前言 1-项目结构分层建立 2-公共基 ...

kafka2x-Elasticsearch 数据同步工具demo

BBoss Environmental requirements

kafka2x-Elasticsearch 数据同步工具demo

导入maven坐标

构建部署

准备工作

下载源码工程-基于gradle

运行作业

作业jvm配置

作业参数配置

elasticsearch技术交流群:166471282

elasticsearch微信公众号:bbossgroup

磁力搜索网站导航2020更新

kafka2x-Elasticsearch 数据同步工具demo的更多相关文章

随机推荐

热门专题