Elasticsearch 2.3.2 从oracle中同步数据

 

1         数据批量导入-oracle

采用 elasticsearch-jdbc 插件 安装.版本需要ES版本一致

最新 elasticsearch-jdbc 需要 jdk 1.8的支持

1.1   安装 elasticsearch-jdbc

下载elasticsearch-jdbc-2.3.2.0-dist.zip 并解压

将 oracle 驱动jar包 拷贝到elasticsearch-jdbc-2.3.2.0-dist\lib\ 文件夹下

1.2   编写bat脚本

进入 elasticsearch-jdbc-2.3.2.0-dist\bin

创建 oracle_to_es.bat

@echo off

set DIR=%~dp0

set LIB=%DIR%..\lib\*

set BIN=%DIR%..\bin

set JAVA_HOME=C:\Program   Files\Java\jdk1.8.0_92

echo {^

"type" : "jdbc",^

"jdbc" : {^

"url" :   "jdbc:oracle:thin:@192.168.173.232:1521:adb1",^

"user" : "wee3",^

"password" : "wee3",^

"sql" :  "select   content as \"content\",title as \"title\",author as   \"author\",to_char(publish_date,'YYYY/MM/DD') as \"publish_date\",category   as \"category\" from TEST_ES",^

"elasticsearch" : {^

"cluster" :   "elasticsearch",^

"host" :   "localhost",^

"port" : 9300^

},^

"index" : "test",^

"type" : "news"^

}^

}^ | "%JAVA_HOME%\bin\java" -cp   "%LIB%" -Dlog4j.configurationFile="%BIN%\log4j2.xml"   "org.xbib.tools.Runner" "org.xbib.tools.JDBCImporter"

删除 index重新创建 并导入数据

@echo off

curl -XDELETE   "http://localhost:9200/test/"

set DIR=%~dp0

set LIB=%DIR%..\lib\*

set BIN=%DIR%..\bin

set JAVA_HOME=C:\Program   Files\Java\jdk1.8.0_92

echo {^

"type" : "jdbc",^

"jdbc" : {^

"url" :   "jdbc:oracle:thin:@192.168.173.232:1521:adb1",^

"user" : "wee3",^

"password" : "wee3",^

"sql" :  "select   content as \"content\",title as \"title\",author as   \"author\",to_char(publish_date,'YYYY/MM/DD') as   \"publish_date\",category as \"category\" from   TEST_ES",^

"elasticsearch" : {^

"cluster" :   "elasticsearch",^

"host" :   "localhost",^

"port" : 9300^

},^

"index" : "test",^

"type" : "news",^

"index_settings" : {^

"index": {^

"number_of_replicas":   "1",^

"number_of_shards":   "5"^

}^

},^

"type_mapping": {^

"news": {^

"properties": {^

"content": {^

"analyzer":   "ik",^

"type":   "string"^

},^

"author": {^

"index":   "not_analyzed",^

"type":   "string"^

},^

"title": {^

"analyzer":   "ik",^

"boost": 5,^

"type":   "string"^

},^

"category": {^

"index":   "not_analyzed",^

"type":   "string"^

},^

"publish_date": {^

"format": "yyyy/mm/dd",^

"type": "date"^

}^

}^

}^

}^

}^

}^ | "%JAVA_HOME%\bin\java" -cp   "%LIB%" -Dlog4j.configurationFile="%BIN%\log4j2.xml"   "org.xbib.tools.Runner" "org.xbib.tools.JDBCImporter"

Elasticsearch 2.3.2 从oracle中同步数据的更多相关文章

  1. oracle中的数据对象

    oracle中的数据对象有表.视图.索引.序列等 表的相关操作 1.创建表 方式一: 方式二:create table person( create table person1 id number(1 ...

  2. 在Oracle中更新数据时,抛出:ORA-01008: not all variables bound

    在Oracle中更新数据时,抛出了一个 :ORA-01008 not all variables bound, 我的理解是不是所有的变量/参数都有边界,不懂: 后来知道了,原来是“不是所有变量/参数都 ...

  3. MyBatis在Oracle中插入数据并返回主键的问题解决

    引言:  在MyBatis中,希望在Oracle中插入数据之时,同一时候返回主键值,而非插入的条数... 环境:MyBatis 3.2 , Oracle. Spring 3.2   SQL Snipp ...

  4. Sqoop_具体总结 使用Sqoop将HDFS/Hive/HBase与MySQL/Oracle中的数据相互导入、导出

    一.使用Sqoop将MySQL中的数据导入到HDFS/Hive/HBase watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvYWFyb25oYWRvb3A=/ ...

  5. 实现从Oracle增量同步数据到GreenPlum

    简介: GreenPlum是一个基于PostgreSQL数据库开发的MPP架构的数据库仓库,适用于OLAP系统,支持50PB(1PB=1000TB)级海量数据的存储和处理. 背景: 目前有一个业务是需 ...

  6. Oracle中读取数据一些原理研究

    文章很多摘录了 http://blog.163.com/liaoxiangui@126/blog/static/7956964020131069843572/ 同时基于这篇文章的基础上,补充一些学习要 ...

  7. SQL数据同步到ElasticSearch(三)- 使用Logstash+LastModifyTime同步数据

    在系列开篇,我提到了四种将SQL SERVER数据同步到ES中的方案,本文将采用最简单的一种方案,即使用LastModifyTime来追踪DB中在最近一段时间发生了变更的数据. 安装Java 安装部分 ...

  8. 如何用Excel直接查询Oracle中的数据

    将Oracle中查询的数据保存为Excel文件,通常使用的是PL/SQL Developer. 其实,Excel可直接写SQL语句查询Oracle中数据,在这里,用到ODBC驱动.详细步骤如下: 一. ...

  9. 浅谈Oracle中物理结构(数据文件等。。。)与逻辑结构(表空间等。。。。。)

    初始Oracle时很难理解其中的物理结构和逻辑结构,不明白内存中和硬盘中文件的区别和联系,我也是初学Oracle,这里就简单的谈谈我我看法. 首先,你需要明白的一点是:数据库的物理结构是由数据库的操作 ...

随机推荐

  1. BOOT项目依赖另外一个模块的包,开发的时候都正常,执行clean package打包成jar时却提示依赖的模块包不存在。

    我在service1模块里依赖了common模块,开发的时候包都能正常引用到,启动也能正常测试访问,可是奇怪的是,当我要打包成jar包时,就提示service1里依赖common的包都不存在,之前从没 ...

  2. 使用Java语言开发微信公众平台(五)——被关注回复与关键词回复

      在上一篇文章中,我们实现了文本消息的接收与响应.可以在用户发送任何内容的时候,回复一段固定的文字.本章节中,我们将对上一章节的代码进行适当的完善,同时实现[被关注回复与关键词回复]功能. 一.微信 ...

  3. (JavaScript基础向)日常小发现:forEach等函数的第二个参数的用法

    forEach函数用得平时用得比较多,但是从来没想到forEach函数还有第二个参数. 这里是菜鸟教程对forEach函数的详细说明:forEach的详细说明. 如上图,forEach函数有第二个参数 ...

  4. axel---下载工具

    axel是Linux下一个不错的HTTP/ftp高速下载工具.支持多线程下载.断点续传,且可以从多个地址或者从一个地址的多个连接来下载同一个文件.适合网速不给力时多线程下载提高下载速度.比如在国内VP ...

  5. php excel文件导出之phpExcel扩展库

    php Excel  文件导出 phpExcel 官网 http://phpexcel.codeplex.com/ /** * 导出特定文件 * 依据详细情况而定 */ public function ...

  6. js面向对象3-继承

    一.了解继承  首先我们一起了解下js中继承,其实继承就是后辈继承前辈的属性和方法. 二.继承的方法 从父类继承属性和方法 这是对象冒充的方法,模仿java的继承方法.实现的原理是,通过改变父类的执行 ...

  7. BZOJ1444: [Jsoi2009]有趣的游戏(Trie图,矩乘)

    Description Input 注意 是0<=P, n , l, m≤ 10. Output Sample Input input 1 3 2 2 1 2 1 2 AB BA AA inpu ...

  8. Python中对于GIL全局解释器锁的一点理解

    GIL全局解释器锁 python最初开发时,开发人只考虑到了单核CPU的,为解决多线程运算之间的数据完整性和状态同步选择了加锁的方式.即GIL锁. 而目前的CPU都有多个核心,在运行python的某个 ...

  9. POJ——T2271 Guardian of Decency

    http://poj.org/problem?id=2771 Time Limit: 3000MS   Memory Limit: 65536K Total Submissions: 5932   A ...

  10. Python编写Appium测试用例(2)

    #coding=utf-8import os,sysimport unittestfrom appium import webdriverimport timefrom selenium.webdri ...