FlinkX的安装与简单使用
- FlinkX的安装
- FlinkX的简单使用

FlinkX的安装与简单使用

FlinkX的安装与简单使用
- FlinkX的安装
- FlinkX的简单使用

FlinkX的安装

安装unzip：yum install unzip

1、上传并解压

unzip flinkx-1.10.zip -d /usr/local/soft/

2、配置环境变量

3、给bin/flinkx这个文件加上执行权限

chmod a+x flinkx

4、修改配置文件，设置运行端口

vim flinkconf/flink-conf.yaml

## web服务端口，不指定的话会随机生成一个

rest.bind-port: 8888

配置环境变量、

vim /etc/profile

FLINKX_HOME=

flinkX开源网址：https://github.com/DTStack/flinkx

FlinkX的简单使用

读取mysql中student表中数据

{

  "job": {

    "content": [

      {

        "reader": {

          "parameter": {

            "username": "root",

            "password": "123456",

            "connection": [{

              "jdbcUrl": ["jdbc:mysql://master:3306/student?userSSL=false&useUnicode=true&characterEncoding=utf8"],

              "table": ["student"]

            }],

            "column": ["*"],

            "customSql": "",

            "where": "id > 1500100900",

            "splitPk": "id",

            "queryTimeOut": 1000

          },

          "name": "mysqlreader"

        },

        "writer": {

          "name": "streamwriter",

          "parameter": {

            "print": true

          }

        }

      }

    ],

    "setting": {

      "speed": {

        "channel": 3,

        "bytes": 0

      },

      "errorLimit": {

        "record": 100

      },

      "restore": {

        "maxRowNumForCheckpoint": 0,

        "isRestore": false,

        "restoreColumnName": "",

        "restoreColumnIndex": 0

      },

      "log" : {

        "isLogger": false,

        "level" : "debug",

        "path" : "",

        "pattern":""

      }

    }

  }

}

FlinkX本地运行

flinkx -mode local -job flinkx3.json -pluginRoot ../syncplugins -flinkconf ../flinkconf

运行时文件所处路径为：/usr/local/soft/flinkx-1.10/package

MySQLToHDFS

配置文件

{

    "job": {

        "content": [

            {

                "reader": {

                    "parameter": {

                        "username": "root",

                        "password": "123456",

                        "connection": [

                            {

                                "jdbcUrl": [

                                    "jdbc:mysql://master:3306/student?characterEncoding=utf8"

                                ],

                                "table": [

                                    "student"

                                ]

                            }

                        ],

                        "column": [

                            "*"

                        ],

                        "customSql": "",

                        "where": "clazz = '理科二班'",

                        "splitPk": "",

                        "queryTimeOut": 1000,

                        "requestAccumulatorInterval": 2

                    },

                    "name": "mysqlreader"

                },

                "writer": {

                    "name": "hdfswriter",

                    "parameter": {

                        "path": "hdfs://master:9000/data/flinkx/student",

                        "defaultFS": "hdfs://master:9000",

                        "column": [

                            {

                                "name": "col1",

                                "index": 0,

                                "type": "string"

                            },

                            {

                                "name": "col2",

                                "index": 1,

                                "type": "string"

                            },

                            {

                                "name": "col3",

                                "index": 2,

                                "type": "string"

                            },

                            {

                                "name": "col4",

                                "index": 3,

                                "type": "string"

                            },

                            {

                                "name": "col5",

                                "index": 4,

                                "type": "string"

                            },

                            {

                                "name": "col6",

                                "index": 5,

                                "type": "string"

                            }

                        ],

                        "fieldDelimiter": ",",

                        "fileType": "text",

                        "writeMode": "overwrite"

                    }

                }

            }

        ],

        "setting": {

            "restore": {

                "isRestore": false,

                "isStream": false

            },

            "errorLimit": {},

            "speed": {

                "channel": 1

            }

        }

    }

}

启动任务

flinkx -mode local -job /usr/local/soft/flinkx-1.10/jsonConf/mysqlToHDFS.json -pluginRoot /usr/local/soft/flinkx-1.10/syncplugins/ -flinkconf /usr/local/soft/flinkx-1.10/flinkconf/

监听日志

flinkx 任务启动后，会在执行命令的目录下生成一个nohup.out文件

tail -f nohup.out

通过web界面查看任务运行情况

http://master:8888

MySQLToHive

配置文件

{

    "job": {

        "content": [

            {

                "reader": {

                    "parameter": {

                        "username": "root",

                        "password": "123456",

                        "connection": [

                            {

                                "jdbcUrl": [

                                    "jdbc:mysql://master:3306/student?characterEncoding=utf8"

                                ],

                                "table": [

                                    "student"

                                ]

                            }

                        ],

                        "column": [

                            "*"

                        ],

                        "customSql": "",

                        "where": "clazz = '文科二班'",

                        "splitPk": "id",

                        "queryTimeOut": 1000,

                        "requestAccumulatorInterval": 2

                    },

                    "name": "mysqlreader"

                },

                "writer": {

                    "name": "hivewriter",

                    "parameter": {

                        "jdbcUrl": "jdbc:hive2://master:10000/testflinkx",

                        "username": "",

                        "password": "",

                        "fileType": "text",

                        "fieldDelimiter": ",",

                        "writeMode": "overwrite",

                        "compress": "",

                        "charsetName": "UTF-8",

                        "maxFileSize": 1073741824,

                        "tablesColumn": "{\"student\":[{\"key\":\"id\",\"type\":\"string\"},{\"key\":\"name\",\"type\":\"string\"},{\"key\":\"age\",\"type\":\"string\"}]}",

                        "defaultFS": "hdfs://master:9000"

                    }

                }

            }

        ],

        "setting": {

            "restore": {

                "isRestore": false,

                "isStream": false

            },

            "errorLimit": {},

            "speed": {

                "channel": 3

            }

        }

    }

}

在hive中创建testflinkx数据库，并创建student分区表

create database testflinkx;

use testflinkx;

CREATE TABLE `student`(

  `id` string,

  `name` string,

  `age` string)

PARTITIONED BY (

  `pt` string)

ROW FORMAT DELIMITED

  FIELDS TERMINATED BY ','

启动hiveserver2

# 第一种方式：

hiveserver2

# 第二种方式:

hive --service hiveserver2

启动任务

flinkx -mode local -job /usr/local/soft/flinkx-1.10/jsonConf/mysqlToHive.json -pluginRoot /usr/local/soft/flinkx-1.10/syncplugins/ -flinkconf /usr/local/soft/flinkx-1.10/flinkconf/

查看日志及运行情况同上

MySQLToHBase

配置文件

{

    "job": {

        "content": [

            {

                "reader": {

                    "parameter": {

                        "username": "root",

                        "password": "123456",

                        "connection": [

                            {

                                "jdbcUrl": [

                                    "jdbc:mysql://master:3306/student?characterEncoding=utf8"

                                ],

                                "table": [

                                    "score"

                                ]

                            }

                        ],

                        "column": [

                            "*"

                        ],

                        "customSql": "",

                        "splitPk": "student_id",

                        "queryTimeOut": 1000,

                        "requestAccumulatorInterval": 2

                    },

                    "name": "mysqlreader"

                },

                "writer": {

                    "name": "hbasewriter",

                    "parameter": {

                        "hbaseConfig": {

                            "hbase.zookeeper.property.clientPort": "2181",

                            "hbase.rootdir": "hdfs://master:9000/hbase",

                            "hbase.cluster.distributed": "true",

                            "hbase.zookeeper.quorum": "master,node1,node2",

                            "zookeeper.znode.parent": "/hbase"

                        },

                        "table": "testFlinkx",

                        "rowkeyColumn": "$(cf1:student_id)_$(cf1:course_id)",

                        "column": [

                            {

                                "name": "cf1:student_id",

                                "type": "string"

                            },

                            {

                                "name": "cf1:course_id",

                                "type": "string"

                            },

                            {

                                "name": "cf1:score",

                                "type": "string"

                            }

                        ]

                    }

                }

            }

        ],

        "setting": {

            "restore": {

                "isRestore": false,

                "isStream": false

            },

            "errorLimit": {},

            "speed": {

                "channel": 3

            }

        }

    }

}

启动hbase 并创建testflinkx表

create 'testFlinkx','cf1'

启动任务

flinkx -mode local -job /usr/local/soft/flinkx-1.10/jsonConf/mysqlToHBase.json -pluginRoot /usr/local/soft/flinkx-1.10/syncplugins/ -flinkconf /usr/local/soft/flinkx-1.10/flinkconf/

查看日志及运行情况同上

MySQLToMySQL

配置文件

{

    "job": {

      "content": [

        {

          "reader": {

            "name": "mysqlreader",

            "parameter": {

              "column": [

                {

                  "name": "id",

                  "type": "int"

                },

                {

                  "name": "name",

                  "type": "string"

                },

                {

                  "name": "age",

                  "type": "int"

                },

                {

                  "name": "gender",

                  "type": "string"

                },

                {

                  "name": "clazz",

                  "type": "string"

                }

              ],

              "username": "root",

              "password": "123456",

              "connection": [

                {

                  "jdbcUrl": [

                    "jdbc:mysql://master:3306/student?useSSL=false"

                  ],

                  "table": [

                    "student"

                  ]

                }

              ]

            }

          },

          "writer": {

            "name": "mysqlwriter",

            "parameter": {

              "username": "root",

              "password": "123456",

              "connection": [

                {

                  "jdbcUrl": "jdbc:mysql://master:3306/student?useSSL=false",

                  "table": [

                    "student2"

                  ]

                }

              ],

              "writeMode": "insert",

              "column": [

                {

                    "name": "id",

                    "type": "int"

                  },

                  {

                    "name": "name",

                    "type": "string"

                  },

                  {

                    "name": "age",

                    "type": "int"

                  },

                  {

                    "name": "gender",

                    "type": "string"

                  },

                  {

                    "name": "clazz",

                    "type": "string"

                  }

              ]

            }

          }

        }

      ],

      "setting": {

        "speed": {

          "channel": 1,

          "bytes": 0

        }

      }

    }

  }

数据集成工具—FlinkX的更多相关文章

数据集成工具Kettle、Sqoop、DataX的比较
数据集成工具很多,下面是几个使用比较多的开源工具. 1.阿里开源软件:DataX DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL.Oracle等).H ...
数据集成工具Teiid Designer的环境搭建
由于实验室项目要求的关系,看了些数据汇聚工具 Teiid 的相关知识.这里总结下 Teiid 的可视化配置工具 Teiid Designer 的部署过程. 背景知识数据集成是把不同来源.格式.特点性 ...
数据集成工具：Teiid实践
数据集成是把不同来源.格式.特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享.数据集成的方式多种多样,这里介绍的 Teiid 是其中的一种:通过抽象和联邦技术,实现分布式数据源的 ...
数据集成工具—Sqoop
数据集成/采集/同步工具 @ 目录数据集成/采集/同步工具 Sqoop简介 Sqoop安装 1.上传并解压 2.修改文件夹名字 3.修改配置文件 4.修改环境变量 5.添加MySQL连接驱动 6.测 ...
【ODI】| 数据ETL：从零开始使用Oracle ODI完成数据集成（一）
0. 环境说明及软件准备 ODI(Oracle Data Integrator)是Oracle公司提供的一种数据集成工具,能高效地实现批量数据的抽取.转换和加载.ODI可以实现当今大多数的主流关系型数 ...
Tapdata 肖贝贝：实时数据引擎系列(六)-从 PostgreSQL 实时数据集成看增量数据缓存层的必要性
摘要:对于 PostgreSQL 的实时数据采集, 业界经常遇到了包括:对源库性能/存储影响较大, 采集性能受限, 时间回退重新同步不支持, 数据类型较复杂等等问题.Tapdata 在解决 Pos ...
[Hadoop 周边] Hadoop和大数据：60款顶级大数据开源工具（2015-10-27）【转】
说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱.弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hado ...
Hadoop和大数据：60款顶级大数据开源工具
一.Hadoop相关工具 1. Hadoop Apache的Hadoop项目已几乎与大数据划上了等号.它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算. 支持的操作系统: ...
【转载】Hadoop和大数据：60款顶级大数据开源工具
一.Hadoop相关工具 1. Hadoop Apache的Hadoop项目已几乎与大数据划上了等号.它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算. 支持的操作系统: ...

随机推荐

攻防世界杂项 11.simple_transfer
题目描述: 文件里有flag,找到它. 题目分析: 文件解压后是一个抓包流量分析文件,用 wireshark 打开后,用分组字节流搜索 flag,追踪 TCP 流,可以隐约看到有 file.pdf, ...
身份证归属地查询免费api接口
描写叙述 :依据身份证编号查询归属地信息. 调用地址: http://api.k780.com:88/? app=idcard.get&idcard=510103195309280011&a ...
TypeError: Error when calling the metaclass bases Cannot create a consistent method resolution
Python Error when calling the metaclass bases Cannot create a consistent method resolution order (MR ...
linux 内核源代码情景分析——Intel X86 CPU 系列的寻址方式
当我们说一个CPU是"16位"或"32"位时,指的是处理器中"算数逻辑单元"(ALU)的宽度.数据总线通常与ALU具有相同的宽度.当Inte ...
Iptables 代理局域网内的主机上网
参考连接:https://developer.aliyun.com/article/607330 环境为云环境,有外网主机的IP为192.168.0.39,无外网主机的IP为192.168.0.228 ...
二层组网AP上线
一.实验目的 1)掌握配置WLAN源接口的命令 2)掌握配置DHCP服务器的命令 3)掌握手工确认AP上线的方法a 二.实验仪器设备及软件仪器设备:一台AC,四台AP 软件:ENSP 三.实验原理 ...
k8s入坑之路（11）kubernetes服务发现
kubernetes访问场景 1.集群内部访问 2.集群内部访问外部 3.集群外部访问内部 1.集群内部访问 1.pod之间直接ip通讯(利用calico通过路由表经过三层将ip流量转发)由于容器之间 ...
JMeter进行压力测试时查看服务器的资源使用
用户想要使用Jmeter监控所测试的服务器的资源使用情况,需要有Jmeter客户端插件和服务端插件 1.客户端插件下载地址:https://jmeter-plugins.org/install/In ...
ThreadPoolExecutor里面4种拒绝策略（详细）
ThreadPoolExecutor类实现了ExecutorService接口和Executor接口,可以设置线程池corePoolSize,最大线程池大小,AliveTime,拒绝策略等.常用构造方 ...
SQL 添加列，删除列，修改列的类型
alter table 表名 add 列名数据类型如:alter table student add nickname char(20) alter table tableName(表名) add ...

数据集成工具—FlinkX

FlinkX的安装与简单使用

FlinkX的安装

FlinkX的简单使用

读取mysql中student表中数据

FlinkX本地运行

MySQLToHDFS

MySQLToHive

MySQLToHBase

MySQLToMySQL

数据集成工具—FlinkX的更多相关文章

随机推荐

热门专题