Sqoop2入门之导入关系型数据库数据到HDFS上(sqoop2-1.99.4版本)

sqoop2-1.99.4和sqoop2-1.99.3版本操作略有不同：新版本中使用link代替了老版本的connection，其他使用类似。

sqoop2-1.99.4环境搭建参见：Sqoop2环境搭建

sqoop2-1.99.3版本实现参见：Sqoop2入门之导入关系型数据库数据到HDFS上

启动sqoop2-1.99.4版本客户端：

$SQOOP2_HOME/bin/sqoop.sh client

set server --host hadoop000 --port  --webapp sqoop

查看所有connector：

show connector --all

 connector(s) to show:

        Connector with id 1:

            Name: hdfs-connector

            Class: org.apache.sqoop.connector.hdfs.HdfsConnector

            Version: 1.99.-cdh5.3.0

        Connector with id 2:

            Name: generic-jdbc-connector

            Class: org.apache.sqoop.connector.jdbc.GenericJdbcConnector

            Version: 1.99.-cdh5.3.0

查询所有link:

show link

删除指定link:

delete link --lid x

查询所有job:

show job

删除指定job:

delete job --jid 1

创建generic-jdbc-connector类型的connector

create link --cid 2

    Name: First Link

    JDBC Driver Class: com.mysql.jdbc.Driver

    JDBC Connection String: jdbc:mysql://hadoop000:3306/hive

    Username: root

    Password: ****

    JDBC Connection Properties:

    There are currently  values in the map:

    entry# protocol=tcp

    There are currently  values in the map:

    protocol = tcp

    entry#

    New link was successfully created with validation status OK and persistent id 3

show link

+----+-------------+-----------+---------+

| Id |    Name     | Connector | Enabled |

+----+-------------+-----------+---------+

| 3  | First Link  | 2         | true    |

+----+-------------+-----------+---------+

创建hdfs-connector类型的connector：

create link -cid 1

    Name: Second Link

    HDFS URI: hdfs://hadoop000:8020

    New link was successfully created with validation status OK and persistent id 4

show link

+----+-------------+-----------+---------+

| Id |    Name     | Connector | Enabled |

+----+-------------+-----------+---------+

|   | First Link  |          | true    |

|   | Second Link |          | true    |

+----+-------------+-----------+---------+

show link -all

     link(s) to show:

    link with id  and name First Link (Enabled: true, Created by null at -- ??:, Updated by null at -- ??:)

    Using Connector id

      Link configuration

        JDBC Driver Class: com.mysql.jdbc.Driver

        JDBC Connection String: jdbc:mysql://hadoop000:3306/hive

        Username: root

        Password:

        JDBC Connection Properties:

          protocol = tcp

    link with id  and name Second Link (Enabled: true, Created by null at -- ??:, Updated by null at -- ??:)

    Using Connector id

      Link configuration

        HDFS URI: hdfs://hadoop000:8020

根据connector id创建job:

create job -f 3 -t 4

    Creating job for links with from id  and to id

    Please fill following values to create new job object

    Name: Sqoopy

    From database configuration

    Schema name: hive

    Table name: TBLS

    Table SQL statement:

    Table column names:

    Partition column name:

    Null value allowed for the partition column:

    Boundary query: 

    ToJob configuration

    Output format:

       : TEXT_FILE

       : SEQUENCE_FILE

    Choose: 

    Compression format:

       : NONE

       : DEFAULT

       : DEFLATE

       : GZIP

       : BZIP2

       : LZO

       : LZ4

       : SNAPPY

       : CUSTOM

    Choose: 

    Custom compression format:

    Output directory: hdfs://hadoop000:8020/sqoop2/tbls_import_demo_sqoop1.99.4

    Throttling resources

    Extractors:

    Loaders:

    New job was successfully created with validation status OK  and persistent id 2

查询所有job:

show job

+----+--------+----------------+--------------+---------+

| Id |  Name  | From Connector | To Connector | Enabled |

+----+--------+----------------+--------------+---------+

|   | Sqoopy |               |             | true    |

+----+--------+----------------+--------------+---------+

启动指定的job: 该job执行完后查看HDFS上的文件(hdfs fs -ls hdfs://hadoop000:8020/sqoop2/tbls_import_demo_sqoop1.99.4/)

start job --jid

查看指定job的执行状态:

status job --jid

停止指定的job:

stop job --jid

在start job(如：start job --jid 2)时常见错误：

Exception has occurred during processing command

Exception: org.apache.sqoop.common.SqoopException Message: CLIENT_0001:Server has returned exception

在sqoop客户端设置查看job详情：

set option --name verbose --value true

show job --jid

Sqoop2入门之导入关系型数据库数据到HDFS上(sqoop2-1.99.4版本)的更多相关文章

Sqoop2入门之导入关系型数据库数据到HDFS上
需求:将hive数据库中的TBLS表导出到HDFS之上: $SQOOP2_HOME/bin/sqoop.sh client sqoop:> set server --host hadoop000 ...
在Linux环境下，将Solr部署到tomcat7中，导入Mysql数据库数据，定时更新索引
什么是solr solr是基于Lucene的全文搜索服务器,对Lucene进行了扩展优化. 准备工作首先,去下载以下软件包: JDK8:jdk-8u60-linux-x64.tar.gz TOMCA ...
xp下Oracle数据库导入SQLServer数据库数据
Oracle数据库利用ODBC数据源.PLSQL Developer导入SQLServer数据库数据操作: 建立数据源:控制面板→管理工具→数据源 (ODBC) 打开,界面如下: 点击添加,界面如下 ...
postgres导入其他数据库数据
最近对postgres数据库进行深入研究,将原来项目中使用的sqlserver数据库中的数据表导入postgres,网上搜索postgres数据导入,除空间数据库可以通过PostGIS 2.0 Sha ...
RDS关系型数据库入门 01 创建关系型数据库实例【华为云分享】
[摘要] 关系型数据库(Relational Database Service,简称RDS)是一种基于云计算平台的即开即用.稳定可靠.弹性伸缩.便捷管理的在线关系型数据库服务.RDS具有完善的性能监控 ...
MySQL数据库-数据表（上）
数据表的基本操作. MySQL 数据库支持多种数据类型,大致可以分为 3 类:数值类型.日期和时间类型.字符串(字符)类型. (1)数值类型数值类型用于存储数字型数据,这些类型包括整数类型(TINY ...
DB2导入导出数据库数据
导出数据库中数据在db2cmd命令下生成建库脚本(-z指定模式名) db2look -d BBS -z db2admin -u db2admin -e -o bbs.sql 在db2cmd命令下导出 ...
BCP 导入导出数据库数据
使用 bcp 将数据库迁移到 Azure SQL Database --所有都是在本机sql上运行--先开启cmdshellEXEC sp_configure 'show advanced opti ...
【甘道夫】Sqoop1.99.3基础操作--导入Oracle的数据到HDFS
第一步:进入clientShell fulong@FBI008:~$ sqoop.sh client Sqoop home directory: /home/fulong/Sqoop/sqoop-1. ...

随机推荐

安装64位mysql5.626
计算机--右击属性--左上高级系统变量---环境变量 path 添加 mysql 的bin目录 ;D:\mysqlwinx64\bin1 //mysql 5.6.26安装前先解压到d盘根目录 cd D ...
Windows 7中无法访问FTP的解决方法
解决: netsh advfirewall set global StatefulFTP disable
怎么做一个bat文件
怎么做一个bat文件 | 浏览:639 | 更新:2014-11-25 17:02 1 2 3 4 5 6 7 分步阅读其实做一个.BAT文件很简单,下面我就以做一个清除系统垃圾.BAT文件为例,给 ...
php dirname(__FILE__) 获取当前文件的绝对路径 (转)
比如当前文件是放在(d:\www\)下,文件名是test.php. 测试的代码如下: 复制代码代码如下: <?php echo __FILE__ ; // 取得当前文件的绝对地址,结果:D:\ ...
php 判断复选框checkbox是否被选中
php 判断复选框checkbox是否被选中复选框checkbox在php表单提交中经常被使用到,本文章通过实例向大家介绍php如何判断复选框checkbox中的值是否被选中,需要的朋友可以参考 ...
[转]LUA元表
lua元表和元方法 <lua程序设计> 13章读书笔记 lua中每个值都有一个元表,talble和userdata可以有各自独立的元表,而其它类型的值则共享其类型所属的单一元表.lua在 ...
java学习第十一天
第十二次课目标一维数组(创建访问) 一.概念与特点 1.概念相同数据类型的有序集合[] 数组名: 容器的名字元素: 下标变量,数组名[下标] 长度: length 下标: 位置.索引 ...
初探groupcache
groupcache是用于dl.google.com的一个memcached的替代品,相对于memcached,提供更小的功能集和更高的效率,以第三方库的形式提供服务. groupcache的常见部署 ...
python 深拷贝与浅拷贝
浅拷贝的方式有: lst=[1,2,3] (1)直接赋值: lst_cp = lst (2)for循环遍历生成:lst_cp= [i for i in lst] (3)copy模块下,copy.cop ...
web安全之sql注入原理
sql注入的原理: 将(恶意)的SQL命令注入到后台数据库引擎执行的能力,把信息返回到页面 sql注入产生的原因: 过滤不严谨,导致产生的sql注入. sql注入产生的地方: ...

Sqoop2入门之导入关系型数据库数据到HDFS上(sqoop2-1.99.4版本)

Sqoop2入门之导入关系型数据库数据到HDFS上(sqoop2-1.99.4版本)的更多相关文章

随机推荐

热门专题