【甘道夫】Sqoop1.99.3基础操作--导入Oracle的数据到HDFS

第一步：进入clientShell

fulong@FBI008:~$ sqoop.sh client

Sqoop home directory: /home/fulong/Sqoop/sqoop-1.99.3-bin-hadoop200

Sqoop Shell: Type 'help' or '\h' for help.

sqoop:000> set server --host FBI003 --port 12000 --webapp sqoop

Server is set successfully

sqoop:000> show version --all

client version:

Sqoop 1.99.3 revision 2404393160301df16a94716a3034e31b03e27b0b

Compiled by mengweid on Fri Oct 18 14:15:53 EDT 2013

server version:

Sqoop 1.99.3 revision 2404393160301df16a94716a3034e31b03e27b0b

Compiled by mengweid on Fri Oct 18 14:15:53 EDT 2013

Protocol version:

[1]

第二步：创建连接

sqoop:000> create connection --cid 001

Creating connection for connector with id 1

Please fill following values to create new connection object

Name: 147patents

Connection configuration

JDBC Driver Class: oracle.jdbc.driver.OracleDriver

JDBC Connection String: jdbc:oracle:thin:@192.168.0.147:1521:ORCLGBK

Username: zhaobiao

Password: ******

JDBC Connection Properties:

There are currently 0 values in the map:

entry#

Security related configuration options

Max connections:

New connection was successfully created with validation status FINE and persistent id 1

第三步：创建Job

我这里顺便尝试了一下update命令。所以第一遍创建job时输入了错误的tablename：

sqoop:000> create job

Required argument --xid is missing.

sqoop:000> create job --xid 1 --type import

Creating job for connection with id 1

Please fill following values to create new job object

Name: ImportPatents

Database configuration

Schema name: zhaobiao

Table name: zhaobiao

Table SQL statement:

Table column names:

Partition column name:

Nulls in partition column:

Boundary query:

Output configuration

Storage type:

0 : HDFS

Choose:

Output format:

0 : TEXT_FILE

1 : SEQUENCE_FILE

Choose:

Compression format:

0 : NONE

1 : DEFAULT

2 : DEFLATE

3 : GZIP

4 : BZIP2

5 : LZO

6 : LZ4

7 : SNAPPY

Choose:

Output directory: /Data/zhaobiao

Throttling resources

Extractors:

Loaders:

New job was successfully created with validation status FINE and persistent id
1

sqoop:000> update job

Required argument --jid is missing.

sqoop:000> update job --jid 1

Updating job with id 1

Please update job metadata:

Name: ImportPatents

Database configuration

Schema name: zhaobiao

Table name: CMS_NEWS_0625

Table SQL statement:

Table column names:

Partition column name:

Nulls in partition column:

Boundary query:

Output configuration

Storage type:

0 : HDFS

Choose: 0

Output format:

0 : TEXT_FILE

1 : SEQUENCE_FILE

Choose: 0

Compression format:

0 : NONE

1 : DEFAULT

2 : DEFLATE

3 : GZIP

4 : BZIP2

5 : LZO

6 : LZ4

7 : SNAPPY

Choose: 0

Output directory: /Data/zhaobiao

Throttling resources

Extractors:

Loaders:

Job was successfully updated with status FINE

总结：

1.create job时必须指定一个连接id

2.create job完毕后。自己主动分配了一个job id

3.update job时。须要指定job id

4.创建Job过程中指定的Output directory指定的是HDFS中的路径

第四步：运行job

sqoop:000> start job --jid 1

2014-06-27 12:44:17 CST: FAILURE_ON_SUBMIT

Exception: org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory hdfs://fulonghadoop/Data/zhaobiao already exists

sqoop:000> start job --jid 1

Submission details

Job ID: 1

Server URL: http://FBI003:12000/sqoop/

Created by: fulong

Creation date: 2014-06-27 12:44:53 CST

Lastly updated by: fulong

External ID: job_1403248336137_0005

http://FBI003:8088/proxy/application_1403248336137_0005/

2014-06-27 12:44:53 CST: BOOTING - Progress is not available

sqoop:000> status job --jid 1

Submission details

Job ID: 1

Server URL: http://FBI003:12000/sqoop/

Created by: fulong

Creation date: 2014-06-27 12:44:53 CST

Lastly updated by: fulong

External ID: job_1403248336137_0005

http://FBI003:8088/proxy/application_1403248336137_0005/

2014-06-27 12:50:11 CST: RUNNING - 0.00 %

sqoop:000> status job --jid 1

Submission details

Job ID: 1

Server URL: http://FBI003:12000/sqoop/

Created by: fulong

Creation date: 2014-06-27 12:44:53 CST

Lastly updated by: fulong

External ID: job_1403248336137_0005

http://FBI003:8088/proxy/application_1403248336137_0005/

2014-06-27 13:36:49 CST: RUNNING - 25.00 %

sqoop:000> status job --jid 1

Submission details

Job ID: 1

Server URL: http://FBI003:12000/sqoop/

Created by: fulong

Creation date: 2014-06-27 12:44:53 CST

Lastly updated by: fulong

External ID: job_1403248336137_0005

http://FBI003:8088/proxy/application_1403248336137_0005/

2014-06-27 13:39:24 CST: RUNNING - 35.00 %

sqoop:000> status job --jid 1

Submission details

Job ID: 1

Server URL: http://FBI003:12000/sqoop/

Created by: fulong

Creation date: 2014-06-27 12:44:53 CST

Lastly updated by: fulong

External ID: job_1403248336137_0005

http://FBI003:8088/proxy/application_1403248336137_0005/

2014-06-27 13:47:19 CST: RUNNING - 40.00 %

sqoop:000> status job --jid 1

Submission details

Job ID: 1

Server URL: http://FBI003:12000/sqoop/

Created by: fulong

Creation date: 2014-06-27 12:44:53 CST

Lastly updated by: fulong

External ID: job_1403248336137_0005

http://FBI003:8088/proxy/application_1403248336137_0005/

2014-06-27 14:08:36 CST: SUCCEEDED

Counters:

org.apache.hadoop.mapreduce.JobCounter

SLOTS_MILLIS_MAPS: 16499226

TOTAL_LAUNCHED_MAPS: 10

SLOTS_MILLIS_REDUCES: 0

OTHER_LOCAL_MAPS: 15

org.apache.hadoop.mapreduce.lib.output.FileOutputFormatCounter

BYTES_WRITTEN: 421226094

org.apache.hadoop.mapreduce.lib.input.FileInputFormatCounter

BYTES_READ: 0

org.apache.hadoop.mapreduce.TaskCounter

MAP_INPUT_RECORDS: 0

MERGED_MAP_OUTPUTS: 0

PHYSICAL_MEMORY_BYTES: 1185689600

SPILLED_RECORDS: 0

COMMITTED_HEAP_BYTES: 627179520

CPU_MILLISECONDS: 307570

FAILED_SHUFFLE: 0

VIRTUAL_MEMORY_BYTES: 6542311424

SPLIT_RAW_BYTES: 1437

MAP_OUTPUT_RECORDS: 644083

GC_TIME_MILLIS: 5279

org.apache.hadoop.mapreduce.FileSystemCounter

FILE_WRITE_OPS: 0

FILE_READ_OPS: 0

FILE_LARGE_READ_OPS: 0

FILE_BYTES_READ: 0

HDFS_BYTES_READ: 1437

FILE_BYTES_WRITTEN: 931780

HDFS_LARGE_READ_OPS: 0

HDFS_WRITE_OPS: 20

HDFS_READ_OPS: 40

HDFS_BYTES_WRITTEN: 431907904

org.apache.sqoop.submission.counter.SqoopCounters

ROWS_READ: 644083

Job executed successfully

接下来的问题：怎样导入数据到Hbase中？

【甘道夫】Sqoop1.99.3基础操作--导入Oracle的数据到HDFS的更多相关文章

【甘道夫】Win7x64环境下编译Apache Hadoop2.2.0的Eclipse小工具
目标: 编译Apache Hadoop2.2.0在win7x64环境下的Eclipse插件环境: win7x64家庭普通版 eclipse-jee-kepler-SR1-win32-x86_64.z ...
【甘道夫】MapReduce实现矩阵乘法--实现代码
之前写了一篇分析MapReduce实现矩阵乘法算法的文章: [甘道夫]Mapreduce实现矩阵乘法的算法思路为了让大家更直观的了解程序运行,今天编写了实现代码供大家參考. 编程环境: java v ...
Sqoop2入门之导入关系型数据库数据到HDFS上(sqoop2-1.99.4版本)
sqoop2-1.99.4和sqoop2-1.99.3版本操作略有不同:新版本中使用link代替了老版本的connection,其他使用类似. sqoop2-1.99.4环境搭建参见:Sqoop2环境 ...
【甘道夫】Ubuntu14 server + Hadoop2.2.0环境下Sqoop1.99.3部署记录
第一步.下载.解压.配置环境变量: 官网下载sqoop1.99.3 http://mirrors.cnnic.cn/apache/sqoop/1.99.3/ 将sqoop解压到目标文件夹,我的是 /h ...
【甘道夫】Hadoop2.2.0环境使用Sqoop-1.4.4将Oracle11g数据导入HBase0.96，并自己主动生成组合行键
目的: 使用Sqoop将Oracle中的数据导入到HBase中,并自己主动生成组合行键! 环境: Hadoop2.2.0 Hbase0.96 sqoop-1.4.4.bin__hadoop-2.0.4 ...
小白学 Python 数据分析（6）：Pandas （五）基础操作（2）数据选择
人生苦短,我用 Python 前文传送门: 小白学 Python 数据分析(1):数据分析基础小白学 Python 数据分析(2):Pandas (一)概述小白学 Python 数据分析(3):P ...
【甘道夫】HBase基本数据操作的详细说明【完整版，精绝】
介绍之前具体写了一篇HBase过滤器的文章.今天把基础的表和数据相关操作补上. 本文档參考最新(截止2014年7月16日)的官方Ref Guide.Developer API编写. 全部代码均基于& ...
【甘道夫】HBase基本数据操作详解【完整版，绝对精品】
引言之前详细写了一篇HBase过滤器的文章,今天把基础的表和数据相关操作补上. 本文档参考最新(截止2014年7月16日)的官方Ref Guide.Developer API编写. 所有代码均基于“ ...
【甘道夫】HBase（0.96以上版本号）过滤器Filter具体解释及实例代码
说明: 本文參考官方Ref Guide,Developer API和众多博客.并结合实測代码编写.具体总结HBase的Filter功能,并附上每类Filter的对应代码实现. 本文尽量遵从Ref Gu ...

随机推荐

样本方差的无偏估计与（n-1）的由来
一.无偏估计所谓总体参数估计量的无偏性指的是,基于不同的样本,使用该估计量可算出多个估计值,但它们的平均值等于被估参数的真值. 在某些场合下,无偏性的要求是有实际意义的.例如,假设在某厂商与某销售商 ...
DCL授权命令
create user 用户名//创建用户 grant DBA to 用户名//授权 revoke //撤销权限
洛谷 P1617 爱与愁的一千个伤心的理由
P1617 爱与愁的一千个伤心的理由题目背景 (本道题目隐藏了两首歌名,找找看哪~~~) <爱与愁的故事第一弹·heartache>第二章. 经历了心痛后,爱与愁大神不行了. 题目描述 ...
Eureka Server的REST端点
Eureka Server的REST端点 Windows下面可以安装Curl: 使用more命令可以显示xml内容: D:\Java\IdeaProjects>more rest-api-tes ...
nyoj--236--心急的C小加（动态规划&&LIS）
心急的C小加时间限制:1000 ms | 内存限制:65535 KB 难度:4 描述 C小加有一些木棒,它们的长度和质量都已经知道,需要一个机器处理这些木棒,机器开启的时候需要耗费一个单位的时间 ...
ORA-00980:synonym translation is no longer valid
今天要把测试环境DB的数据更新成最新Production环境的数据,期间发生了一些问题: 1.首先从正式环境exp出想要用户的dmp档 2.drop掉测试环境底下相应用户 3.create测试环境底下 ...
HD-ACM算法专攻系列（6）——Big Number
题目描述: 源码: #include"iostream" #include"cmath" using namespace std; #define PI 3.1 ...
51nod 2020 排序相减（暴力解法）
题目: 代码: #include <bits\stdc++.h> using namespace std; int trim(int x){ ]; ;i < ; i++){ a[i] ...
如何在SQLServer中处理每天四亿三千万记录的
项目背景这是给某数据中心做的一个项目,项目难度之大令人发指,这个项目真正的让我感觉到了,商场如战场,而我只是其中的一个小兵,太多的战术,太多的高层之间的较量,太多的内幕了.具体这个项目的情况,我有空 ...
「JavaSE 重新出发」02. 数据类型与运算符
「TOC」 Java 程序基本要求 Java 数据类型基本数据类型复合数据类型运算符逻辑运算符位运算符运算符优先级 Java 程序基本要求 public class : 一个 Java 文 ...

【甘道夫】Sqoop1.99.3基础操作--导入Oracle的数据到HDFS

【甘道夫】Sqoop1.99.3基础操作--导入Oracle的数据到HDFS的更多相关文章

随机推荐

热门专题