sqoop1.99.4 JAVA API操作

貌似天国还没有介绍1.99.4的java操作代码的，自己吃一次螃蟹吧

如果你是MAVEN项目

 <dependency>

   <groupId>org.apache.sqoop</groupId>

     <artifactId>sqoop-client</artifactId>

     <version>1.99.4</version>

 </dependency>

如果你是java项目

导入sqoop1.99.4中shell目录下的lib里面全部jar包就行(不用server中的）

HDFS->MYSQL

 package org.admln.sqoopOperate;

 import org.apache.sqoop.client.SqoopClient;

 import org.apache.sqoop.model.MFromConfig;

 import org.apache.sqoop.model.MJob;

 import org.apache.sqoop.model.MLink;

 import org.apache.sqoop.model.MLinkConfig;

 import org.apache.sqoop.model.MSubmission;

 import org.apache.sqoop.model.MToConfig;

 import org.apache.sqoop.submission.counter.Counter;

 import org.apache.sqoop.submission.counter.CounterGroup;

 import org.apache.sqoop.submission.counter.Counters;

 import org.apache.sqoop.validation.Status;

 public class HDFSToMysql {

     public static void main(String[] args) {

         sqoopTransfer();

     }

     public static void sqoopTransfer() {

         //初始化

         String url = "http://hadoop:12000/sqoop/";

         SqoopClient client = new SqoopClient(url);

         //创建一个源链接 HDFS

         long fromConnectorId = 1;

         MLink fromLink = client.createLink(fromConnectorId);

         fromLink.setName("HDFS connector");

         fromLink.setCreationUser("admln");

         MLinkConfig fromLinkConfig = fromLink.getConnectorLinkConfig();

         fromLinkConfig.getStringInput("linkConfig.uri").setValue("hdfs://hadoop:8020/");

         Status fromStatus = client.saveLink(fromLink);

         if(fromStatus.canProceed()) {

          System.out.println("创建HDFS Link成功，ID为: " + fromLink.getPersistenceId());

         } else {

          System.out.println("创建HDFS Link失败");

         }

         //创建一个目的地链接 JDBC

         long toConnectorId = 2;

         MLink toLink = client.createLink(toConnectorId);

         toLink.setName("JDBC connector");

         toLink.setCreationUser("admln");

         MLinkConfig toLinkConfig = toLink.getConnectorLinkConfig();

         toLinkConfig.getStringInput("linkConfig.connectionString").setValue("jdbc:mysql://hadoop:3306/hive");

         toLinkConfig.getStringInput("linkConfig.jdbcDriver").setValue("com.mysql.jdbc.Driver");

         toLinkConfig.getStringInput("linkConfig.username").setValue("hive");

         toLinkConfig.getStringInput("linkConfig.password").setValue("hive");

         Status toStatus = client.saveLink(toLink);

         if(toStatus.canProceed()) {

          System.out.println("创建JDBC Link成功，ID为: " + toLink.getPersistenceId());

         } else {

          System.out.println("创建JDBC Link失败");

         }

         //创建一个任务

         long fromLinkId = fromLink.getPersistenceId();

         long toLinkId = toLink.getPersistenceId();

         MJob job = client.createJob(fromLinkId, toLinkId);

         job.setName("HDFS to MySQL job");

         job.setCreationUser("admln");

         //设置源链接任务配置信息

         MFromConfig fromJobConfig = job.getFromJobConfig();

         fromJobConfig.getStringInput("fromJobConfig.inputDirectory").setValue("/out/aboutyunLog/HiveExport/ipstatistical/data");

         //创建目的地链接任务配置信息

         MToConfig toJobConfig = job.getToJobConfig();

         toJobConfig.getStringInput("toJobConfig.schemaName").setValue("aboutyunlog");

         toJobConfig.getStringInput("toJobConfig.tableName").setValue("ipstatistical");

         //toJobConfig.getStringInput("fromJobConfig.partitionColumn").setValue("id");

         // set the driver config values

         //MDriverConfig driverConfig = job.getDriverConfig();

         //driverConfig.getStringInput("throttlingConfig.numExtractors").setValue("3");//这句还没弄明白

         Status status = client.saveJob(job);

         if(status.canProceed()) {

          System.out.println("JOB创建成功，ID为: "+ job.getPersistenceId());

         } else {

          System.out.println("JOB创建失败。");

         }

         //启动任务

         long jobId = job.getPersistenceId();

         MSubmission submission = client.startJob(jobId);

         System.out.println("JOB提交状态为 : " + submission.getStatus());

         while(submission.getStatus().isRunning() && submission.getProgress() != -1) {

           System.out.println("进度 : " + String.format("%.2f %%", submission.getProgress() * 100));

           //三秒报告一次进度

           try {

             Thread.sleep(3000);

           } catch (InterruptedException e) {

             e.printStackTrace();

           }

         }

         System.out.println("JOB执行结束... ...");

         System.out.println("Hadoop任务ID为 :" + submission.getExternalId());

         Counters counters = submission.getCounters();

         if(counters != null) {

           System.out.println("计数器:");

           for(CounterGroup group : counters) {

             System.out.print("\t");

             System.out.println(group.getName());

             for(Counter counter : group) {

               System.out.print("\t\t");

               System.out.print(counter.getName());

               System.out.print(": ");

               System.out.println(counter.getValue());

             }

           }

         }

         if(submission.getExceptionInfo() != null) {

           System.out.println("JOB执行异常，异常信息为 : " +submission.getExceptionInfo());

         }

         System.out.println("HDFS通过sqoop传输数据到MySQL统计执行完毕");

     }

 }

MYSQL->HDFS

 package org.admln.sqoopOperate;

 import org.apache.sqoop.client.SqoopClient;

 import org.apache.sqoop.model.MDriverConfig;

 import org.apache.sqoop.model.MFromConfig;

 import org.apache.sqoop.model.MJob;

 import org.apache.sqoop.model.MLink;

 import org.apache.sqoop.model.MLinkConfig;

 import org.apache.sqoop.model.MSubmission;

 import org.apache.sqoop.model.MToConfig;

 import org.apache.sqoop.submission.counter.Counter;

 import org.apache.sqoop.submission.counter.CounterGroup;

 import org.apache.sqoop.submission.counter.Counters;

 import org.apache.sqoop.validation.Status;

 public class MysqlToHDFS {

     public static void main(String[] args) {

         sqoopTransfer();

     }

     public static void sqoopTransfer() {

         //初始化

         String url = "http://hadoop:12000/sqoop/";

         SqoopClient client = new SqoopClient(url);

         //创建一个源链接 JDBC

         long fromConnectorId = 2;

         MLink fromLink = client.createLink(fromConnectorId);

         fromLink.setName("JDBC connector");

         fromLink.setCreationUser("admln");

         MLinkConfig fromLinkConfig = fromLink.getConnectorLinkConfig();

         fromLinkConfig.getStringInput("linkConfig.connectionString").setValue("jdbc:mysql://hadoop:3306/hive");

         fromLinkConfig.getStringInput("linkConfig.jdbcDriver").setValue("com.mysql.jdbc.Driver");

         fromLinkConfig.getStringInput("linkConfig.username").setValue("hive");

         fromLinkConfig.getStringInput("linkConfig.password").setValue("hive");

         Status fromStatus = client.saveLink(fromLink);

         if(fromStatus.canProceed()) {

          System.out.println("创建JDBC Link成功，ID为: " + fromLink.getPersistenceId());

         } else {

          System.out.println("创建JDBC Link失败");

         }

         //创建一个目的地链接HDFS

         long toConnectorId = 1;

         MLink toLink = client.createLink(toConnectorId);

         toLink.setName("HDFS connector");

         toLink.setCreationUser("admln");

         MLinkConfig toLinkConfig = toLink.getConnectorLinkConfig();

         toLinkConfig.getStringInput("linkConfig.uri").setValue("hdfs://hadoop:8020/");

         Status toStatus = client.saveLink(toLink);

         if(toStatus.canProceed()) {

          System.out.println("创建HDFS Link成功，ID为: " + toLink.getPersistenceId());

         } else {

          System.out.println("创建HDFS Link失败");

         }

         //创建一个任务

         long fromLinkId = fromLink.getPersistenceId();

         long toLinkId = toLink.getPersistenceId();

         MJob job = client.createJob(fromLinkId, toLinkId);

         job.setName("MySQL to HDFS job");

         job.setCreationUser("admln");

         //设置源链接任务配置信息

         MFromConfig fromJobConfig = job.getFromJobConfig();

         fromJobConfig.getStringInput("fromJobConfig.schemaName").setValue("sqoop");

         fromJobConfig.getStringInput("fromJobConfig.tableName").setValue("sqoop");

         fromJobConfig.getStringInput("fromJobConfig.partitionColumn").setValue("id");

         MToConfig toJobConfig = job.getToJobConfig();

         toJobConfig.getStringInput("toJobConfig.outputDirectory").setValue("/usr/tmp");

         MDriverConfig driverConfig = job.getDriverConfig();

         driverConfig.getStringInput("throttlingConfig.numExtractors").setValue("3");

         Status status = client.saveJob(job);

         if(status.canProceed()) {

          System.out.println("JOB创建成功，ID为: "+ job.getPersistenceId());

         } else {

          System.out.println("JOB创建失败。");

         }

         //启动任务

         long jobId = job.getPersistenceId();

         MSubmission submission = client.startJob(jobId);

         System.out.println("JOB提交状态为 : " + submission.getStatus());

         while(submission.getStatus().isRunning() && submission.getProgress() != -1) {

           System.out.println("进度 : " + String.format("%.2f %%", submission.getProgress() * 100));

           //三秒报告一次进度

           try {

             Thread.sleep(3000);

           } catch (InterruptedException e) {

             e.printStackTrace();

           }

         }

         System.out.println("JOB执行结束... ...");

         System.out.println("Hadoop任务ID为 :" + submission.getExternalId());

         Counters counters = submission.getCounters();

         if(counters != null) {

           System.out.println("计数器:");

           for(CounterGroup group : counters) {

             System.out.print("\t");

             System.out.println(group.getName());

             for(Counter counter : group) {

               System.out.print("\t\t");

               System.out.print(counter.getName());

               System.out.print(": ");

               System.out.println(counter.getValue());

             }

           }

         }

         if(submission.getExceptionInfo() != null) {

           System.out.println("JOB执行异常，异常信息为 : " +submission.getExceptionInfo());

         }

         System.out.println("MySQL通过sqoop传输数据到HDFS统计执行完毕");

     }

 }

别问为什么没有MYSQL和HBASE、HIVE互导的代码

20150102

sqoop1.99.4 JAVA API操作的更多相关文章

MongoDB Java API操作很全的整理
MongoDB 是一个基于分布式文件存储的数据库.由 C++ 语言编写,一般生产上建议以共享分片的形式来部署. 但是MongoDB官方也提供了其它语言的客户端操作API.如下图所示: 提供了C.C++ ...
hive-通过Java API操作
通过Java API操作hive,算是测试hive第三种对外接口测试hive 服务启动 package org.admln.hive; import java.sql.SQLException; i ...
hadoop2-HBase的Java API操作
Hbase提供了丰富的Java API,以及线程池操作,下面我用线程池来展示一下使用Java API操作Hbase. 项目结构如下: 我使用的Hbase的版本是 hbase-0.98.9-hadoop ...
使用Java API操作HDFS文件系统
使用Junit封装HFDS import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.*; import org ...
Kafka系列三 java API操作
使用java API操作kafka 1.pom.xml <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xs ...
Hadoop之HDFS（三）HDFS的JAVA API操作
HDFS的JAVA API操作 HDFS 在生产应用中主要是客户端的开发,其核心步骤是从 HDFS 提供的 api中构造一个 HDFS 的访问客户端对象,然后通过该客户端对象操作(增删改查)HDFS ...
zookeeper的java api操作
zookeeper的java api操作创建会话: Zookeeper(String connectString,int sessionTimeout,Watcher watcher) Zookee ...
java api操作
java api操作导入开发包将hbase安装包中lib下包导入java项目创建表 Configuration conf = HBaseConfiguration.create(); c ...
HDFS 05 - HDFS 常用的 Java API 操作
目录 0 - 配置 Hadoop 环境(Windows系统) 1 - 导入 Maven 依赖 2 - 常用类介绍 3 - 常见 API 操作 3.1 获取文件系统(重要) 3.2 创建目录.写入文件 ...

随机推荐

监听mysql是否挂了
监听mysql是否挂了,如果挂了就重启mysql 方式一: #!/bin/bash pgrep -x mysqld &> /dev/null if [ $? -ne 0 ] then e ...
<转载>内存管理内幕-动态分配的选择、折衷和实现对malloc内存分配有个简单的描述，对内存管理有个大致的说明
这篇文章看后感觉不错,和我在glibc下的hurdmalloc.c文件里关于malloc的实现基本意思相同,同时,这篇文章还介绍了一些内存管理方面的知识,值得推荐. 原文链接地址为:http://ww ...
C++11外部模板
[C++11之外部模板] 在标准C++中,只要在编译单元内遇到被完整定义的模板,编译器都必须将其实例化(instantiate).这会大大增加编译时间,特别是模板在许多编译单元内使用相同的参数实例化. ...
Linux 修改hostname 文件
linux 的机器修改hostname: 修改 /etc/hosts 修改 /etc/sysconfig/network 重启机器reboot
hdu 5310 Souvenir（BestCoder 1st Anniversary ($)）
http://acm.hdu.edu.cn/showproblem.php?pid=5310 题目大意:要买n个纪念品,可以单个买p元每个,可以成套买q元一套,每套有m个,求最少花费 #include ...
表格对象QTableWidget相关常见方法
QWidget bool close (self)QRect geometry (self)hide (self)int height (self)setStatusTip (self, QStrin ...
js全局变量
在做东钿微信公众号 ,首页有房产评估和产调,有个checkbox ,点击则选中使用积分,取消选中则不使用积分,html结构和css样式都一样,唯一不一样的就是数据不一样,于是我就分开来写,没有写同一个 ...
安装Exchange2010
1.exadmin加入到 Schema admins,enterprise admins组中 CAS,HUB,MB安装.Net Framework CAS,HUB:2.Run 'ServerManag ...
Apache-系统-网络部分配置
参考了很多东西,但有些理解可能会有错误的地方,希望看到错误的地方可以即使纠正. 参考的内容. http://netsecurity.51cto.com/art/200608/30428.htm htt ...
C# 仿制QQ弹出新闻消息框
打开QQ的时候,QQ新闻弹出窗体在屏幕的右下角就会慢慢升起一个小窗口,占用的地方不大,可以起到提示的作用.下面就让我们来看看,怎样用系统API来轻松实现这个功能. API原型函数: bool Anim ...

sqoop1.99.4 JAVA API操作

sqoop1.99.4 JAVA API操作的更多相关文章

随机推荐

热门专题