BG.Sqoop

1. 下载 Sqoop，并复制到虚拟机

　　http://sqoop.apache.org/

2. 安装Sqoop

　　tar zxf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz　　#解压 SQOOP

　　mv sqoop-1.4.6.bin__hadoop-2.0.4-alpha sqoop-1.4.6　　#重命名

　　vim /etc/profile　　#修改环境变量

　　　　增加 Sqoop环境变量

　　　　SQOOP_HOME=/opt/sqoop-1.4.6

　　　　PATH=$SQOOP_HOME/bin:...$PATH

　　source /etc/profile　　#source环境变量

　　cd /opt/sqoop-1.4.6/conf　　#修改Conf文件

　　cp sqoop-env-template.sh sqoop-env.sh

　　vim sqoop-env.sh

　　　　export HADOOP_COMMON_HOME=/opt/hadoop-2.7.3

　　　　export HADOOP_MAPRED_HOME=/opt/hadoop-2.7.3

　　sqoop version　　#检查 Sqoop安装是否成功

3. jdbc

　　下载 mysql-connector-java-5.1.41.tar.gz

　　tar zxf mysql-connector-java-5.1.41.tar.gz

　　cp mysql-connector-java-5.1.41-bin.jar /opt/sqoop-1.4.6/lib/

4. Import

　　sqoop import --connect jdbc:mysql://bigdata.mysql:3306/classicmodels --table customers --username bigdata　　#默认导入hdfs://user/root/customers/

　　sqoop import --connect jdbc:mysql://bigdata.mysql:3306/classicmodels --username bigdata --table customers --target-dir /classicmodels/customers　　#增加 hdfs路径

　　sqoop import --connect jdbc:mysql://bigdata.mysql:3306/classicmodels --table customers --columns "customerNumber, customerName, phone, city" --username bigdata --target-dir /classicmodels/customers_SpecificColumns　　#指定特定的列

　　sqoop import --connect jdbc:mysql://bigdata.mysql:3306/classicmodels --table customers --username bigdata --target-dir /classicmodels/customers_parallel8 -m 8　　#设置并行度为8

　　sqoop import --connect jdbc:mysql://bigdata.mysql:3306/classicmodels --table customers --username bigdata --target-dir /classicmodels/customers_Sequence --class-name bigdata.classicmodels.customers --as-sequencefile　　#设置生成的类名和导入到sequencefile

　　You can import data in one of two file formats: delimited text or SequenceFiles

　　Delimited text is the default import format; SequenceFiles are a binary format that store individual records in custom record-specific data types;

　　SequenceFiles is higher-performance than reading from text files, as records do not need to be parsed

　　sqoop import --connect jdbc:mysql://bigdata.mysql:3306/classicmodels --table customers --username bigdata --target-dir /classicmodels/customers_Delimiters --fields-terminated-by '\t' --lines-terminated-by '\n' --optionally-enclosed-by '\"'　　#分割；fields,字段； lines,行； --optionally-enclosed-by,字段内容按照（"）封闭

　　sqoop import --connect jdbc:mysql://bigdata.mysql:3306/classicmodels --table customers --username bigdata --target-dir /classicmodels/customer_Where --where "customerNumber < 130"　　#指定Where条件

　　sqoop import --connect jdbc:mysql://bigdata.mysql:3306/classicmodels --table customers --columns "customerName, phone, city" --username bigdata --target-dir /classicmodels/customer_split --split-by customerName -m 2　　#按照customerName分割任务，设置并行度（MapReduce）

5. import-all-tables

　　hdfs dfs -rm -f -R -skipTrash /user　　#删除hdfs目录，-skipTrash，不移动到回收站

　　sqoop import-all-tables --connect jdbc:mysql://bigdata.mysql:3306/classicmodels --username bigdata　　#导入所有表

6. export

　　sqoop export --connect jdbc:mysql://bigdata.mysql:3306/classicmodels --table customers_export --username bigdata --fields-terminated-by ',' --lines-terminated-by '\n' --optionally-enclosed-by '\"' --export-dir /user/root/customers　　#将HDFS目录下的数据导入到MySQL的表中。

7. job

　　sqoop job --create sJob -- import --connect jdbc:mysql://bigdata.mysql:3306/classicmodels --table customers --username bigdata --target-dir /classicmodels/customers_Job　　#创建Job

　　sqoop job --list　　#列出当前所有Job

　　sqoop job --show sJob　　#显示sJob的详细信息

　　sqoop job --exec sJob　　#执行Sqoop Job

　　sqoop job --exec sJob -- --username root　　#在--之后，重新指定Job参数

8. codegen

　　sqoop codegen --connect jdbc:mysql://bigdata.mysql:3306/classicmodels --table customers --username bigdata --outdir /tmp/ -class-name customer　　#生成jar包到指定目录

9. merge

　　sqoop merge --new-data /classicmodels/customers/part-m-00000 --onto /classicmodels/customers/part-m-00001 --target-dir /classicmodels/customers/merged --merge-key customerNumber --jar-file /tmp/sqoop-root/compile/70b8bc2b57230f3240f589f594d9d85f/customer.jar --class-name customer

10. eval

　　sqoop eval --connect jdbc:mysql://bigdata.mysql:3306/classicmodels --username bigdata --query "Select customerNumber, customerName, contactLastName, contactFirstName From customers Limit 10"　　#eval，直接执行SQL语句并将结果显示在控制台

11. list-databases

　　sqoop list-databases --connect jdbc:mysql://bigdata.mysql:3306 --username bigdata　　#显示所有的databases

12. list-tables

　　sqoop list-tables --connect jdbc:mysql://bigdata.mysql:3306/classicmodels --username bigdata　　#显示database下的所有表

13. help

　　sqoop help import　　#显示sqoop工具的帮助

14. version

　　sqoop version

BG.Sqoop的更多相关文章

sqoop:Failed to download file from http://hdp01:8080/resources//oracle-jdbc-driver.jar due to HTTP error: HTTP Error 404: Not Found
环境:ambari2.3,centos7,sqoop1.4.6 问题描述:通过ambari安装了sqoop,又添加了oracle驱动配置,如下: 保存配置后,重启sqoop报错:http://hdp0 ...
安装sqoop
安装sqoop 1.默认已经安装好java+hadoop 2.下载对应hadoop版本的sqoop版本 3.解压安装包 tar zxvf sqoop-1.4.6.bin__hadoop-2.0.4-a ...
Hadoop学习笔记—18.Sqoop框架学习
一.Sqoop基础:连接关系型数据库与Hadoop的桥梁 1.1 Sqoop的基本概念 Hadoop正成为企业用于大数据分析的最热门选择,但想将你的数据移植过去并不容易.Apache Sqoop正在加 ...
Oozie分布式任务的工作流——Sqoop篇
Sqoop的使用应该是Oozie里面最常用的了,因为很多BI数据分析都是基于业务数据库来做的,因此需要把mysql或者oracle的数据导入到hdfs中再利用mapreduce或者spark进行ETL ...
[大数据之Sqoop] —— Sqoop初探
Sqoop是一款用于把关系型数据库中的数据导入到hdfs中或者hive中的工具,当然也支持把数据从hdfs或者hive导入到关系型数据库中. Sqoop也是基于Mapreduce来做的数据导入. 关于 ...
[大数据之Sqoop] —— 什么是Sqoop?
介绍 sqoop是一款用于hadoop和关系型数据库之间数据导入导出的工具.你可以通过sqoop把数据从数据库(比如mysql,oracle)导入到hdfs中:也可以把数据从hdfs中导出到关系型数据 ...
Sqoop切分数据的思想概况
Sqoop通过--split-by指定切分的字段,--m设置mapper的数量.通过这两个参数分解生成m个where子句,进行分段查询.因此sqoop的split可以理解为where子句的切分. 第一 ...
sqoop数据导出导入命令
1. 将mysql中的数据导入到hive中 sqoop import --connect jdbc:mysql://localhost:3306/sqoop --direct --username r ...
Apache Sqoop - Overview——Sqoop 概述
Apache Sqoop - Overview Apache Sqoop 概述使用Hadoop来分析和处理数据需要将数据加载到集群中并且将它和企业生产数据库中的其他数据进行结合处理.从生产系统加载大 ...

随机推荐

php不用递归完成无限分类，从表设计入手完整演示过程
无限分类是什么就不废话了,可以用递归实现,但是递归从数据库取东西用递归效率偏低,如果从表设计入手,就很容易做到网站导航的实现,下面是某论坛导航,如下图网上无限分类大多不全面,今天我会从设计表开始, ...
【自动化专题】selenium如何轻松搞定文件上传
使用selenium做自动化时,我们经常会遇到的一个让人头疼的问题就是文件上传. 问题的难点在于selenium无法识别并操作Windows窗口,若我们可以绕过弹出框直接把文件信息上传给选择按钮,难点 ...
Mitsubishi Lancer JDM
xiaocong/uiautomator
uiautomator This module is a Python wrapper of Android uiautomator testing framework. It works ...
这几天bug多，自我检讨一下
这段时间(主要指4月底到5月初)写的bug超过以往总和,觉得很有必要停一下,找找原因.所谓前车之鉴后车之师,不能也不应该在同一地方跌倒N次吧: 为什么bug频出? 深究原因,并不是代码量大.功能多,反 ...
CSDN无耻，亿赛通无耻
吐槽下,自己写一篇关于亿赛通加密文件的简单破解方式,竟然收到请求删除博客的私信,然后那篇博客就没有了. 太过于无耻了.
JS: 数组扁平化
数组扁平化什么是数组扁平化? 数组扁平化就是将一个多层嵌套的数组 (Arrary) 转化为只有一层. // 多层嵌套 [1, 2, [3, 4]] // 一层 [1, 2, 3, 4] 递归实现思 ...
从您的帐户中删除 App 及 iTunes Connect 开发人员帮助
iTunes Connect 开发人员帮助从您的帐户中删除 App 删除您不想继续销售或提供下载,且不会再重新使用其名称的 App.如果您的 App 至少有一个获准的版本,且最新版本处于下列状态之一 ...
spring基础回顾
1.什么是Spring框架?Spring框架有哪些主要模块? Spring框架是一个为Java应用程序的开发提供了综合.广泛的基础性支持的Java平台.Spring帮助开发者解决了开发中基础性的问题, ...
c# 测试方法执行时间
class Program { static void Main(string[] args) { Console.WriteLine(ActionExtension.Profiler(a, )); ...

BG.Sqoop

BG.Sqoop的更多相关文章

随机推荐

热门专题