1 下载地址
        版本 sqoop-1.4.6-cdh5.7.0
        安装包  sqoop-1.4.6-cdh5.7.0.tar.gz  上传到hadoop服务器环境
 
2 解压软件
        [root@hdp1 /mnt/software]#tar -zvxf sqoop-1.4.6-cdh5.7.0.tar.gz
 
3 重命名配置文件
        [root@hdp1 /mnt/software/sqoop-1.4.6-cdh5.7.0]#cd conf/
        [root@hdp1 /mnt/software/sqoop-1.4.6-cdh5.7.0/conf]#ls
        oraoop-site-template.xml  sqoop-env-template.sh    sqoop-site.xml
        sqoop-env-template.cmd    sqoop-site-template.xml
        [root@hdp1 /mnt/software/sqoop-1.4.6-cdh5.7.0/conf]#cp sqoop-env-template.sh sqoop-env.sh
 
4 修改配置文件
       [root@hdp1 /mnt/software/sqoop-1.4.6-cdh5.7.0/conf]#vim sqoop-env.sh
        export HADOOP_COMMON_HOME=/mnt/software/hadoop-2.6.0-cdh5.7.0
        export HADOOP_MAPRED_HOME=/mnt/software/hadoop-2.6.0-cdh5.7.0
        export HIVE_HOME=/mnt/software/hive-1.1.0-cdh5.7.0
        export ZOOKEEPER_HOME=/mnt/software/zookeeper-3.4.5-cdh5.7.05
        export ZOOCFGDIR=/mnt/software/zookeeper-3.4.5-cdh5.7.0
 
5 拷贝jdbc驱动 到 Sqoop lib目录
        [root@hdp1 /mnt/software/sqoop-1.4.6-cdh5.7.0/conf]#cp /mnt/software/hive-1.1.0-cdh5.7.0/lib/mysql-connector-java-5.1.45.jar /mnt/software/sqoop-1.4.6-cdh5.7.0/lib/
 
6 验证Sqoop
      配置Sqoop环境变量 
         [root@hdp1 /mnt/software/sqoop-1.4.6-cdh5.7.0/bin]#vim /etc/profile
         export SQOOP_HOME=/mnt/software/sqoop-1.4.6-cdh5.7.0
         export PATH=.:$PATH:$SQOOP_HOME/bin 
        [root@hdp1 /mnt/software/sqoop-1.4.6-cdh5.7.0/bin]#source /etc/profile
        验证Sqoop
        
   
7 测试Sqoop是否能够成功连接数据库
[root@hdp1 /mnt/software/sqoop-1.4.6-cdh5.7.0]#sqoop list-databases --connect jdbc:mysql://hdp1:3306/ --username root --password yourpasswd
 
8 导入数据
(1)确定Mysql服务开启正常
(2)在Mysql中新建一张表并插入一些数据
[root@hdp1 /mnt/software/hive-1.1.0-cdh5.7.0]#mysql -uroot -p yourpasswd
mysql> create database company;
mysql> create table company.staff(id int(4) primary key not null auto_increment, name varchar(255), sex varchar(255));
mysql>  insert into company.staff(name, sex) values('ajin', 'Male’);
mysql> insert into company.staff(name, sex) values('awen', 'FeMale');
(3)导入数据
    全部导入
        sqoop import \
--connect jdbc:mysql://hdp1:3306/company \
--username root \
--password yourpasswd \
--table staff \
--target-dir /mnt/software/tmp/sqoopdir \
--delete-target-dir \
--num-mappers 1 \
--fields-terminated-by  “\t"
 
遇到异常
Exception in thread "main" java.lang.NoClassDefFoundError: org/json/JSONObject
 
解决异常 
    这是因为sqoop缺少java-json.jar包. 下载jar包导入lib目录下  http://www.java2s.com/Code/Jar/j/Downloadjavajsonjar.htm
    mv java-json.jar /mnt/software/sqoop-1.4.6-cdh5.7.0/lib
 
继续导入
     再次遇到异常
        
 
设置accumulo目录
[root@hdp1 /mnt/software/tmp]#mkdir /mnt/software/tmp/accumulo
导入环境变量    
[root@hdp1 /mnt/software/tmp]#export ACCUMULO_HOME=/mnt/software/tmp/accumulo
再次导入 成功

Sqoop入门的更多相关文章

  1. [sqoop1.99.7] sqoop入门-下载、安装、运行和常用命令

    一.简介 Apache Sqoop is a tool designed for efficiently transferring data betweeen structured, semi-str ...

  2. 《OD大数据实战》Sqoop入门实例

    官网地址: http://archive.cloudera.com/cdh5/cdh/5/sqoop-1.4.5-cdh5.3.6/SqoopUserGuide.html 一.环境搭建 1. 下载 s ...

  3. 大数据入门第十二天——sqoop入门

    一.概述 1.sqoop是什么 从其官网:http://sqoop.apache.org/ Apache Sqoop(TM) is a tool designed for efficiently tr ...

  4. 大数据学习——sqoop入门

    下载地址 https://pan.baidu.com/s/1qWDl29L9I_KVU54c0ioNfQ fvfh 3.1 概述 sqoop是apache旗下一款“Hadoop和关系数据库服务器之间传 ...

  5. 《OD大数据实战》驴妈妈旅游网大型离线数据电商分析平台

    一.环境搭建 1. <OD大数据实战>Hadoop伪分布式环境搭建 2. <OD大数据实战>Hive环境搭建 3. <OD大数据实战>Sqoop入门实例 4. &l ...

  6. sqoop 1.4.4-cdh5.1.2快速入门

    一.快速入门 (一)下载安装 1.下载并解压 wget http://archive.cloudera.com/cdh5/cdh/5/sqoop-1.4.4-cdh5.1.2.tar.gz tar - ...

  7. sqoop 1.4.4-cdh5.1.2高速入门

    一.高速入门 (一)下载安装 1.下载并解压 wget http://archive.cloudera.com/cdh5/cdh/5/sqoop-1.4.4-cdh5.1.2.tar.gz tar - ...

  8. sqoop 1.4.4-cdh5.1.2快速入门 分类: C_OHTERS 2015-06-06 11:40 208人阅读 评论(0) 收藏

    一.快速入门 (一)下载安装 1.下载并解压 wget http://archive.cloudera.com/cdh5/cdh/5/sqoop-1.4.4-cdh5.1.2.tar.gz tar - ...

  9. 大数据框架开发基础之Sqoop(1) 入门

    Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql.postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle , ...

随机推荐

  1. BZOJ3545&3551[ONTAK2010]Peaks——kruskal重构树+主席树+dfs序+树上倍增

    题目描述 在Bytemountains有N座山峰,每座山峰有他的高度h_i.有些山峰之间有双向道路相连,共M条路径,每条路径有一个困难值,这个值越大表示越难走,现在有Q组询问,每组询问询问从点v开始只 ...

  2. BZOJ4569 SCOI2016萌萌哒(倍增+并查集)

    一个显然的暴力是用并查集记录哪些位之间是相等的.但是这样需要连nm条边,而实际上至多只有n条边是有用的,冗余过多. 于是考虑优化.使用类似st表的东西,f[i][j]表示i~i+2^j-1与f[i][ ...

  3. LAMP和LNMP去除index.php访问

    使用TP或者Laravel开发的时候,后时候会遇到需要加index.php才能正常访问 LAMP解决方法 1.修改配置 打开配置文件(如:httpd.conf),找到你网站根目录的配置,将AllowO ...

  4. python 操作系统模块 -- OS

    os,语义为操作系统,模块提供了访问多个操作系统服务的功能,可以处理文件和目录这些我们日常手动需要做的操作.os和它的子模块os.path还包括一些用于检查.构造.删除目录和文件的函数,以及一些处理路 ...

  5. LOJ #2434. 「ZJOI2018」历史(LCT)

    题意 click here 题解 我们首先考虑答案是个什么样的东西, 不难 发现每个点可以单独计算它的贡献. 令每个点 \(i\) 崛起次数为 \(a_i\) . 假设一个点子树的 \(\sum a_ ...

  6. 【hdu5306】 Gorgeous Sequence

    http://acm.hdu.edu.cn/showproblem.php?pid=5306 (题目链接) 题意 区间取$min$操作,区间求和操作,区间求最值操作. Solution 乱搞一通竟然A ...

  7. .net连接ORACLE数据库

    这段时间维护客户的一个系统,该系统使用的是ORACLE数据库,之前开发的时候用的都是MSSQL,并没有使用过ORACLE.这两种数据库虽然都是关系型数据库,但是具体的操作大有不同,这里作下记录. 连接 ...

  8. 'RegAsm.exe' 不是内部或外部命令

    我想从cmd运行regasm.exe.它在c:\windows \Microsoft.net\framework\2.057 中可用 我喜欢这个c:\ regasm.exe 它给予 regasm无法识 ...

  9. 解决Win8.1 IE11兼容性问题的方法

    装了64位win8.1企业版,IE11出现了一些兼容性问题,如个别网银网页兼容问题,还有office.迅雷.adobe reader.旋风等等插件不兼容不能加载的问题. 折腾了一天总算全部解决了,主要 ...

  10. linux command ------ find

    find | grep luoluo 将当前目录及子目录的文件名中含有luoluo的文件过滤出来 | 是管道,把find查找的内容传递给下个命令(grep) find后面不加其他内容(比如路径)表示打 ...