sqoop sample code
本文使用的数据库是mysql的sample database employees.
download url:https://launchpad.net/test-db/employees-db-1/1.0.6
然后根据ReadMe安装到自己的mysql数据库中。
sqoop的安装:
下载地址:http://apache.dataguru.cn/sqoop/1.4.6/
sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz
sqoop-1.4.6.tar.gz
我的hadoop版本是2.6,所以我下载的是这两个版本。
sqoop-1.4.6.tar.gz不能直接使用,需要编译。编译后把生成的
sqoop-1.4.6.jar 复制到 sqoop_home/lib下面即可。
复制jdbc connector
mysql-connector-java-5.1.32-bin.jar 或版本更高的mysql jdbc connector.
否则会出现某些bug.
sqoop list-tables --connect jdbc:mysql://namenode01:3306/employees --username hive --password hive
mysqlurl=jdbc:mysql://namenode01:3306/employees sqoop import \
--connect $mysqlurl \
--username hive \
--password hive \
--table departments \
--target-dir /etl/input/departments hdfs dfs -cat /etl/input/departments/* insert into departments values('d9999','Evan,Test');
Overriding Type Mapping
--map-column-java c1=Float,c2=String,c3=String ...
Sqoop by default uses four concurrent map tasks to transfer data to Hadoop. mysqlurl=jdbc:mysql://namenode01:3306/employees
sqoop import \
--connect $mysqlurl \
--username hive \
--password hive \
--query 'select d.dept_no,d.dept_name,de.from_date, de.to_date, e.* from employees e join dept_emp de on e.emp_no=de.emp_no join departments d on de.dept_no=d.dept_no WHERE $CONDITIONS' \
--split-by d.dept_no \
--target-dir /etl/input/employees --compare the result count from mysql and hdfs file
hdfs dfs -cat /etl/input/employees/* | wc -l
if you want to overwrite the data type, you can specify the column=type
--map-column-hive id=STRING,price=DECIMAL mysqlurl=jdbc:mysql://namenode01:3306/employees
sqoop import \
--connect $mysqlurl \
--username hive \
--password hive \
--query 'select d.dept_no,d.dept_name,de.from_date, de.to_date, e.* from employees e join dept_emp de on e.emp_no=de.emp_no join departments d on de.dept_no=d.dept_no WHERE $CONDITIONS' \
--split-by d.dept_no \
--hive-import \
--hive-table test.employees \
--hive-drop-import-delims \
--null-string '\\N' --null-non-string '\\N' \
--target-dir /tmp/employees
sqoop sample code的更多相关文章
- android studio2.2 的Find Sample Code点击没有反应
		
1 . 出现的问题描述: 右键点击Find Sample Code后半天没有反应,然后提示 Samples are currently unavailable for :{**** ...
 - 如何将经纬度利用Google Map API显示C# VS2005 Sample Code
		
原文 如何将经纬度利用Google Map API显示C# VS2005 Sample Code 日前写了一篇如何用GPS抓取目前所在,并回传至资料库储存,这篇将会利用这些回报的资料,将它显示在地图上 ...
 - IOS开发苹果官方Sample Code及下载地址
		
IOS开发苹果官方Sample Code及下载地址 在线浏览地址:https://developer.apple.com/library/ios/navigation/#section=Resourc ...
 - OAF Sample Code(转)
		
原文地址: OAF Sample Code
 - Sample Code之Web scene-slides
		
这是我的第一篇随笔,在开始正文前说几句. 这个系列会记录我学习Arcgis js API 4.10的全过程,希望能对自己也对其他有需要的人有帮助.很多时候上网看一些大神的帖子会感到一头雾水,一是自己水 ...
 - sample code java pom.xml
		
pom.xml <?xml version="1.0" encoding="UTF-8"?> <project xmlns="htt ...
 - Sample Code for Qp_preq_pub.Price_request Api to Simulate an Ask for Promotion Modifier
		
DECLARE p_line_tbl QP_PREQ_GRP.LINE_TBL_TYPE; p_qual_tbl QP_PREQ_GRP.QUAL_TBL_TYPE; p_line_attr_tbl ...
 - 虹软人脸识别Android Sample Code
		
AFR_FSDKInterface engine = new AFR_FSDKEngine(); //用来存放提取到的人脸信息, face_1 是注册的人脸,face_2 是要识别的人脸 AFR_FS ...
 - Apache Flink Training and sample code
		
http://training.data-artisans.com/ https://github.com/dataArtisans/blog-post-code-samples https://gi ...
 
随机推荐
- PHP入门:在Windows中安装PHP工作环境
			
PHP入门:在Windows系统中分别安装PHP工作环境 一.什么是LAMP? Linux+Apache+Mysql+Perl/PHP/Python一组常用来搭建动态网站或者服务器的开源软件,本身都是 ...
 - 重新想象 Windows 8 Store Apps (66) - 后台任务: 下载和上传
			
[源码下载] 重新想象 Windows 8 Store Apps (66) - 后台任务: 下载和上传 作者:webabcd 介绍重新想象 Windows 8 Store Apps 之 后台任务 后台 ...
 - CRC16校验码生成
			
/// <summary> /// 计算CRC-16 /// </summary> /// <param name="data"></pa ...
 - bootstrap 分页
			
1.背景: 前端页面使用bootstrap分页,同时与搜索条件联动: 2. jsp页面由服务端返回后, 异步请求动态创建表格, 分页的数据由服务端第一次返回后初始化, 以后每次异步请求再更新. jsp ...
 - Android系统兼容性问题(持续更新)
			
相信开发过一段Android的都被Android中的兼容性问题给折腾过,有时这确实很无奈,Android被不同的厂商改的七零八落的.本文主要总结下本人在实际的项目开发过程中所遇到的兼容性问题,以及最后 ...
 - guacamole 0.9.9安装与配置
			
以下命令很多都需要管理权限,建议使用管理员账号执行,遇到问题可以留言. 1.首先需要安装guacamole所需要的依赖库 必需安装的库有:Cairo.libjpeg-turbo.libpng.OSSP ...
 - [Design Pattern] Substitute Interface
			
[Design Pattern] Substitute Interface 目的 将对象的成员建立为替身接口的成员,用来解耦对象之间的循环相依. 情景 假设开发人员接手一个系统,在系统里有订单对象.送 ...
 - C++调用C#dll类库中的方法(非显性COM)
			
一般在网上搜C++如何调用C#的函数,出来的结果都是做成COM组件,但是这种方法dll安装麻烦,需要注册COM组件,需要管理员权限,调试麻烦,经常需要重启机器,反正有诸多不便. 然后在看<CLR ...
 - Atitit. Xss 漏洞的原理and应用xss木马
			
Atitit. Xss 漏洞的原理and应用xss木马 1. XSS漏洞1 2. XSS的用途2 2.1. 盗取cookie2 2.2. 刷新流量 刷分3 2.3. DOS 窃取隐私”.“假冒身份”. ...
 - java随机生成指定的位数
			
/** * 获取count个随机数 * @param count 随机数个数 * @return */ public static String game(int count){ StringBuff ...