DBWritable的使用

首先导入mysql连接驱动jar包

或者maven模式下在pom.xml文件中追加：

<groupId>mysql</groupId>

<artifactId>mysql-connector-java</artifactId>

</dependency>

代码：

package com.neworigin.db;

import java.io.IOException;

import java.sql.PreparedStatement;

import java.sql.ResultSet;

import java.sql.SQLException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.NullWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

import org.apache.hadoop.mapreduce.lib.db.DBConfiguration;

import org.apache.hadoop.mapreduce.lib.db.DBInputFormat;

import org.apache.hadoop.mapreduce.lib.db.DBOutputFormat;

import org.apache.hadoop.mapreduce.lib.db.DBWritable;

import org.apache.hadoop.mapreduce.lib.input.FileSplit;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class DBJob {

public static class TableUers implements DBWritable{//表的映射

int id;

String name;

int age;

public int getId() {

return id;

}

public void setId(int id) {

this.id = id;

}

public String getName() {

return name;

}

public void setName(String name) {

this.name = name;

}

public int getAge() {

return age;

}

public void setAge(int age) {

this.age = age;

}

public TableUers(int id, String name, int age) {

this.id = id;

this.name = name;

this.age = age;

}

public TableUers() {

}

//将表的映射对象中的属性设置进（写入数据库）

public void write(PreparedStatement statement) throws SQLException {

statement.setInt(1, id);

statement.setString(2, name);

statement.setInt(3, age);

}

//从结果集通过与字段匹配的赋值给表的映射对象（读取数据库）

public void readFields(ResultSet resultSet) throws SQLException {//获取表中的属性

this.id=resultSet.getInt("id");

this.name=resultSet.getString("name");

this.age=resultSet.getInt("age");

}

@Override

public String toString() {

return id + " " + name + " " + age;

}

public static class MyMapper extends Mapper<Object ,TableUers,TableUers,NullWritable>{

protected void map(Object key, TableUers value, Mapper<Object, TableUers, TableUers, NullWritable>.Context context)

throws IOException, InterruptedException {

String s = value.toString();

System.out.println(s);

context.write(value,NullWritable.get());

}

public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {

Path out=new Path("file:///F:/安装/java工程/MR/data/db/out");

Job job = Job.getInstance();

Configuration conf = job.getConfiguration();

/* FileSystem fs =FileSystem.get(conf);

if(fs.exists(out))

{

fs.delete(out);

}*/

job.setInputFormatClass(DBInputFormat.class);

DBConfiguration.configureDB(conf, "com.mysql.jdbc.Driver", "jdbc:mysql://127.0.0.1/mydb","root","123456");

DBInputFormat.setInput(job, TableUers.class, "select id,name,age from user", "select count(*) from user");

job.setOutputFormatClass(DBOutputFormat.class);

DBOutputFormat.setOutput(job, "aaa", "id","name","age");

job.setMapperClass(MyMapper.class);

job.setMapOutputKeyClass(TableUers.class);

job.setMapOutputValueClass(NullWritable.class);

job.setOutputKeyClass(TableUers.class);

job.setOutputValueClass(NullWritable.class);

job.setNumReduceTasks(0);

//FileOutputFormat.setOutputPath(job, out);

job.waitForCompletion(true);

}

DBWritable的使用的更多相关文章

Hadoop 中利用 mapreduce 读写 mysql 数据
Hadoop 中利用 mapreduce 读写 mysql 数据有时候我们在项目中会遇到输入结果集很大,但是输出结果很小,比如一些 pv.uv 数据,然后为了实时查询的需求,或者一些 OLAP ...
[Hadoop in Action] 第7章细则手册
向任务传递定制参数获取任务待定的信息生成多个输出与关系数据库交互让输出做全局排序 1.向任务传递作业定制的参数在编写Mapper和Reducer时,通常会想让一些地方可以配 ...
mapreduce导出MSSQL的数据到HDFS
今天想通过一些数据,来测试一下我的<基于信息熵的无字典分词算法>这篇文章的正确性.就写了一下MapReduce程序从MSSQL SERVER2008数据库里取数据分析.程序发布到hadoo ...
mapReduce编程之auto complete
1 n-gram模型与auto complete n-gram模型是假设文本中一个词出现的概率只与它前面的N-1个词相关.auto complete的原理就是,根据用户输入的词,将后续出现概率较大的词 ...
hadoop的自定义数据类型和与关系型数据库交互
最近有一个需求就是在建模的时候,有少部分数据是postgres的,只能读取postgres里面的数据到hadoop里面进行建模测试,而不能导出数据到hdfs上去. 读取postgres里面的数据库有两 ...
将MapReduce的结果输出至Mysql数据库
package com.sun.mysql;import java.io.DataInput;import java.io.DataOutput;import java.io.IOException; ...
MapReduce之Writable相关类
当要在进程间传递对象或持久化对象的时候,就需要序列化对象成字节流,反之当要将接收到或从磁盘读取的字节流转换为对象,就要进行反序列化.Writable是Hadoop的序列化格式,Hadoop定义了这样一 ...
Sqoop详细介绍包括：sqoop命令，原理，流程
一简介 Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS ...
Hadoop集群（第10期）_MapReduce与MySQL交互
2.MapReduce与MySQL交互 MapReduce技术推出后,曾遭到关系数据库研究者的挑剔和批评,认为MapReduce不具备有类似于关系数据库中的结构化数据存储和处理能力.为此,Google ...

随机推荐

C# winform程序防止前台卡死
https://blog.csdn.net/Emiedon/article/details/51069193 在实际开发中,如果需要实时的显示后台处理的情况,我们可能要在前台用一些控件去显示所以我们 ...
Bytom猜谜合约使用指南
准备工作: 1.安装全节点钱包V1.0.5以上并同步完成: 2.已经发行一种资产,发行资产的方法具体见文章<如何在Bytom上发布资产?> 3.准备好一些BTM作为手续费: 设置谜语(锁定 ...
k8s2
1.主节点与子节点如何沟通,交互 apiServer <==> kublet 2. pod之间如何共享, 使用volumn(数据卷 ) kube-proxy 和 service 配置好网络 ...
tcpdump使用方法
TcpDump可以将网络中传送的数据包完全截获下来提供分析.它支持针对网络层.协议.主机.网络或端口的过滤,并提供and.or.not等逻辑语句来帮助你去掉无用的信息. 工作中使用tcpdump命令抓 ...
【OJ】字符串去重并并按原顺序打印出重复字符
ACM上一道简单的字符串题,从网上找了下类似的代码进行参考外加之个人思考,想到此好思路. 题目大意任意输入一行字符串,检索重复出现的字符.将原字符串中的重复字符删除后按照原顺序输出,同时按照原顺序输 ...
每天一个小程序—0013题（爬图片+正则表达式 or BeautifulSoup）
第 0013 题: 用 Python 写一个爬图片的程序,爬这个链接里的日本妹子图片 :-) 关于python3的urllib模块,可以看这篇博客:传送门首先是用urlopen打开网站并且获取网页 ...
那些年我们一起用过的 PHP 函数(一)
用这个帖子记录一下 PHP 中比较常用的函数以及使用过程中需要注意的点,此贴持续更新 1.strpos() 函数首先,我们知道 strpos() 函数是用于查找一个字符串在另一个字符串第一次 ...
线程间操作无效: 从不是创建控件“button2”的线程访问它
在项目中经常遇到类似的问题,如何解决呢,报错的方法中添加 Control.CheckForIllegalCrossThreadCalls = false; 就可以解决了.
Codeforces 781D Axel and Marston in Bitland
题目链接:http://codeforces.com/contest/781/problem/D ${F[i][j][k][0,1]}$表示是否存在从${i-->j}$的路径走了${2^{k}} ...
@media only screen and (max-width:640px)中的问题，响应式布局
<head> <meta charset="UTF-8"> <meta name="viewport" content=" ...

DBWritable的使用

DBWritable的使用的更多相关文章

随机推荐

热门专题