Hive的存储和MapReduce处理——数据清洗(Part2)
日期:2019.11.14
博客期:116
星期四
基本的处理类
import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.PreparedStatement;
import java.sql.ResultSet;
import java.sql.SQLException;
import java.sql.Statement;
import java.util.ArrayList;
import java.util.List; import com.hive.basic.Bean; public class SqlForBean {
public static String databasename = "hive";//数据库名称
public static String username = "root";//登录数据库的用户的用户名
public static String password = "nssxs2489615648";//登录数据库的用户的密码
//插入方法
public static void insert(Bean bean)
{
try {
Class.forName("com.mysql.jdbc.Driver").newInstance(); //MYSQL驱动
Connection conn = DriverManager.getConnection("jdbc:mysql://127.0.0.1:3306/"+databasename, username, password); //链接本地MYSQL
String sql = "insert into result values (";
sql += "'"+bean.getIp()+"',";
sql += "'"+bean.getTime()+"',";
sql += "'"+bean.getDay()+"',";
sql += bean.getTraffic()+",";
sql += "'"+bean.getType()+"',";
sql += "'"+bean.getId()+"')"; PreparedStatement pstmt = (PreparedStatement) conn.prepareStatement(sql);
pstmt.executeUpdate();
pstmt.close(); conn.close();
} catch (SQLException e) {
e.printStackTrace();
} catch (Exception e) {
e.printStackTrace();
}
}
public static void insert(List <Bean> list_bean)
{
int size = list_bean.size();
for(int i=0;i<size;++i)
{
SqlForBean.insert(list_bean.get(i));
}
}
public static List<Bean> getData(){
List <Bean> list = new ArrayList<Bean>(); try
{
Class.forName("com.mysql.jdbc.Driver").newInstance(); //MYSQL驱动
Connection conn = DriverManager.getConnection("jdbc:mysql://127.0.0.1:3306/"+databasename, username, password); //链接本地MYSQL
String sql = " select * from result";
Statement stmt = conn.createStatement();
ResultSet rs = stmt.executeQuery(sql);
while(rs.next())
{
String ip_s = rs.getString("ip");
String time_s = rs.getString("time");
String day_s = rs.getString("day");
int traffic_s = rs.getInt("traffic");
String type_s = rs.getString("type");
String id_s = rs.getString("id");
Bean bean = new Bean(ip_s,time_s,day_s,traffic_s,type_s,id_s);
list.add(bean);
}
}catch(ClassNotFoundException e){
e.printStackTrace();
}catch(IllegalAccessException e){
e.printStackTrace();
}catch(InstantiationException e){
e.printStackTrace();
}catch(SQLException e){
e.printStackTrace();
} return list;
}
}
SqlForBean
Hive的存储和MapReduce处理——数据清洗(Part2)的更多相关文章
- Hive的存储和MapReduce处理——数据清洗
		
日期:2019.11.13 博客期:115 星期三 Result文件数据说明: Ip:106.39.41.166,(城市) Date:10/Nov/2016:00:01:02 +0800,(日期) D ...
 - Hive的存储和MapReduce处理——数据清洗(Part3)
		
日期:2019.11.17 博客期:118 星期日 这几天在写程序的时候虚拟机崩了,无语~所以重新从最初的状态开始配环境,重新整理之前的所有代码程序.
 - 升级版:深入浅出Hadoop实战开发(云存储、MapReduce、HBase实战微博、Hive应用、Storm应用)
		
Hadoop是一个分布式系统基础架构,由Apache基金会开发.用户可以在不了解分布式底层细节的情况下,开发分布式程序.充分利用集群的威力高速运算和存储.Hadoop实现了一个分布式文件系 ...
 - Hive| 压缩| 存储| 调优
		
Hadoop压缩配置 修改Hadoop集群具有Snappy压缩方式: 查看hadoop支持的压缩方式 [kris@hadoop101 datas]$ hadoop checknative 将编译好的支 ...
 - spark2.1:读取hive中存储的多元组(string,double)失败
		
这两天和同事一起在想着如何把一个表的记录减少,表记录包含了:objectid(主小区信息),gridid(归属栅格),height(高度),rsrp(主小区rsrp),n_objectid(邻区),n ...
 - hive优化之调整mapreduce数目
		
一.调整hive作业中的map数 1.通常情况下,作业会通过input的目录产生一个或者多个map任务.主要的决定因素有: input的文件总个数,input的文件大小,集群设置的文件块大小(目前为1 ...
 - Hive快捷查询:不启用Mapreduce job启用Fetch task
		
启用MapReduce Job是会消耗系统开销的.对于这个问题,从Hive0.10.0版本开始,对于简单的不需要聚合的类似SELECT <col> from <table> L ...
 - Hive基础之Hive的存储类型
		
Hive常用的存储类型有: 1.TextFile: Hive默认的存储类型:文件大占用空间大,未压缩,查询慢: 2.Sequence File:将属于以<KEY,VALUE>的形式序列化到 ...
 - HIve数据存储
		
表 Table 内部表 Partition 分区表 External Table 外部表 Bucket Table 桶表 内部表 分区表 parttion对应于数据库中的Partition列的密集索引 ...
 
随机推荐
- 吴裕雄 python 机器学习——模型选择数据集切分
			
import numpy as np from sklearn.model_selection import train_test_split,KFold,StratifiedKFold,LeaveO ...
 - DBC物品中打包物品参数设置
			
DBC库中添加某物品包或捆,主要修改以下这两地方: 物品DBC: Stdmode字段 填写31表示捆或包 Shape字段 表示解开后的物品,填写时需要先在你的服务端文件里面找到UnbindList ...
 - ax绘图相关的知识点
			
1.去边框 # 去掉上.下.左.右边框 ax.spines['top'].set_visible(False) ax.spines['bottom'].set_visible(False) ax.sp ...
 - python opencv:色彩空间
			
RGB色彩空间 常见的色彩空间 色彩空间的转换 cv2.cvtColor(image, 转换选项) 常见的两个颜色转换 HSV与RGB YUV与RGB inRange方法 函数参数: 第一个参数:是原 ...
 - R - Fence Repair    POJ - 3253
			
Farmer John wants to repair a small length of the fence around the pasture. He measures the fence an ...
 - 【转】获取Jenkins构建时Git Change Log
			
原文:https://www.jianshu.com/p/513ab6915dbd 在基于Jenkins进行CI持续集成的工作,在构建后上传蒲公英时想将本次版本的git commit信息同步到蒲公英的 ...
 - php对象、面向对象
			
对象 万物皆对象 一切可见之物都是对象 一切不可见之物也是(抽象的事物也是对象): 对象包含两部分 1对象的组成元素 对象的数据模型又称为对象的属性,又被称为对象的成员变量 2.对象的行为 是对象的行 ...
 - Python下opencv使用笔记(十一)(详解hough变换检测直线与圆)
			
http://blog.csdn.net/on2way/article/details/47028969 http://blog.csdn.net/mokeding/article/details/1 ...
 - C — 小知识
			
老是记错int与void*之间的转换,所以记录一个,顺便用一下一些宏.预处理... int与void*的转换.打印变量名: #include <stdio.h> // 打印变量名 #def ...
 - MySQL忘记密码如何重置
			
一]进入服务器下,我用的是centos版本 vim /etc/my.cnf 1 vim[二]找到mysqld的部分然后在下面添加上一句代码,意思是跳过密码直接进入,然后保存退出 skip-grant- ...