Hive的存储和MapReduce处理——数据清洗（Part2）

日期：2019.11.14

博客期：116

星期四

　　基本的处理类

 import java.sql.Connection;

 import java.sql.DriverManager;

 import java.sql.PreparedStatement;

 import java.sql.ResultSet;

 import java.sql.SQLException;

 import java.sql.Statement;

 import java.util.ArrayList;

 import java.util.List;

 import com.hive.basic.Bean;

 public class SqlForBean {

     public static String databasename = "hive";//数据库名称

     public static String username = "root";//登录数据库的用户的用户名

     public static String password = "nssxs2489615648";//登录数据库的用户的密码

     //插入方法

     public static void insert(Bean bean)

     {

         try {

             Class.forName("com.mysql.jdbc.Driver").newInstance(); //MYSQL驱动

             Connection conn = DriverManager.getConnection("jdbc:mysql://127.0.0.1:3306/"+databasename, username, password); //链接本地MYSQL

             String sql = "insert into result values (";

             sql += "'"+bean.getIp()+"',";

             sql += "'"+bean.getTime()+"',";

             sql += "'"+bean.getDay()+"',";

             sql += bean.getTraffic()+",";

             sql += "'"+bean.getType()+"',";

             sql += "'"+bean.getId()+"')";

             PreparedStatement pstmt = (PreparedStatement) conn.prepareStatement(sql);

             pstmt.executeUpdate();

             pstmt.close();

             conn.close();

         } catch (SQLException e) {

             e.printStackTrace();

         } catch (Exception e) {

             e.printStackTrace();

         }

     }

     public static void insert(List <Bean> list_bean)

     {

         int size = list_bean.size();

         for(int i=0;i<size;++i)

         {

             SqlForBean.insert(list_bean.get(i));

         }

     }

     public static List<Bean> getData(){

         List <Bean> list = new ArrayList<Bean>();

         try

         {

             Class.forName("com.mysql.jdbc.Driver").newInstance(); //MYSQL驱动

             Connection conn = DriverManager.getConnection("jdbc:mysql://127.0.0.1:3306/"+databasename, username, password); //链接本地MYSQL

             String sql = " select * from result";

             Statement stmt = conn.createStatement();

             ResultSet rs = stmt.executeQuery(sql);

             while(rs.next())

             {

                 String ip_s = rs.getString("ip");

                 String time_s = rs.getString("time");

                 String day_s = rs.getString("day");

                 int traffic_s = rs.getInt("traffic");

                 String type_s = rs.getString("type");

                 String id_s = rs.getString("id");

                 Bean bean = new Bean(ip_s,time_s,day_s,traffic_s,type_s,id_s);

                 list.add(bean);

             }

         }catch(ClassNotFoundException e){

             e.printStackTrace();

         }catch(IllegalAccessException e){

             e.printStackTrace();

         }catch(InstantiationException e){

             e.printStackTrace();

         }catch(SQLException e){

             e.printStackTrace();

         }

         return list;

     }

 }

SqlForBean

Hive的存储和MapReduce处理——数据清洗（Part2）的更多相关文章

Hive的存储和MapReduce处理——数据清洗
日期:2019.11.13 博客期:115 星期三 Result文件数据说明: Ip:106.39.41.166,(城市) Date:10/Nov/2016:00:01:02 +0800,(日期) D ...
Hive的存储和MapReduce处理——数据清洗（Part3）
日期:2019.11.17 博客期:118 星期日这几天在写程序的时候虚拟机崩了,无语~所以重新从最初的状态开始配环境,重新整理之前的所有代码程序.
升级版:深入浅出Hadoop实战开发(云存储、MapReduce、HBase实战微博、Hive应用、Storm应用)
Hadoop是一个分布式系统基础架构,由Apache基金会开发.用户可以在不了解分布式底层细节的情况下,开发分布式程序.充分利用集群的威力高速运算和存储.Hadoop实现了一个分布式文件系 ...
Hive| 压缩| 存储| 调优
Hadoop压缩配置修改Hadoop集群具有Snappy压缩方式: 查看hadoop支持的压缩方式 [kris@hadoop101 datas]$ hadoop checknative 将编译好的支 ...
spark2.1：读取hive中存储的多元组（string,double）失败
这两天和同事一起在想着如何把一个表的记录减少,表记录包含了:objectid(主小区信息),gridid(归属栅格),height(高度),rsrp(主小区rsrp),n_objectid(邻区),n ...
hive优化之调整mapreduce数目
一.调整hive作业中的map数 1.通常情况下,作业会通过input的目录产生一个或者多个map任务.主要的决定因素有: input的文件总个数,input的文件大小,集群设置的文件块大小(目前为1 ...
Hive快捷查询:不启用Mapreduce job启用Fetch task
启用MapReduce Job是会消耗系统开销的.对于这个问题,从Hive0.10.0版本开始,对于简单的不需要聚合的类似SELECT <col> from <table> L ...
Hive基础之Hive的存储类型
Hive常用的存储类型有: 1.TextFile: Hive默认的存储类型:文件大占用空间大,未压缩,查询慢: 2.Sequence File:将属于以<KEY,VALUE>的形式序列化到 ...
HIve数据存储
表 Table 内部表 Partition 分区表 External Table 外部表 Bucket Table 桶表内部表分区表 parttion对应于数据库中的Partition列的密集索引 ...

随机推荐

迭代器，for循环本质，生成器，常用内置方法，面向过程编程
一.迭代器 1.迭代:更新换代(重复)的过程,每次的迭代都必须基于上一次的结果迭代器:迭代取值的工具 2.迭代器给你提供了一种不依赖于索引取值的方式 3.可以迭代取值的对象:字符串,列表,元组,字典 ...
Vue——项目中接口返回值为函数回调，回调函数定义方法（Vue的方法给原生调用）
在接口调用中,有时会返回给我们一个函数回调,来自动执行我们在前端定义好的某个函数(多出现于通过回调的方式传递某个数值).在原生项目中,我们只要提供一下这个方法就好了,通过函数回调会自动执行.问题就出现 ...
C 语言实例 -求分数数列1/2+2/3+3/5+5/8+...的前n项和
程序分析:抓住分子与分母的变化规律:分子a:1,2,3,5,8,13,21,34,55,89,144...分母b:2,3,5,8,13,21,34,55,89,144,233...分母b把数赋给了分子 ...
git 工具常见命令
1.git是什么 git是分布式版本管理工具,一台电脑既可以是客户端,也可以是服务端.工作过程中可以断开网络. git中的三个概念: 1.版本库:在初始化git版本库之后会生成一个隐藏的文件, .gi ...
web前端安全性
跨站脚本攻击(XSS攻击) XSS(Cross Site Scripting),跨站脚本攻击.XSS是常见的Web攻击技术之一.所谓的跨站脚本攻击指得是:恶意攻击者往Web页面里注入恶意Script代 ...
Fluent_Python_Part2数据结构，02-array-seq，序列类型
1. 序列数据例如字符串.列表.字节序列.元组.XML元素.数据库查询结果等,在Python中用统一的风格去处理.例如,迭代.切片.排序.拼接等. 2. 容器序列与扁平序列容器序列:容器对象包含任 ...
ORM框架的概述
ORM: object relation mapping [对象][关系]映射将对象映射到数据库中类名数据库表名对象 ...
一个含有Fibonacci Number的级数
\[\Large\displaystyle \sum_{n=0}^\infty \frac{1}{F_{2n+1}+1}=\frac{\sqrt5}{2}\] \(\Large\mathbf{Proo ...
吴裕雄--天生自然TensorFlow2教程：损失函数及其梯度
import tensorflow as tf x = tf.random.normal([2, 4]) w = tf.random.normal([4, 3]) b = tf.zeros([3]) ...
WLC开机卡在launching....（变砖）
1.出现故障的原因:A.通过手动更换镜像导致Boot Loader Menu Run primary image (7.0.220.0) - ActiveRun backup image (7.0.2 ...

Hive的存储和MapReduce处理——数据清洗（Part2）

Hive的存储和MapReduce处理——数据清洗（Part2）的更多相关文章

随机推荐

热门专题