Spark+Scalar+Mysql

包：mysql-connector-java-5.1.39-bin.jar

平台：Win8.1

环境：MyEclipse2015

hadoop-2.7.3.tar.gz + winutils.exe

spark-2.1.0-bin-hadoop2.7.tgz

scala-2.11.8.tgz

package org.ah.rcmd

import java.sql.{ DriverManager, PreparedStatement, Connection }

object Rdbms {

  def setRcmdResult(iterator: Iterator[(String, String, String, String, String, String)]): Unit = {

    var conn: Connection = null

    var ps: PreparedStatement = null

    val sbSqlUpdate = new StringBuilder;

    sbSqlUpdate ++= " UPDATE recommond"

    sbSqlUpdate ++= " SET"

    sbSqlUpdate ++= "     url1 = ?,"

    sbSqlUpdate ++= "     url2 = ?,"

    sbSqlUpdate ++= "     url3 = ?,"

    sbSqlUpdate ++= "     url4 = ?,"

    sbSqlUpdate ++= "     url5 = ?"

    sbSqlUpdate ++= " WHERE uName = ?"

    val sqlInsert = "insert into recommond(url1,url2,url3,url4,url5,uName) values (?,?,?,?,?,?)"

    try {

      conn = DriverManager.getConnection("jdbc:mysql://localhost:3306/ahrecommend",

        "root", "root")

      iterator.foreach(data => {

        ps = conn.prepareStatement(sbSqlUpdate.toString)

        ps.setString(1, data._2)

        ps.setString(2, data._3)

        ps.setString(3, data._4)

        ps.setString(4, data._5)

        ps.setString(5, data._6)

        ps.setString(6, data._1)

        if (ps.executeUpdate < 1) {

          ps = conn.prepareStatement(sqlInsert)

          ps.setString(1, data._2)

          ps.setString(2, data._3)

          ps.setString(3, data._4)

          ps.setString(4, data._5)

          ps.setString(5, data._6)

          ps.setString(6, data._1)

          ps.executeUpdate()

        }

      })

    } catch {

      case e: Exception => println(e.fillInStackTrace())

    } finally {

      if (ps != null) {

        ps.close()

        ps = null

      }

      if (conn != null) {

        conn.close()

        conn = null

      }

    }

  }

}

package org.ah.rcmd

import org.apache.spark.{ SparkContext, SparkConf }

object RDDtoMysql {

  def main(args: Array[String]) {

    val conf = new SparkConf().setAppName("RDDToMysql").setMaster("local")

    val sc = new SparkContext(conf)

    // 获取数据

    val data = sc.parallelize(List(("Andy", "W1", "W2", "W3", "W4", "W5"), ("Cat", "W1", "W1", "W1", "W1", "W1")))

    // 写入数据库

    data.foreachPartition(Rdbms.setRcmdResult)

  }

}

Spark+Scalar+Mysql的更多相关文章

使用Apache Spark 对 mysql 调优查询速度提升10倍以上
在这篇文章中我们将讨论如何利用 Apache Spark 来提升 MySQL 的查询性能. 介绍在我的前一篇文章Apache Spark with MySQL 中介绍了如何利用 Apache Spa ...
记录一次spark连接mysql遇到的问题
版权声明:本文为博主原创文章,未经博主允许不得转载在使用spark连接mysql的过程中报错了,错误如下 08:51:32.495 [main] ERROR - Error loading fact ...
[Spark][Python]Spark 访问 mysql , 生成 dataframe 的例子：
[Spark][Python]Spark 访问 mysql , 生成 dataframe 的例子: mydf001=sqlContext.read.format("jdbc").o ...
spark SQL学习（spark连接 mysql）
spark连接mysql(打jar包方式) package wujiadong_sparkSQL import java.util.Properties import org.apache.spark ...
spark练习--mysql的读取
前面我们一直操作的是,通过一个文件来读取数据,这个里面不涉及数据相关的只是,今天我们来介绍一下spark操作中存放与读取 1.首先我们先介绍的是把数据存放进入mysql中,今天介绍的这个例子是我们前两 ...
spark读写mysql
spark读写mysql除官网例子外还要指定驱动名称 travels.write .mode(SaveMode.Overwrite) .format("jdbc") .option ...
spark 存取mysql
1.先上代码,存入mysql val spark = SparkSession.builder() .appName("jdbc") .getOrCreate() import s ...
Spark操作MySQL，Hive并写入MySQL数据库
最近一个项目,需要操作近70亿数据进行统计分析.如果存入MySQL,很难读取如此大的数据,即使使用搜索引擎,也是非常慢.经过调研决定借助我们公司大数据平台结合Spark技术完成这么大数据量的统计分析. ...
大数据项目实践：基于hadoop+spark+mongodb+mysql+c#开发医院临床知识库系统
一.前言从20世纪90年代数字化医院概念提出到至今的20多年时间,数字化医院(Digital Hospital)在国内各大医院飞速的普及推广发展,并取得骄人成绩.不但有数字化医院管理信息系统(HIS ...

随机推荐

doxygen
//commndline: doxygen Doxyfile /**comment /* /** time diff@pre precondition@post endcondition@throw ...
learning makefile .PHONY
PHP+ffmpeg+nginx的配置实现视频转码
最近项目中需要实现上传视频过程中自动转码MP4格式的功能,想到了用FFmpeg来实现它,但从来没有操作过,查阅了很多资料,遇到了好多问题,现在终于安装成功,觉得应该写下来与人分享一下,以免有人遇到和我 ...
base64详解及实现
概述 base64 说起来大家应该都是很熟悉的,很多类型的数据都可以转成base64的编码规则,例如图片,pdf,文本,邮件内容等. 什么是base64 根据RFC2045的定义,base64被定义为 ...
java中求余%与取模floorMod的区别
初学java的时候接触的%这个符号百分号? 求余? 取模? 我只知道不是百分号,好像是求余,听别人那叫求模运算符,跟求余一样,于是我便信了. 思考之后开始迷糊,然后经过多次考证得到以下结论. 首先, ...
springcloud学习计划
后续参考学习spring cloud https://blog.csdn.net/forezp/article/details/70148833 https://github.com/forezp/S ...
javascript 统计字符串中每个字符出现的次数
var str = "abdcadfasfdbadfafdasdfasyweroweurowqrewqrwqrebwqrewqrejwq;;"; // console.log(nu ...
centos7.3 64位安装git
1.安装编译git时需要的包 # yum install curl-devel expat-devel gettext-devel openssl-devel zlib-devel # yum ins ...
leetcode题解 1.TwoSum
1. Two Sum Given an array of integers, return indices of the two numbers such that they add up to a ...
【oracle入门】Oracle数据库11g企业版主要优点
高可靠性.能够尽可能地放置服务器故障.站点故障和人为错误的发生. 高安全信息.可以利用行级安全性.细粒度审计.透明的数据加密和数据的全面会议确保数据安全和遵守法规. 更好的数据管理.轻松管理最大型数据 ...

Spark+Scalar+Mysql

Spark+Scalar+Mysql的更多相关文章

随机推荐

热门专题