spark_to_kakfa

package kafka

import java.io.InputStream

import java.text.SimpleDateFormat

import java.util.{Date, HashMap, Properties}

import com.google.gson.JsonObject

import org.apache.kafka.clients.producer.{KafkaProducer, ProducerConfig, ProducerRecord}

import org.apache.spark.SparkConf

import org.apache.spark.sql.SparkSession

object ExpandTimes {

  val prop = new Properties()

  val is: InputStream = this.getClass().getResourceAsStream("/conf.properties")

  prop.load(is)

  val ENVIRONMENT_SETING = "expandtimes_brokers_prd"

  private val brokers = prop.getProperty(ENVIRONMENT_SETING)

  // Zookeeper connection properties

  private val props = new HashMap[String, Object]()

  props.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG, brokers)

  props.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG,

    "org.apache.kafka.common.serialization.StringSerializer")

  props.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG,

    "org.apache.kafka.common.serialization.StringSerializer")

  private val producer = new KafkaProducer[String, String](this.props)

  def main(args: Array[String]): Unit = {

    val sparkConf = new SparkConf().setAppName("ExpandTimes")

    val spark = SparkSession.builder().config(sparkConf).enableHiveSupport().getOrCreate()

    val date = new Date(new Date().getTime - 86400000L)

    val dateFormat = new SimpleDateFormat("yyyyMMdd")

    val statisDate = dateFormat.format(date)

    val querySql1 = "select member_id,times from sospdm.tdm_rpt_sign_expand_great_seven_d where statis_date = " + statisDate

    val resultDF1 = spark.sql(querySql1)

    if(!ENVIRONMENT_SETING.contains("prd")){

      resultDF1.show(10)

    }

    resultDF1.rdd.foreach(row => {

      val member_id: String = row.getAs[String]("member_id").toString()

      val times: Int = row.getAs[Int]("times").toInt

      val json = new JsonObject()

      json.addProperty("memberId", member_id).toString

      json.addProperty("times", times).toString

      kafkaProducerSend(json.toString)

    })

    def kafkaProducerSend(args: String) {

      if (args != null) {

        val topic = "sign_status_count"

        val message = new ProducerRecord[String, String](topic, null, args)

        producer.send(message)

      }

    }

  }

}

spark_to_kakfa的更多相关文章

随机推荐

mongoDB 文档概念
mongoDB 文档概念什么是文档文档是 mongodb 基本的数据组织单元,类似于mysql 中的记录文档由多个键值对组成,每个键值对表达一个数据项属于 bson 数据 ps: bson ...
Input标签使用整理
0 写在前面对于程序而言I/O是一个程序的重要组成部分.程序的输入.输出接口,指定了程序与用户之间的交互方式.对于前端开发而言,input标签也有着其重要地位,它为用户向服务端提交数据提供了可能. ...
关于百度地图（离线）使用过程报“Cannot read property 'jb' of undefined ”错误的解决办法
使用百度地图(离线)API时,地图无法显示,f12查看报错: BaiduApi_2.0.js:1056 Uncaught TypeError: Cannot read property 'jb' of ...
ubuntu:基本操作；
1.系统时间与网络时间同步: sudo dpkg-reconfigure tzdata 注: 该博文为扩展型:
主机管理+堡垒机系统开发：strace命令用法详解（六）
一.简单介绍 strace是什么? 按照strace官网的描述, strace是一个可用于诊断.调试和教学的Linux用户空间跟踪器.我们用它来监控用户空间进程和内核的交互,比如系统调用.信号传递.进 ...
关于微信登录授权获取unionid的方法
前言:微信登录授权是目前普遍存在于小程序的,还有一种静默授权方式是微信提供的但是不推荐使用,由于不同设备登录openid是不同的那么我们应该怎样拿到一个唯一的ID呢,下面做分享 wxml代码 < ...
第二节：如何正确使用WebApi和使用过程中的一些坑
一. 基本调用规则 1. 前提 WebApi的默认路由规则为:routeTemplate: "api/{controller}/{id}", 下面为我们统一将它改为 routeTe ...
第十七节: EF的CodeFirst模式的四种初始化策略和通过Migration进行数据的迁移
一. 四种初始化策略 EF的CodeFirst模式下数据库的初始化有四种策略: 1. CreateDatabaseIfNotExists:EF的默认策略,数据库不存在,生成数据库:一旦model发生变 ...
Groovy 设计模式 -- 保镖模式
Bouncer Pattern http://groovy-lang.org/design-patterns.html#_bouncer_pattern 保镖模式主要负责对函数的输入参数的合法性检查, ...
sublime text3格式化html,css,js代码
需要安装HTML/CSS/JS prettify插件. 安装步骤:首选项 -> Package Control -> Install Package -> HTML-CSS-JS P ...

spark_to_kakfa

spark_to_kakfa的更多相关文章

随机推荐

热门专题