Spark小课堂Week5 Scala初探

Scala是java威力加强版。

对Java的改进

这里会结合StreamingContext.scala这个代码说明下对Java的改进方面。

方便测试方式，增加了可以指定位置的作用域。
成员变量声明，构造方法，get、set方法一体化。
[]表示泛型，不是<>

class StreamingContext private[streaming] (

     sc_ : SparkContext,

         cp_ : Checkpoint, 

    batchDur_ : Duration 

  ) extends Logging

case声明Java Bean，省掉new的操作

private[scheduler] sealed trait JobSchedulerEvent

 private[scheduler] case class JobStarted(job: Job, startTime: Long) extends JobSchedulerEvent

用val控制声明周期，防止他人重新构造，已将所有基本类型对象化，所以val内容是可变的
提供类型推断，对于编译器可推断类型无需定义

private[streaming] val isCheckpointPresent = (cp_ != null)

会自动根据分支的最后一个逻辑返回，不需要return，可以表达式来定义逻辑

private[streaming] var checkpointDir: String = {

   if (isCheckpointPresent) {

       sc.setCheckpointDir(cp_.checkpointDir) 

    cp_.checkpointDir 

  } else { 

    null 

  }

   }

用None替代null，由定义方来定义是否可能空指针情况，降低调用方的开发难度

private[streaming] val uiTab: Option[StreamingTab] = 

  if (conf.getBoolean("spark.ui.enabled", true)) { 

    Some(new StreamingTab(this)) 

  } else { 

    None 

  }

作业

题目

在RDD.scala中没有sortByKey方法，为什么可以调用。

解析

Scala中有一个非常强大的隐式转换功能，可以实现方法的动态注入。

以下是范例代码。可以看到通过隐式转换方法，可以动态给Person类添加toCode这个方法。

在Spark源码中到处使用。

class Person(val name:String)

class Engineer(val name:String,val salary:Double){

    def code = println("coding:" + name)

}

def toCode(p:Person){

    p.code

}

implicit def personToEngineer(p:Person) : Engineer= {

    new Engineer(p.name,0);

}

new Person("aa").code

关于

小课堂是在公司进行内部交流的一系列主题，偏基础，但是比较零散，持续更新中。

Spark小课堂Week5 Scala初探的更多相关文章

Spark小课堂Week6 启动日志详解
Spark小课堂Week6 启动日志详解作为分布式系统,Spark程序是非常难以使用传统方法来进行调试的,所以我们主要的武器是日志,今天会对启动日志进行一下详解. 日志详解今天主要遍历下Strea ...
Spark小课堂Week7 从Spark中一个例子看面向对象设计
Spark小课堂Week7 从Spark中一个例子看面向对象设计今天我们讨论了个问题,来设计一个Spark中的常用功能. 功能描述:数据源是一切处理的源头,这次要实现下加载数据源的方法load() ...
Spark小课堂Week4 从控制台看Spark逻辑结构
Spark小课堂Week4 从控制台看Spark逻辑结构层级关系: 从监控控制台,我们可以看到如下关系: 一个 Job 包含 n Stage 一个 Stage 包含 n Task Job0解决什么问 ...
Spark小课堂Week3 FirstSparkApp(Dataframe开发)
Spark小课堂Week3 FirstSparkApp(代码优化) RDD代码简化对于昨天练习的代码,我们可以从几个方面来简化: 使用fluent风格写法,可以减少对于中间变量的定义. 使用lamb ...
Spark小课堂Week3 FirstSparkApp(RDD开发)
Spark小课堂Week3 FirstSparkApp 问题:Java有哪些数据结构大致有如下几种,其中List与Map是最重要的: List Map Set Array Heap Stack Qu ...
Spark小课堂Week2 Hello Streaming
Spark小课堂Week2 Hello Streaming 我们是怎么进行数据处理的? 批量方式处理目前最常采用的是批量方式处理,指非工作时间运行,定时或者事件触发.这种方式的好处是逻辑简单,不影响 ...
Spark小课堂Week1 Hello Spark
Spark小课堂Week1 Hello Spark 看到Spark这个词,你的第一印象是什么? 这是一朵"火花",官方的定义是Spark是一个高速的.通用的.分布式计算系统!!! ...
小课堂Week9 例外处理设计的逆袭Part2
小课堂Week9 例外处理设计的逆袭Part2 今天继续阅读<例外处理设计的逆袭>这本书,我们先看两个案例: 案例1 问:如果要设计一个依据学号到数据库中查询学生资料的函数,当找不到符合条 ...
Spark新手入门——1.Scala环境准备
主要包括以下三部分,本文为第一部分: 一. Scala环境准备二. Hadoop集群(伪分布模式)安装查看三. Spark集群(standalone模式)安装查看因Spark任务大多由Sca ...

随机推荐

Android（java）学习笔记94：关于广播接收者的注册和使用心得
下面我们先看一部分代码,由代码进行进一步的深入: registerReceiver( new BroadcastReceiver() {//onReceive中代码的执行时间不要超过5s,androi ...
xcode笔记
1.Alt键的使用 2.设置捕捉所有意外断点:停在代码出错处 2015年07月27日09:52:12 3.搜索 command + F:在当前的文件中搜索 command + Shift ...
hdu 3333 树状数组
思路:定义一个map容器用来记录数ai上次出现的位置.将查询区间按右边界升序进行排序,当插入第i个数ai时,pre[ai]+1---->i的区间就会多一个不同的数,其值就是ai,那么可以用upd ...
Evaluation of Expression Tree
Evaluation of Expression Tree Given a simple expression tree, consisting of basic binary operators i ...
转载js实现打印功能
<div id="print">打印的内容</div><a href="javascript:void(0)" onclick=& ...
关于Could not parse configuration: /hibernate.cfg.xml的问题
第一次在eclipse上配置hibernate,问题百出啊,比如下面的org.hibernate.HibernateException: Could not parse configuration: ...
jQuery中的经典动画
show()方法和hide()方法是jQuery中的基本动画方法,hide()方法等于将css()方法设置display属性为none.如何让元素动起来呢,我们可以在show和hide里加入slow, ...
Android 分析工具 APKAnalyser
APKAnalyser 是 Android 静态,虚拟分析工具,用来测试和验证 Android 应用的开发工作.ApkAnalyser 是个完整的工具链,可以修改二进制应用.用户可以改装,安装,运行, ...
Mac电脑svn使用经验,Mac电脑使用android studio使用经验
1.先查看mac本身是否自带java1.6 没有去appstore里面安装 2.http://www.android-studio.org/ 下载mac版的ide 3.安装完成ide后,打开and ...
sql防注入式
SQL注入式攻击是利用是指利用设计上的漏洞,在目标服务器上运行Sql命令以及进行其他方式的攻击动态生成Sql命令时没有对用户输入的数据进行验证是Sql注入攻击得逞的主要原因.比如: 如果你的查询语句是 ...

Spark小课堂Week5 Scala初探

Spark小课堂Week5 Scala初探

对Java的改进

作业

题目

解析

关于

Spark小课堂Week5 Scala初探的更多相关文章

随机推荐

热门专题