大数据学习day13------第三阶段----scala01-----函数式编程。scala以及IDEA的安装，变量的定义，条件表达式，for循环（守卫模式，推导式，可变参数以及三种遍历方式），方法定义，数组以及集合（可变和非可变），数组中常用的方法

具体见第三阶段scala-day01中的文档（scala编程基础---基础语法）

1. 函数式编程（https://www.cnblogs.com/wchukai/p/5651185.html）：

将业务逻辑细化，抽象，封装成一个个功能函数，并借助语言自带的高阶函数api，将整个业务流程转化为函数之间的相互调用，这就是函数式编程。

　　我们可以看到，函数式编程中，函数不仅直接调用，也可以当成参数被其他函数调用。因此，进一步，如果我不仅想把函数当参数，还想传入值，所以再封装一下，函数和值封装后是什么。

函数->行为
值->属性

没错这就是对象

将业务逻辑细化，抽象，封装成一个个对象，并借助语言，库，组件，框架等，将整个业务流程转化为对象之间的相互调用，这就是面向对象编程。

因此，这么看来，函数式跟面向对象的思想其实都是一致的，即对逻辑的抽象与封装。

原点：

回顾下语言的历程

过程式->函数式->面向对象

近年来大数据的兴起，数据的处理往往跟面向对象没关系，更多的是简单而大量的数据结构，借助mapreduce这样的高阶函数处理更加方便，这也是函数式编程又火起来的原因。

程序只不过是回到了它的原点：

算法+数据结构->函数+高阶函数+数据。

下面笔记来源：https://www.zhihu.com/question/28292740

2. for 循环

（1） 重点：守卫模式和推导式

守卫模式

for(i <- 1 to 10 if i >3){满足条件的执行此逻辑}

推导式

  def main(args: Array[String]): Unit = {

    val arr = Array(1, 2, 3, 4, 6, 5)

    val new_arr = for(i <- arr if i >3) yield i*2  //推导式

    println(new_arr.toBuffer)

  }

}

（2）可变参数

/**

 * 可变参数

 */

object Demo2 {

  def main(args: Array[String]): Unit = {

    operation("hello","spark","hadoop","flink")

  }

  def operation(s:String*): Unit ={

    s.foreach(x=>println(x))

  }

}

（3）三种遍历模式如下：

第一种：相当于java中的增强for循环

// 第一种：增强for循环的遍历方式

    val arr = Array(1, 2, 3, 4, 6, 5)

    for (elem <- arr) {

      println("第一种遍历方式："+elem)

    }

第二种：角标索引的方式

  // 第二种：角标索引的方式

    for (index <- arr.indices) {    // 此处的arr.indices相当于：0 util arr.length

      println("第二种遍历方式："+arr(index))

    }

第三种：调用foreach方法，此种适合校验

// 第三种：调用foreach方法，此种适合校验

    arr.foreach(e=>print("第三种遍历方式："+e))

  }

3. 数组中常用的方法

 * 1 update(index,newVal)  更新元素

 * -------2 reverse 空参的方法  将数组反转

 * 3 reduce 每个元素累计操作  聚合操作

 * 4 max 获取数组中的最大元素

 * 5 min 获取数组中最小的元素

 * -------6 sorted 将数组中的元素按照默认的排序  数值(小--->大)  字符串(字段的先后排序)   自定义的类???

 * 7 exists 判断是否有符合要求的元素

 * 8 drop(num)  从0的位置删除n个元素（dropright(num)表示从尾部删除n个元素）

 * -------9 distinct 去除数组中重复的元素

 * -------10 sum 求和

 * -------11 map  遍历数组中的每个元素  分别处理  将处理的结果返回到一个新的数组中（map(f:Int=>B)  map(f:String=>{})  B block，即为代码块）

 * -------12 foreach  遍历数组中的每个元素  没有返回值  一般用于打印（foreach[U](f:Int=>U)，此处的U即为Unit）

 * -------13 contains(elem)  判断数组中是否包含某个元素

 * -------数组的定义

 * -------数组的遍历

 */

大数据学习day13------第三阶段----scala01-----函数式编程。scala以及IDEA的安装，变量的定义，条件表达式，for循环（守卫模式，推导式，可变参数以及三种遍历方式），方法定义，数组以及集合（可变和非可变），数组中常用的方法的更多相关文章

大数据学习--day13(字符串String--源码分析--JVM内存分析)
字符串String--源码分析--JVM内存分析 String 类的对象 , 是不可变的字符串对象呢这个不可变很重要,之后要讲的intern()也离不开它的不可变性. https://www.cnb ...
大数据学习day32-----spark12-----1. sparkstreaming（1.1简介，1.2 sparkstreaming入门程序（统计单词个数，updateStageByKey的用法，1.3 SparkStreaming整合Kafka，1.4 SparkStreaming获取KafkaRDD的偏移量，并将偏移量写入kafka中）
1. Spark Streaming 1.1 简介(来源:spark官网介绍) Spark Streaming是Spark Core API的扩展,其是支持可伸缩.高吞吐量.容错的实时数据流处理.Sp ...
大数据学习笔记——Java篇之集合框架(ArrayList)
Java集合框架学习笔记 1. Java集合框架中各接口或子类的继承以及实现关系图: 2. 数组和集合类的区别整理: 数组: 1. 长度是固定的 2. 既可以存放基本数据类型又可以存放引用数据类型 3 ...
大数据学习（一） | 初识 Hadoop
作者: seriouszyx 首发地址:https://seriouszyx.top/ 代码均可在 Github 上找到(求Star) 最近想要了解一些前沿技术,不能一门心思眼中只有 web,因为我目 ...
大数据学习笔记——Linux完整部署篇(实操部分)
Linux环境搭建完整操作流程(包含mysql的安装步骤) 从现在开始,就正式进入到大数据学习的前置工作了,即Linux的学习以及安装,作为运行大数据框架的基础环境,Linux操作系统的重要性自然不言 ...
大数据学习day29-----spark09-------1. 练习：统计店铺按月份的销售额和累计到该月的总销售额（SQL, DSL,RDD） 2. 分组topN的实现（row_number(), rank(), dense_rank()方法的区别）3. spark自定义函数-UDF
1. 练习数据: (1)需求1:统计有过连续3天以上销售的店铺有哪些,并且计算出连续三天以上的销售额第一步:将每天的金额求和(同一天可能会有多个订单) SELECT sid,dt,SUM(mone ...
大数据学习系列之四 ----- Hadoop+Hive环境搭建图文详解(单机)
引言在大数据学习系列之一 ----- Hadoop环境搭建(单机) 成功的搭建了Hadoop的环境,在大数据学习系列之二 ----- HBase环境搭建(单机)成功搭建了HBase的环境以及相关使用 ...
大数据学习系列之五 ----- Hive整合HBase图文详解
引言在上一篇大数据学习系列之四 ----- Hadoop+Hive环境搭建图文详解(单机) 和之前的大数据学习系列之二 ----- HBase环境搭建(单机) 中成功搭建了Hive和HBase的环 ...
大数据学习系列之六 ----- Hadoop+Spark环境搭建
引言在上一篇中大数据学习系列之五 ----- Hive整合HBase图文详解 : http://www.panchengming.com/2017/12/18/pancm62/ 中使用Hive整合 ...

随机推荐

无判断max 牛客网程序员面试金典 C++ Python
无判断max 牛客网程序员面试金典 C++ Python 题目描述请编写一个方法,找出两个数字中最大的那个.条件是不得使用if-else等比较和判断运算符. 给定两个int a和b,请返回较大的 ...
AtCoder Beginner Contest 215 F题题解
F - Dist Max 2 什么时候我才能突破$F$题的大关... 算了,不说了,看题. 简化题意:给定$n$个点的坐标,定义没两个点的距离为\(min(|x_i-x_j|,|y_i-y_j ...
微服务（七）Gateway服务网关
1 为什么要有网关权限控制:网关作为微服务入口,需要校验用户是是否有请求资格,如果没有则进行拦截. 路由和负载均衡:一切请求都必须先经过gateway,但网关不处理业务,而是根据某种规则,把请求转发 ...
在纯JaveScript中实现报表导出：从“PDF”到“JPG”
我们在前端报表中完成了各种工作数据的输入或内容处理之后,需要做什么? 数据的导出! 这些数据的常用导出格式有:PDF.Excel.HTML和图片几大类型. 但总有一些实际应用场景,需要的不仅仅是将现有 ...
native连接远程mysql数据库
1.环境 CentOS7.mysqld 8.0.19 2.登录数据库 #mysql -u root -p 2.修改root登录地址为%(任何IP) mysql> update user set ...
PTA 7-4 最小生成树的唯一性 (35分)
PTA 7-4 最小生成树的唯一性 (35分) 给定一个带权无向图,如果是连通图,则至少存在一棵最小生成树,有时最小生成树并不唯一.本题就要求你计算最小生成树的总权重,并且判断其是否唯一. 输入格式: ...
Solon 1.5.67 发布，增加 GraalVm Native 支持
Solon 已有120个生态扩展插件,此次更新主要为细节打磨: 添加 solon.extend.graalvm 插件,用于适配 graalvm native image 模式从此,solon 进入 ...
13-Semi-supervised Learning
半监督学习(semi-supervised learning) 1.introduction 2.Semi-supervised Learning for Generative Model 3.Low ...
Go语言核心36讲（Go语言实战与应用九）--学习笔记
31 | sync.WaitGroup和sync.Once 我们在前几次讲的互斥锁.条件变量和原子操作都是最基本重要的同步工具.在 Go 语言中,除了通道之外,它们也算是最为常用的并发安全工具了. 说 ...
[hdu7097]Just a Data Structure Problem
(四边形不等式的套路题) 对于某一组$a_{i}$,显然可以区间dp,设$f_{l,r}$表示区间$[l,r]$的答案,则转移即$$f_{l,r}=\begin{cases}0&(l=r)\ ...

随机推荐

热门专题