Scala Collection Method
接收一元函数
map转换元素,主要应用于不可变集合(1 to 10).map(i => i * i)
(1 to 10).flatMap(i => (1 to i).map(j => i * j))
transform与map相同,不过用于可变集合,直接转换ArrayBuffer("Peter", "Paul", "Mary").transform(_.toUpperCase)
collect接收偏函数(PartialFunction)作为参数;模式匹配也是一种偏函数"-3+4".collect {
case '+' => 1 ;
case '-' => -1
} // Vector(-1, 1)
groupBy按指定函数分组,返回Mapval words = Array("Abc", "ab")
val map = words.groupBy(_.substring(0, 1).toUpperCase)
// Map(A -> Array(Abc, ab))
接收二元函数
reduceLeft从左向右规约f(f(f(a, b), c), d)
List(1, 7, 2, 9).reduceLeft(_ - _)
// ((1 - 7) - 2) - 9 = 1 - 7 - 2 - 9 = -17
reduceRight从右向左规约f(a, f(b, f(c, d)))List(1, 7, 2, 9).reduceRight(_ - _)
// 1 - (7 - (2 - 9)) = 1 - 7 + 2 - 9 = -13
foldLeft提供初始值+二元函数,从左向右折叠,每次计算结果在左侧- 可用
/:(表示树形左侧)操作符表示,(init /: collection)(function)
- 可用
foldRight提供初始值+二元函数,从右向左折叠,每次计算结果在右侧- 可用
:\(表示树形右侧)操作符表示,(collection :\ init)(function)
List(1, 7, 2, 9).foldLeft(0)(_ - _)
(0 /: List(1, 7, 2, 9))(_ - _)
// 0 - 1 - 7 - 2 - 9 = -19
- 可用
scanLeft和scanRight结合了 folding 和 mapping,结果为所有的中间过程值(1 to 10).scanLeft(0)(_ + _) // Vector(0, 1, 3, 6, 10, 15, 21, 28, 36, 45, 55)
zip拉链,即将两个集合各个元素像拉链一样交叉结合在一起List(1,2,3) zip List("a","b","c") // List((1,a), (2,b), (3,c))
- 长度不一致的集合则以较小的长度为准
zipAll为长度较短的集合设置默认值,this.zipAll(that, thisDefault, thatDefault)
zipWithIndex返回元素及对应的下标"Scala".zipWithIndex
// Vector((S,0), (c,1), (a,2), (l,3), (a,4))
view为集合创建延迟视图val lazyView = (1 to 1000000).view
lazyView.take(100).last //100
- 对视图的操作都不会立即计算(包括第一个元素也不会)
- 与
Stream不同,不会缓存任何值 apply方法会强制计算整个视图,使用lazyView.take(i).last代替lazyView(i)
par并行化集合,后续应用的方法都会并发计算for (i <- (0 until 100).par) print(s" $i")
// 1-99
很好的解决并发编程问题
将集合变为对于的并行化实现
对于产生的结果,与串行方式的结果一致 (如
for...yield...)可使用
seq,toArray等方法将集合还原部分方法不能并发操作
- 使用
reduce替代reduceLeft,先对各部分集合操作,然后聚合结果,但操作必须满足结合律 - 使用
aggregate替代foldLeft,先对各部分集合操作,然后用另一个操作将结果聚合
str.par.aggregate(Set[Char]())(_ + _, _ ++ _)
// 等价于
str.foldLeft(Set[Char]())(_ + _)
```- 使用
Scala Collection Method的更多相关文章
- spark1.5 scala.collection.mutable.WrappedArray$ofRef cannot be cast to ...解决办法
下面是我在spark user list的求助贴,很快就得到了正确回答,有遇到问题的同学解决不了也可以去上面提问. I can use it under spark1.4.1,but error on ...
- Scala Collection简介
Traversable vs Iterable Traversable, Iterable 都是trait. Iterable 继承 Traversable. Traversable: 支持forea ...
- idea中使用scala运行spark出现Exception in thread "main" java.lang.NoClassDefFoundError: scala/collection/GenTraversableOnce$class
idea中使用scala运行spark出现: Exception in thread "main" java.lang.NoClassDefFoundError: scala/co ...
- spark提示Caused by: java.lang.ClassCastException: scala.collection.mutable.WrappedArray$ofRef cannot be cast to [Lscala.collection.immutable.Map;
spark提示Caused by: java.lang.ClassCastException: scala.collection.mutable.WrappedArray$ofRef cannot b ...
- Apache Spark Exception in thread “main” java.lang.NoClassDefFoundError: scala/collection/GenTraversableOnce$class
问题: 今天用Maven搭建了一个Spark的Scala项目,运行后遇到下面异常: Apache Spark Exception in thread “main” java.lang.NoClassD ...
- scala之method和function的区别
在我没有学习scala的时候,主要用java和python做日常工作开发,印象中,没有特别的刻意的去区分method和function的区别,这个关系,正如我们日常生活中,没有刻意的去区分质量和重量. ...
- mongodb collection method
https://docs.mongodb.com/manual/reference/method/db.collection.bulkWrite/ db.coll_test.getIndexes()# ...
- scala.collection.immutable.HashSet$.empty()Lscala/collection/immutable/HashSet
最近重新搭了spark环境.在Master上使用了IDEA来写代码.确实很方便.我用的是hadoop2.6.spark1.5.1forhadoop2.6. scala之前用的是2.11.0老是报这个错 ...
- Exception in thread "main" java.lang.NoSuchMethodError: scala.collection.immutable.HashSet$.empty()Lscala/collection/immutable/HashSet;
注意spark的Scala版本和java版本 修改后为官方指定的版本正常运行 Error:scalac: Error: object FloatRef does not have a member c ...
随机推荐
- 记录Mac OS下编译Thrift库
方法一:brew管理工具安装Homebrew是Mac开发包管理工具,类似于Linux的apt-get之类的,实它相当于开发软件界的 Appstore.借助该管理工具,可以自动化地安装软件包,它会自动安 ...
- 在eclipse中使用Maven分模块搭建SSM框架,创建jar、war、pom工程模块教学,项目的热部署,需要的可以留下邮箱,给大家发整理过的Maven笔记
第一章:Maven概述 (1)Maven是一个项目构建工具,由apache提供,用Java开发的 (2)构建工具:Ant(蚂蚁),Maven(专家) (3)构建工具作用:帮助程序员进行项目的创建,目录 ...
- Mysql高性能优化规范
数据库命令规范 所有数据库对象名称必须使用小写字母并用下划线分割 所有数据库对象名称禁止使用mysql保留关键字(如果表名中包含关键字查询时,需要将其用单引号括起来) 数据库对象的命名要能做到见名识意 ...
- Python与设计模式之单例模式
一.什么是单例 即单个实例,指的是同一个类实例化多次的结果指向同一个对象,用于节省内存空间 如果我们从配置文件中读取配置来进行实例化,在配置相同的情况下,就没必要重复产生对象浪费内存了 # setti ...
- 用 np.logspace() 创建等比数列
np.logspace( start, stop, num=50, endpoint=True, base=10.0, dtype=None, axis=0, ) Docstring: Return ...
- bootstrap的selectpicker的方法
方法 .selectpicker('val') 您可以通过调用val元素上的方法来设置所选值. 1 2 $('.selectpicker').selectpicker('val', 'Mustard' ...
- LOJ 3120: 洛谷 P5401: 「CTS2019 | CTSC2019」珍珠
题目传送门:LOJ #3120. 题意简述: 称一个长度为 \(n\),元素取值为 \([1,D]\) 的整数序列是合法的,当且仅当其中能够选出至少 \(m\) 对相同元素(不能重复选出元素). 问合 ...
- CentOS7配置本地Yum源
从CentOS7官网下载DVD中存在需要的大部分软件,所以在没有网络的情况下可以配置yum源为本地的DVD,下载速度快,软件稳定.1. 如果使用虚拟机,那么就在虚拟机中挂载DVD的iso文件.2. 使 ...
- PostgreSQL 11 Partitioning Improvements
转自:https://pgdash.io/blog/partition-postgres-11.html PostgreSQL 11, due to be released later this ye ...
- CSS居中方案
1.行内元素或者内联元素 1.垂直居中 设置行高和高度一致,如果没必要设置高度的话,可以直接利用line-height垂直性,直接设置需要的高度为line-height的高度亦可居中 .center- ...