Scala数据结构

主要的集合特质

Scala同时支持可变集合和不可变集合,优先采用不可变集合。集合主要分为三大类:序列(List),集(set),映射(map)。所有的集合都扩展自Iterable特质。对几乎所有的集合类,Scala都同时提供了可变和不可变版本。

  • Seq是一个有先后次序的值的序列。IndexedSeq能够通过整形下表快速访问
  • Set是一个没有先后顺序的集合。
  • Map是一组键值对偶,SortedMap按照键的排序访问其中的实体。

数组

定长数组

val nums  = new Array[Int](10)

变长数组

var b = ArrayBuffer[Int]()

Array与ArrayBuffer的互转

ArrayBuffer = Array.toBuffer
Array = ArrayBuffer.toArray //遍历数组 for (i <- nums) println(i) for (i <- 0 to nums.length - 1) println(nums(i)) for (i <- 0 until nums.length) println(nums(i))

数组转换

转换动作不会修改原数组,而是产生一个新的数组

多维数组

和java一样,多维数组通过数组的数组来实现,可以使用ofDim方法实现

val array = Array.ofDim[Int](2, 3)

//赋值
array(0)(0)=10
array(0)(1)=11
array(0)(2)=12
array(1)(0)=20
array(1)(1)=21
array(1)(2)=22 //遍历
for (i <- array; j <- i) println(j)

和java数组的互操作

Scala数组是通过java进行实现的,所以可以进行互相转换操作,使用AsJavaConverters 或者 AsScalaConverters 进行转换

import scala.collection.mutable.ArrayBuffer
import scala.collection.JavaConverters._ val a = ArrayBuffer("hello", "world")
//转为Java对象 b.command()可以调用java的方法
val b = new ProcessBuilder(a.asJava) //转为Scala
val sb = b.command().asScala

映射

映射就是KV的集合,类似于Java中的Map

映射操作

import scala.collection.mutable

//不可变的构造映射
val map = Map("name" -> "upuptop", "age" -> 10) //可变映射
val map2 = scala.collection.mutable.Map("name" -> "upuptop", "age" -> 10)
//空映射
val map3 = new mutable.HashMap[String, Int]()
//对偶
"name" -> "upuptop"
//对偶元组
var map4 = Map(("name" -> "upuptop"), ("age" -> 10)) //获取值
println(map("name")) //遍历值
for (i <- map) println(i) //同时遍历键值对
for ((k, v) <- map) println(s"key:${k},value:${v}")
//遍历所有的键
for (k <- map.keys) println(k)
//遍历所有的值
for (v <- map.values) println(v) //简便操作
map.foreach(println(_))

注意:

  • 根据键获取值,如没有键会抛异常,可以通过contains方法进行判断是否存在键
  • 不可变映射不能更新

和Java的互操作

与数组相同

元组

元组是不同类型值的聚集,元组使用_1、_2进行访问

元组的下标识从1开始,不是从0开始

//定义元组
var aa = ("app", 123, false)
//访问元组
aa._1
aa._2
aa._3 //打印结果
aa: (String, Int, Boolean) = (app,123,false)
res0: String = app
res1: Int = 123
res2: Boolean = false

注意

  • 元组的下标识从1开始,不是从0开始
  • aa._1 可以写成aa _1(把点换成空格),不能省略空格
  • 元组可用于函数需要返回不止一个值的情况
  • 可以把多个值绑在一起以便他们以后能够被一起处理

队列

队列是一个先进先出的结构

import scala.collection.mutable

var q = new mutable.Queue[Int]()
q += 1
q +=2
q ++= List(3,4,5) //出队 删除 1
q.dequeue() //入队 新加6
q.enqueue(6) q //获取第一个元素
q.head
//获取除了第一元素之外的其他元素
q.tail 打印结果:
import scala.collection.mutable q: scala.collection.mutable.Queue[Int] = Queue()
res0: scala.collection.mutable.Queue[Int] = Queue(1)
res1: scala.collection.mutable.Queue[Int] = Queue(1, 2)
res2: scala.collection.mutable.Queue[Int] = Queue(1, 2, 3, 4, 5) res3: Int = 1 res4: Unit = () res5: scala.collection.mutable.Queue[Int] = Queue(2, 3, 4, 5, 6) res6: Int = 2
res7: scala.collection.mutable.Queue[Int] = Queue(3, 4, 5, 6)

堆栈

Stack 是一个先进后出的结构

import scala.collection.mutable

val s = new mutable.Stack[Int]();

//入栈
s.push(1,2,3,4) //出栈
s.pop() s //取栈顶上的元素 但不出栈
s.top //取除了栈顶的其他元素
s.tail 打印:
import scala.collection.mutable s: scala.collection.mutable.Stack[Int] = Stack() res0: scala.collection.mutable.Stack[Int] = Stack(4, 3, 2, 1) res1: Int = 4 res2: scala.collection.mutable.Stack[Int] = Stack(3, 2, 1) res3: Int = 3 res4: scala.collection.mutable.Stack[Int] = Stack(2, 1)

列表

如果List为空,用Nil来表示

val list1 = List(1, 2, 3)

//第一个元素
list1.head //除了第一个元素的之后元素
list1.tail //将9 放到list1这个列表的最前面
var list2 = 9 :: list1
list2 //组成9,4,2一个列表
var list3 = 9 :: (4 :: (2 :: Nil))
list3 打印结果:
list1: List[Int] = List(1, 2, 3) res0: Int = 1 res1: List[Int] = List(2, 3) list2: List[Int] = List(9, 1, 2, 3)
res2: List[Int] = List(9, 1, 2, 3) list3: List[Int] = List(9, 4, 2)
res3: List[Int] = List(9, 4, 2)

  • 元素不重复
  • 无顺序,默认哈希
  • 有需集(SortedSet,红黑树实现)
val set = Set(1, 2, 3, 3)
val set2 = set + 5
set
set.head
set.tail 打印结果:
set: scala.collection.immutable.Set[Int] = Set(1, 2, 3)
res0: scala.collection.immutable.Set[Int] = Set(1, 2, 3, 5)
res1: scala.collection.immutable.Set[Int] = Set(1, 2, 3)
res2: Int = 1
res3: scala.collection.immutable.Set[Int] = Set(2, 3)

添加去除元素的操作符

  • 向后:+或向前+:追加元素到序列中
  • 添加+元素到无先后次序的集合中
  • -移除元素(map只能加不能减)
  • ++--来批量添加和移除元素
  • 对于列表,优先使用:::::
  • 改值操作有+=,++=,-=,--=
  • 集合可以使用&求交集,|并集
  • 优先使用++&|、尽量不用 ++:+=:++=:
val set = Set(1, 2, 3, 3)
val set1 = Set(2, 3, 4)
//并集 1, 2, 3, 4
set | set1
//交集 2, 3
set & set1

常用方法

这些方法从不改变原有集合。他们返回一个与原集合类型相同的新集合

将函数映射到集合

将一元函数应用到集合中的每一个元素。

map应用于集合中的每一个元素,并产生转换后的一个新元素。

val names = List("peter", "Bob", "Mary")
//List(peter, bob, mary) 通过map方法,传入函数应用到每个元素上
names.map(_.toLowerCase)

flatMap方法同样应用于集合的每一个元素,对于每一个元素产生的一个集合,并将集合中的元素串接在一起。

val names = List("peter", "Bob", "Mary")

def ulcase(s: String) = Vector(s.toLowerCase(), s.toUpperCase())

//peter, PETER, bob, BOB, mary, MARY
names.flatMap(ulcase(_))

化简、折叠、扫描

将二元函数应用到集合中的元素

例如:

化简操作:

val list = List(1, 2, 3, 4, 5)
//(((1-2)-3)-4)-5 = -13
list.reduceLeft(_ - _)
//1-(2-(3-(4-5))) = 3
list.reduceRight(_ - _)

折叠操作

val list = List(1, 2, 3, 4, 5)
//0-1-2-3-4-5
list.foldLeft(0)(_ - _)
//1-(2-(3-(4-(5-0))))
list.foldRight(0)(_ - _)

求字符出现的次数

/*
getOrElse
第一个参数是key,如果该key存在,那么返回key对应的值
第二个参数是默认值,如果key不存在,那么返回默认值 freq += ('a' -> 0)
//i: Int = 1
val i = freq.getOrElse('u', 1)
//a: Int = 0
val a = freq.getOrElse('a', 1)
*/ val line = "upuptop" var freq = scala.collection.mutable.Map[Char, Int]() //循环赋值 如果字符存在那么拿到存储的值进行加1操作 如果没有存储 k为字符 v为1
for (i <- line) freq(i) = freq.getOrElse(i, 0) + 1 println(freq)

扫描操作:

扫描就是化简和折叠的结合。可以得到包含所有中间结果的集合:

var list = List(1, 2, 3, 4, 5)
list.scanLeft(0)(_ - _)
list.scanRight(0)(_ - _) 打印结果
list: List[Int] = List(1, 2, 3, 4, 5)
res0: List[Int] = List(0, -1, -3, -6, -10, -15)
res1: List[Int] = List(3, -2, 4, -1, 5, 0)

拉链操作

作用于两个集合,将对应的元素合并成一个元组。

var list = List(1, 2, 3, 4, 5)
var list2 = List(2, 3, 4, 5, 6) //List((1,2), (2,3), (3,4), (4,5), (5,6))
list.zip(list2)
//List((1,0), (2,1), (3,2), (4,3), (5,4))
list.zipWithIndex

迭代器

使用迭代器进行集合遍历

var list = List(1, 2, 3, 4, 5)
val iterator = list.iterator
while (iterator.hasNext) {
println(iterator.next())
} 或者: for (i <- iterator) println(i)

流(不可变列表)

流Stream只有在需要的时候才会去计算下一个元素,是一个尾部被懒计算的不可变列表。

#::操作符用于返回流。

// #:: 返回一个流
def numsForm(n: BigInt) : Stream[BigInt] = n #:: numsForm( n + 1 ) val tenOrMore = numsForm(10) tenOrMore.tail tenOrMore.head // 获取最后一个元素
tenOrMore.tail.tail.tail var squares = numsForm(5).map(x => x * x) squares.take(5).force //squares.force 不要尝试对一个无穷流的成员进行求值,OutOfMemoryError

懒视图

可以对其他集合使用view方法是集合具有懒执行的行为,该方法产出一个器方法总是被懒执行的集合、但是view不会缓存数据,每次都要重新计算

// 通过View的懒执行
val palindromicSquares = (1 to 100).view.map(x => {
println(x);
x * x
}) // Evaluates the first eleven
palindromicSquares.take(10).mkString(",") // Contrast with streams
def squares(x: Int): Stream[Int] = {
println(x);
x * x
} #:: squares(x + 1) val palindromicSquareStream = squares(0) palindromicSquareStream(10) // Caution // Evaluates only the first ten
palindromicSquares.take(10).last // Evaluates all elements
palindromicSquares(10)

与java集合互操作的总结

线程安全的集合

  • SynchronizedBuffer
  • SynchronizedMap
  • SynchronizedPriorityQueue
  • SynchronizedQueue
  • SynchronizedSet
  • SynchronizedStack
var scores = new mutable.HashMap[String,Int]() with mutable.SynchronizedMap[String,Int]

并行集合

Scala为了充分利用多核CPU,提供了并行集合(有别于前面的串行集合),用于多核环境的并行计算。

主要用的算法有:

divide and conquer:分治算法

Scala通过splitters,combiners等抽象层来实现。主要原理是将计算工作分解很多任务,分发给一些处理器去完成,并将它们处理结果合并返回

work stealing:Work Stealing算法

主要用于任务调度负载均衡。

并行集合位于scala.collection.parallel,跟不同集合一样

主要的实现类:

  • ParArray
  • ParHashMap
  • ParHashSet
  • ParRange
  • ParHashMap
  • ParHashSet
  • ParVector

通过par关键字将集合转为一个并行集合,并行集合的扩展自ParSeq、ParSet、ParMap特质的类型,所有的特质都是ParIterable的子类型,但并不是Iterable的子类型。所以不能将并行集合传递为预期的Iterable、Seq、Map的方法。可以通过 ser方法将并行集合转为串行集合

注意:在并行任务中,不要同时更新一个共享变量

操作符概述

1.如果想在变量名、类名、等定义中使用保留字,可以使用反引号:

val `val` = 42

2.A 操作符 B 等同于 A.操作符(B) 这种形式叫中置操作符

3.后置操作符:A 操作符等同于 A.操作符 ,如果操作符定义的时候不带() 则调用的时候不能加()

4.前置操作符,=-!~操作符 A 等同于 A.unary_操作符

5.赋值操作符, A操作符= B 等同于 A = A 操作符 B

Scala数据结构的更多相关文章

  1. 10. Scala数据结构(上)-集合操作

    10.1 数据结构特点 10.1.1 Scala集合基本介绍 uml => 统一建模语言 1) Scala同时支持不可变集合和可变集合,不可变集合可以安全的并发访问 两个主要的包 不可变集合:s ...

  2. scala 数据结构(一):数据结构简介

    1 数据结构特点 scala集合基本介绍 1)Scala同时支持不可变集合和可变集合,不可变集合可以安全的并发访问 2)两个主要的包: 不可变集合:scala.collection.immutable ...

  3. 11. Scala数据结构(下)-集合操作

    11.1 集合元素的映射-map映射操作 11.1.1 看一个实际需求 要求:请将List(3,5,8)中所有的元素都*2,将其结果放到一个新的集合中返回,即返回一个新的List(6,10,16),请 ...

  4. scala数据结构(一)

    一.概述 1,特点 )Scala同时支持不可变集合和可变集合 )两个主要的包: 不可变集合:scala.collection.immutable 可变集合: scala.collection.muta ...

  5. Scala数据结构(二)

    一.集合的基础操作 1,head头信息 //获取集合的第一个元素 val list = List(,,) list.head // 2,tail尾信息 //获取集合除去头元素之外的所有元素 val l ...

  6. scala 数据结构(十一):流 Stream、视图 View、线程安全的集合、并行集合

    1 流 Stream stream是一个集合.这个集合,可以用于存放无穷多个元素,但是这无穷个元素并不会一次性生产出来,而是需要用到多大的区间,就会动态的生产,末尾元素遵循lazy规则(即:要使用结果 ...

  7. scala 数据结构(九):-filter、化简

    1 filter filter:将符合要求的数据(筛选)放置到新的集合中 应用案例:将 val names = List("Alice", "Bob", &qu ...

  8. scala 数据结构(八 ):-map映射操作

    在Scala中可以通过map映射操作来解决: 将集合中的每一个元素通过指定功能(函数)映射(转换)成新的结果集合这里其实就是所谓的将函数作为参数传递给另外一个函数,这是函数式编程的特点 以HashSe ...

  9. scala 数据结构(七 ):集 Set

    集是不重复元素的结合.集不保留顺序,默认是以哈希集实现 默认情况下,Scala 使用的是不可变集合,如果你想使用可变集合,需要引用 scala.collection.mutable.Set 包 1 集 ...

随机推荐

  1. Microsoft .NET Framework 3.5 SP1安装错误 1603

    ghost版安装时由于系统简化引起上述错误,你按下面方法试一下1.点击电脑桌面右下角的“开始”按钮,点击“运行”按钮,在弹出的节目输入框中输入“regedit”.2.在弹出来的“注册表编辑器”界面上, ...

  2. Qt4.8.6与VS2008的集成开发环境的安装配置

    一.安装编译Qt 1. 在Windows下用Qt做开发,编译器可以用mingw的gcc/g++,也可以用VS. 2. 安装VS2008集成开发环境(完全安装).  3. 安装qt4.8.6(qt-op ...

  3. python中的命名空间以及函数的嵌套

    一.动态传参 函数的形参中除了默认值参数和位置参数外,还有动态传参.当不确定形参有几个或者有很多的时候,就可以使用动态传参. 1.1 动态接收位置参数 在python中使用*来接收动态位置参数 def ...

  4. java泛型方法返回泛型结果

    public class Test { static HashMap<String, String> sMap = new HashMap<String, String>(); ...

  5. HTML连载10-details标签&summary标签&marquee标签

    ​1.详情(details)与概要(summary)标签 (1)作用:我们希望用尽可能少的空间来表达更多的信息,利用summary标签来描述概要信息,用details标签来描述详情信息 (2)格式: ...

  6. 08 Javascript的函数

    函数:就是将一些语句进行封装,然后通过调用的形式,执行这些语句. 函数的作用: 将大量重复的语句写在函数里,以后需要这些语句的时候,可以直接调用函数,避免重复劳动. 简化编程,让编程模块化. cons ...

  7. kubernetes实战篇之为默认账户创建镜像拉取密钥

    系列目录 上一节我们分别使用纯文本账户密码和docker的config文件一创建一个kubernetes secret对象,并且把它添加到containers的imagePullSecrets字段用以 ...

  8. 【Idea】JUnit单元测试%MODULE_WORKING_DIR%' does not exist

    Idea执行单元测试时报错:上午9:35 Error running 'MobileMessageImplTest.java': Cannot start process, the working d ...

  9. MySQL下的DB Link

    前言: 在实际工作中,我们可能会遇到需要操作其他数据库实例的部分表,但又不想系统连接多库.此时我们就需要用到数据表映射.如同Oracle中的DBlink一般,使用过Oracle DBlink数据库链接 ...

  10. CentOS7系统安装

    CenOS7安装系统 镜像下载地址: http://isoredirect.centos.org/centos/7/isos/x86_64/ https://mirrors.aliyun.com/ce ...