scala 基础
1.scala一些预热操作
1.1 to 是一个方法,()可以进行 参数传递,map()把每一个元素取出来进行相应的操作,
- print(1.to(10).map(_*10))
- 结果
- Vector(10, 20, 30, 40, 50, 60, 70, 80, 90, 100)
1.2取数组中的每一个值
- val arr=Array(1,2,3,4,5,6,7,8,9)
- //直接遍历每一个值
- for (i<-arr) print(i+" ")
- //通过下标遍历每一个值 until是取值左闭右开
- for(i <- 0 until arr.length) println(arr(i))
1.3 List的flatten 可以将一个list嵌套list、list嵌套字符串压平
- val ls1=List(1,2,3,4,5,6,7,8,9)
- val ls2=ls1.grouped(5)
- val ls3=ls2.toList
- println(ls3) //List(List(1, 2, 3, 4, 5), List(6, 7, 8, 9))
- println(ls3.flatten) //list套list有压平操作 也可以压平 list中套多个字符串的情况
- 结果:list(1, 2, 3, 4, 5, 6, 7, 8, 9)
1.4取一个元组的第n个值
- val t=(1,2,3,4,4,5,6)
- print(t._2) ////去元组的第n个
2.wordcount
- val lines=List("hello tom hello jerry","hello tom hello kitty hello china")
- 方法一:
- val wc=lines.flatMap(_.split(" ")).map((_,1)).groupBy(_._1).map(t=>(t._1,t._2.size)).toList.sortBy(_._2).reverse
- 方法二:
- val wc2=lines.flatMap(_.split(" ")).map((_,1)).groupBy(_._1).mapValues(_.size)
- 方法三:
- val wc3=lines.flatMap(_.split(" ")).map((_,1)).groupBy(_._1).mapValues(_.foldLeft(0)(_+_._2))
- 如果是在spark上:
- val wc4=lines.flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).sortBy(_._2,false).collect
2.1flatMap=map+flatten
- val words=lines.flatMap(_.split(" "))
- 结果:
- List(hello, tom, hello, jerry, hello, tom, hello, kitty, hello, china)
可以拆分map过程
- lines.map(_.split(" "))
- 拿到每一个元素(字符串),按照空格切割,切割后返回两个数组,仍放在List中
- res0: List[Array[String]] = List(Array(hello, tom, hello, jerry), Array(hello, tom, hello, kitty, hello, china))
flatten过程
- lines.map(_.split(" ")).flatten
- List(hello, tom, hello, jerry, hello, tom, hello, kitty, hello, china)
2.2 将单词出现一次和1放在一起(放入元组)
- val wordsAndOne=words.map((_,1))
- List((hello,1), (tom,1), (hello,1), (jerry,1), (hello,1), (tom,1), (hello,1), (kitty,1), (hello,1), (china,1))
2.3 groupBy按照单词分组返回map
- 第一个_ 表示List中的每一个元组,取元组中的某一个元素用._n,即按照元组中的某一元素分组,返回是一个map
- val grouped =wordsAndOne.groupBy(_._1)
- Map(kitty -> List((kitty,1)), china -> List((china,1)), tom -> List((tom,1), (tom,1)), hello -> List((hello,1), (hello,1), (hello,1), (hello,1), (hello,1)), jerry -> List((jerry,1)))
2.4求和
- t就是每一个对偶元组, 仍返回一个map
- val result = grouped.map(t=>(t._1,t._2.size))
- Map(kitty -> 1, china -> 1, tom -> 2, hello -> 5, jerry -> 1)
直接对第一个单词和list.size 但scala中不予许这样的操作
- 第一个_ 拿到一个对偶元组,取元组中的第一个元组。_._2.size即是取对偶元组第二个的大小。
- val result=grouped.map(_._1,_._2.size)
2.5 按出现次数从大到小排序M:默认自然排序, map没有sortBy 先将map.toList
- val finalResult=result.toList.sortBy(_._2).reverse
- List((hello,5), (tom,2), (jerry,1), (china,1), (kitty,1)
3.方法二中:mapValues的_ 指的是元组的值 即v。key 不动,只是对values进行处理 结果 k v 一起返回
val wc2=lines.flatMap(_.split(" ")).map((_,1)).groupBy(_._1).mapValues(_.size)
4.方法三中:
fold(0)(_+_) 0 是初始值
Map(kitty -> List((kitty,1)), china -> List((china,1)), tom -> List((tom,1), (tom,1)), hello -> List((hello,1), (hello,1), (hello,1), (hello,1), (hello,1)), jerry -> List((jerry,1)))
foldLeft(0)(_+_._2)第一个_表示初始值或者上一次累加的结果 中第二个_ ,表示拿到的每一个元组,第三个元组的中第n个值
val wc3=lines.flatMap(_.split(" ")).map((_,1)).groupBy(_._1).mapValues(_.foldLeft(0)(_+_._2))
5.reduce和fold操作
- val a=Array(1,2,3,4,5,6)
- println(a.sum) //求和 21
- println(a.reduce(_+_))//21 聚合操作要求传递两个参数
- println(a.reduce(_-_))//-19 也可以进行减法操作
a.reduce(_+_) 默认调用 a.reduceLift (((((1+2)+3)+4)+5)+6)
println(a.par.reduce(_+_)) //21 par转化成并行化操作
fold 也支持并行化--并行计算,及柯里化
- val b=Array(1,2,3,4,5,6)
- println(b.fold(10)(_+_)) //31和cpu核心数无关
- println((b.par.fold(10)(_+_))) //61和cpu核心数有关,2核心4线程,所以4*10
- println((b.par.fold(0)(_+_))) //21
- println(b.foldLeft(10)(_+_)) //31
- println(b.foldRight(10)(_+_)) //31
scala 基础的更多相关文章
- 【Scala学习之一】 Scala基础语法
环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk1.8 scala-2.10.4(依赖jdk1.8) spark ...
- Scala学习(一)--Scala基础学习
Scala基础学习 摘要: 在篇主要内容:如何把Scala当做工业级的便携计算器使用,如何用Scala处理数字以及其他算术操作.在这个过程中,我们将介绍一系列重要的Scala概念和惯用法.同时你还将学 ...
- Scala基础(1)
Scala基础语法 声明与定义: val,常量声明 val x:T(把x声明成一个类型为T的常量) x是变量的名字,T是变量的类型 v ...
- scala 基础知识总结
在最开始处引入 log 相关的 包 import org.apache.log4j.{Logger,Level} 在需要屏蔽日志输出的地方加上这两行代码 // 屏蔽不必要的日志显示在终端上 Logge ...
- 1.scala基础语法总结
Scala基础语法总结:Scala 与 Java 的最大区别是:Scala 语句末尾的分号 ; 是可选的.如果一行里写多个语句那么分号是需要的 val s = "菜鸟教程"; pr ...
- Scala 基础(8)—— 占位符_和部分应用函数
1. 占位符 _ 针对 Scala 基础(7)—— 函数字面量和一等函数 中最后提到的,关于 filter 函数字面量的精简写法,可以使用占位符 _ 来代替. 占位符_,用来表示一个或者多个参数.(这 ...
- Scala 基础(7)—— 函数字面量和一等函数
1. 函数字面量 在 Scala 基础(3)—— 基础类型和基础操作 中提到了函数字面量,这里具体解释函数字面量的语法. 下面展示一个具体的函数字面量,它由三部分组成: (x: Int, y: Int ...
- Scala 基础(5)—— 构建函数式对象
有了 Scala 基础(4)—— 类和对象 的前提,现在就可以来构建一个基于 Scala 的函数式对象. 下面开始构造一个有理数对象 Rational. 1. 主构造方法和辅助构造方法 对于每一个类的 ...
- Scala基础知识[一]
摘要:在Scala 是 Scalable Language 的简写,是一门多范式(multi-paradigm)的编程语言.设计初衷是要集成面向对象编程和函数式编程的各种特性.Scala 运行在Jav ...
- Scala基础简述
* Scala基础简述 本文章作为Scala快速学习的教程,前提环境是:我假设在此之前,你已经学会了Java编程语言,并且我们以随学随用为目标(在此不会深度挖掘探讨Scala更高级层次的知识).其中语 ...
随机推荐
- [GO]简单的http服务器和客户端的实现
package main import ( "net/http" "fmt" ) func Hello(w http.ResponseWriter, r *ht ...
- 包含复杂函数的excel 并下载
POI 版本: <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi</a ...
- Catalan数与出栈顺序个数,Java编程模拟
问题描述: 队列中有从1到7(由小到大排列)的7个整数,问经过一个整数栈后,出栈的所有排列数有多少?如果整数栈的容量是4(栈最多能容纳4个整数),那么出栈的排列数又是多少? 分析:对于每一个数字i, ...
- 用Rider写一个有IOC容器Autofac的.net core的程序
一:Autofac是一个和Java里的Spring IOC容器一样的东西,不过它确实没有Spring里的那么方便,主要是在于它没有提供足够的Api和扫描方式等等,不过优点是它比Spring要快很多,而 ...
- hdu 1325 && poj 1308 Is It A Tree?(并查集)
Description A tree is a well-known data structure that is either empty (null, void, nothing) or is a ...
- 在windows 下使用eclipse进行编译和烧写
eclipse IDE是一款开源的前端编程软件,它提供了编写,编译和调试ESP-IDF项目的图形集成开发环境. 首先在https://www.obeo.fr/en/eclipse-download?I ...
- Vuejs——(1)入门(单向绑定、双向绑定、列表渲染、响应函数)
版权声明:出处http://blog.csdn.net/qq20004604 目录(?)[+] 参照链接: http://cn.vuejs.org/guide/index.html [起步]部 ...
- 第八节:详细讲解Java中的异常处理情况与I/O流的介绍以及类集合框架
前言 大家好,给大家带来详细讲解Java中的异常处理情况与I/O流的介绍以及类集合框架的概述,希望你们喜欢 JAVA 异常 try...catch...finally结构的使用方法 class Tes ...
- 你可能不知道的viewport
概述 前几天偶然看到一个pc端网页,发现用手机打开竟然同比缩放了,作为一个前端从业者,我自然想要弄清它到底是怎么缩放的.之后查了它的meta信息,css和js,发现没有任何兼容手机端的代码,那它到底是 ...
- web API简介(四):客户端储存之IndexedDB API
概述 前篇:web API简介(三):客户端储存之Web Storage API 客户端储存从某一方面来说和动态网站差不多.动态网站是用服务端来储存数据,而客户端储存是用客户端来储存数据. Index ...