scala_1

scala

        开发spark可以使用哪些语言：

            Python开发45%

            scala  35%

            java 20%

一、scala的概述

        java基础上代码的简化版、功能的加强版

        隐式转换

        高阶函数

            一个函数的参数是另一个函数 ，或者是返回值是一个函数

    1、scala继承了面向对象编程和面向函数式编程的各种特征，在2003年发布了基础java的第一个版本

        Object-Oriented Meets Functional

    scala 优雅 简洁  强大 

基于spark的开发使用scala语言实现wordcount

sc.textFile("/user/beifeng/input/wc.txt")  //RDD[String]

.flatMap(x=>x.split(" ")) // Array[(String)]

.map(x=>(x,1))  //Array[(String,Int)]

.reduceByKey((x,y)=>(x+y))     //Array[(String,Int)]

.saveAs("/user/beifeng/output1")    

hadoop hive hive spark

oozie flume

Array(hadoop hive hive spark oozie flume )

Array[(hadoop,1), (hive,1), hive spark oozie flume ]

    2、scala和java可以互操作

        java和scala共用jvm平台

        scala使用scalac编译器将源码编译成java的class文件

        可以在scala代码中直接调用所有的java类库

        也可以在java的代码中插入一段scala代码

    3、函数式链式编程一些以函数和对象两方面为主

        函数在scala中是一等公民

            函数可以被当做参数进行传递

            函数可以做为一个函数的返回值返回

            可以在函数中定义另一函数  

        重点：

            模式匹配

            高阶函数

                匿名函数

            隐式转换

                将一种数据类型偷偷转换成另一种数据类型

            trait类

                接口  

二、scala安装部署 

        下载路径：http://www.scala-lang.org/download/2.10.4.html

        window下：

            java需求提前配置好

            scala配置：

                scala-2.10.4.zip 解压到某个路径下

                配置环境变量：

                        JAVA_HOME  XXX

                        SCALA_HOME  XXX

                        PATH  %JAVA_HOME%/bin;%SCALA_HOME%/bin

        linux： 

三、scala基本使用 

        交互式命令行 -》  REPl   l->loop            

        scala是一种强类型语言

        但是scala可以自动推断数据类型

scala> val b = 3

       b: Int = 3    

scala> b+5

res0: Int = 8  //res0是系统提供的临时变量

scala> res0+1

res1: Int = 9

scala> println("hello world")

hello world    

    scala写第一个程序 

object HelloWorld {

    def main(args:Array[String]) {

    println("Hello,world!!!")

    }

}

$ scalac HelloWorld.scala

$ scala HelloWorld  

四、安装部署IDEA工具

    window/linux 版本

    window：

        安装前一定要配置好scala和java的环境变量

        启动-》选择主题-》都是下一步（不要选择任何插件）-》start

        集成scala插件：

            configure-》plugins-》install form disk -》选择scala插件-》重启

        Setting：

            appreance-》设置系统字体及主题

            keymap -》 设置快捷键风格-》eclipse

            editor->font->save as -> 设置代码字体风格 

        create new project

            scala -》设置项目名称及工程目录 -》选择本地安装的jdk的sdk

五、scala中变量的定义、数据类型、函数的定义及函数的参数类型  

    1、变量的定义

        使用val声明一个不可变变量

            scala> val a:Int=3

            a: Int = 3

            scala> a=4  //val声明的变量不能重新赋值

            <console>:8: error: reassignment to val

                   a=4

                    ^

        使用var声明一个可变变量

            scala> var c = 6

            c: Int = 6

            scala> c = 7

            c: Int = 7        

        在scala中声明变量的语法

            val/var a:Int=3

            语法：

                关键字（val/var）+ 变量名:数据类型（首写字母大写） = 值   

    2、scala中如何先定义一个为空值的变量

        scala> var name:String    //报错，需要给变量一个初始化值

        解决：

            scala> var name:String = ""

            scala> var name1:String = _   

    3、scala中的数据类型

        在scala中没有基本数据量和包装类之分，所有的数据类型都是类

        首写字母需要大写

    4、scala中的lazy 懒执行

        当val修饰的变量被lazy修饰时，它的初始化将被推迟，直到第一次去调用

        scala> lazy val price = 15.8

        price: Double = <lazy>   //此时没有将15.8赋值给price  

        scala> price  //当第一次去调用 price时系统才会进行赋值操作

        res3: Double = 15.8

        scala> lazy var price1 = 15.8

<console>:1: error: lazy not allowed here. Only vals can be lazy

       lazy var price1 = 15.8

            ^

    5、scala中函数的定义  

        def 函数名称（参数名称：参数类型）：返回类型 = {

            函数体内容

        }         

        因为scala可以自动推断数据类型，所以函数的返回值类型一般可以直接省略 

def min(x:Int,y:Int):Int = {

  if (x>y)

    y

  else

    x

}            

    6、文件编辑软件sublime介绍

        查看-》语法-》scala  

    7、当定义的函数为空参时，调用该函数时可以省略函数的括号

        def hello()={println("hello!!!")}

        def hello() = println("hello!!!")  //当函数体只有一句时可以省略大括号

        hello()

        hello 

        def hello():Unit = println("hello!!!")

            Unit在scala中表示无返回值类型，相当于java的void 

    8、函数中定义另一个函数

            函数的嵌套或闭包

            内函数可以调用外函数的变量  

def fun1(a: Int) = {

  def fun2(b: Int) = {

    println("a+b=" + (a + b))

  }

  fun2(200)

}

fun1(20)

    scala> :paste   //进入到粘贴模式  

     (ctrl-D to finish)  

     scala> fun1(100)

            a+b=300

    9、匿名函数 

        定义： (x:Int)=>{x+1}

        语法：（变量名：数据类型，...）=> { 函数体内容 }

        匿名函数的特点： 

        1、匿名函数可以赋值给一个函数

            def add=(x:Int,y:Int)=>{x+y}

            add(3,8)

        2、匿名函数可以赋值给一个变量

            val add=(x:Int,y:Int)=>{x+y}

            add(3,6) 

        考虑如何将一个非匿名函数赋值给一个变量 ？

            def add(x: Int, y: Int) = x + y

            val add1=add _  //函数名+空格+占位符

            add1(3,8)

    10、在scala的函数中可以指定参数的默认值（缺省值）        

def path(p: String="Desttop") = {

  println("the path is " + p)

}

path() //当传入参数时，会使用参数的默认值 

def loadConf(conf:String="spark-defalut.xml")={

  println("conf is "+conf )

}

    11、scala中可以使用*代表传入的参数为重复参数（变长参数）  

def printName(name:String*)={

  println("the name is "+name)

}

printName("zhangsan","lili","wangwu")

val arr=Array("lili","tom","mary")

printName(arr:_*)//通过声明arr为_*，表示告诉编译器我们传入的是一个个String类型的元素，而不是一个Array[String]         

六、scala中的流程控制语句及循环表达式

        while

        do while

        for

        breaks  

1、

val list=List("tom","mary","lio","lili")  //定义一个List集合不用使用new，使用的是List类的伴生对象里面的apply方法，通过apply方法帮我们new的List对象 

val list = List("tom", "mary", "lio", "lili")

var x = 0

while (x < list.length) {

  println(list(x))

  x += 1

}        

for (x <- list) {

  println(x)

}

“<-”是一个提取符，可以从集合中遍历提取出所有的元素 

break() 方法演示  

object LoopTest {

  def main(args: Array[String]) {

    val list = List("tom", "mary", "lio", "lili")

    val loop = new Breaks

    loop.breakable {

      for (x <- list) {

        println(x)

        if (x == "mary")

          loop.break()

      }

    }

    println("over........")

  }

}

-----------------------------------

2、scala中的循环表达式 

1 to 10  //包头包尾

1.to(10)  

1 until 10 //包头不包尾

1.until(10)    

Range(1,10)     //包头不包尾  

Range(1,-10,-3)   //可以给出step步长

Range(1,-10,0) //java.lang.IllegalArgumentException: step cannot be 0.

结合for循环使用循环表达式 

for (x<- 1.to(10)){

  println(x)

}

求1到10范围内的偶数 

for (x<- 1.to(10) if x%2==0 ){

  println(x)

}

七、元组 tuple  

    元组的定义 使用 括号 ()

        val tuple = (1, 3, "tom", 3.3, "lili") 

        tuple._1  //元组元素的获取

        tuple._3    

    总结 ：

        元组类型是scala和Python里特有

        在scala中，元组是n个不同数据类型对象的一个聚集

                n的最大的值是22

        Map的元素实际上是n=2的元组 ，即2元组 ，也是最简单的元组

        元组必须使用()来表示 

    元组元素的遍历 

val tuple = (1, 3, "tom", 3.3, "lili")

for (x<- 0 to tuple.productArity ) { //使用to为什么会报错

  println(tuple.productElement(x))

}

for (x<- 0 until  tuple.productArity ) { // until不报错

  println(tuple.productElement(x))

}

八、scala中的数组

    1、scala中数组的特点

        数组是相同数据类型固定大小的元素的连续集合

        数组的元素的角标从0开始

        数组的定义

            val arr=Array(33,11,66,88)  

    2、数组分为定长数组和变长数组 

        定长数组

            val arr=Array(33,11,66,88)    //默认是定长数组 

            数组的取值

                arr(0)

                arr(2)

            定长数组不支持更改数组元素长度或值的方法 

        变长数组

            val arr1=scala.collection.mutable.ArrayBuffer(11,22,44) 

            import scala.collection.mutable.ArrayBuffer

            val arr2=ArrayBuffer(55,99) 

        添加元素

            val arr1 = scala.collection.mutable.ArrayBuffer(11, 22, 44)

            val arr = Array(111, 222)

            arr1 += 55

            arr1

            arr1 +=(66, 77)

            arr1 ++= arr

        减去元素

            -=/--=

        变长数组可以使用的更改元素内容的方法

            arr1.insert(0,77,88)

            arr1  

            arr1.remove(3)

            arr1 

            arr1.trimEnd(2)

            arr1 

            arr1.toArray //变长数组转定长数组 

    3、数组的遍历 

for (x <- 0 until arr1.length) {

  println(arr1(x))

}

for (x <-arr1){

  println(x)

}        

    4、其他常用方法 

        排序：

            val arr1 = scala.collection.mutable.ArrayBuffer(55,11, 22, 44)

            val arr2=arr1.toArray

            scala.util.Sorting.quickSort(arr2)        //原来的数组变了

            arr2 

            arr1.sorted  //默认是升序排序，返回一个新的排好序的数组 ，原来的不变

        转换为字符串

            arr1.mkString("，")

            arr1.mkString("【",",","】")  //res1: String = 【55,11,22,44】

九、scala中的集合 

    scala中所有的集合类都在 scala.collection 包下

        scala.collection.mutable  包下是可变集合

            可变集合可以进行修改、添加、删除等操作，且是在原集合基础上进行的更新操作

        scala.collection.immutable  包下是不变集合

            不可变集合也可以模拟修改、添加、删除等操作，但是每次操作不是在原来集合基础上的更新操作，每次都会生产一个新的集合

    1、定长List集合 

        定长list集合的定义：

            val list = List(33,55,77,11)

        list.head  //返回第一个元素的值

        list.tail  //返回除第一个元素外的其他元素的集合

        Nil   //代表一个空的List集合  

        总结List集合是由head头和tail尾组成的  

        向定长list集合添加元素

            val list1=88::list  //添加元素后生产了一个新的list集合，原list集合元素没有变化

            val list2 =99::111::222::list    

            val list3=555::Nil   //通过这种方法也能创建一个list集合 

        删除list集合的元素

            list.drop(3) //表示从左数删除3个元素

                            原list集合元素没有变化  

    2、变长list集合

        定义

            val list=scala.collection.mutable.ListBuffer(44,11,88)

        添加元素（都是在原集合基础上进行的更新操作）

            list += 111

            list+=(444,666)

            list++= list1

        删除元素

                -=/--= 

        变长list集合的转换

            list.toList   定长list集合

            list.toArray  定长数组

        list集合的遍历

            for (x<-list){

              println(x)

            }

        list集合其他常用方法

            list.exists((x:Int)=> {x>55})  //通过exists方法判断list集合里面有没有大于55的元素 

            简化：

                list.exists((x:Int)=> x>55 )

                list.exists((x)=> x>55)   //scala可以自动推断数据类型

                list.exists(x=> x>55 ) //只有一个参数时可以省略括号

                list.exists(_ > 55 )  //当匿名函数的参数在函数体中只调用一次时可以这样写 

                list.filter(_ > 20)  //过滤出大于20的元素 

        3、Set

            PPT 参考list array   

        4、不可变Map集合

            定义：

                val map=Map("lili"->18,"tom"->19,"mary"->17)

            获取value

                map("tom")

                map("mary")

                //map("wangwu")

                //方法一

                if (map.contains("wangwu"))

                  map("wangwu")

                else

                  -1

                //方法二

                map.getOrElse("lili",-1)

        5、可变map集合 

            定义

                val map1=scala.collection.mutable.Map("lili"->18,"tom"->19,"mary"->17)

            更新或添加元素

                map1("lili")=19

                map1("lio")=21

                map1 +=("zhaosi"->23)

            map集合的遍历 

for ((x, y) <- map1) {

  println("key is " + x + ",value is " + y)

}

for ((key, _) <- map1) {

  println("key is " + key)

}

for ((_, value) <- map1) {

  println("value is " + value)

}

for (values <- map1.values){

  println("value is " + values)

}

比较安全的遍历方法 

for((key,value)<-map1){

  println("key is " + key+ ",value is " + map1.getOrElse(key,-1))

}                

        map集合的排序

            map1.toList.sorted.toMap

scala_1的更多相关文章

Scala 中的函数式编程基础(一)
主要来自 Scala 语言发明人 Martin Odersky 教授的 Coursera 课程 <Functional Programming Principles in Scala>. ...
scala 遇到过的问题
1:在我安装完scala的插件后,在打开方法的实现类(open implementactions)的时候,抛出这个异常,后来发现这个异常是因为我的scala的插件跟我eclipse版本不兼容导致的. ...

随机推荐

Pushgateway 介绍
Pushgateway是一个独立的服务,Pushgateway位于应用程序发送指标和Prometheus服务器之间. Pushgateway接收指标,然后将其作为目标被Prometheus服务器拉取. ...
Apache Hadoop 2.9.2 的HDFS High Available模式部署
Apache Hadoop 2.9.2 的HDFS High Available 模式部署作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 我们知道,当NameNode进程挂掉后,可 ...
Solr配置步骤
1. 配置步骤说明 (1)配置Solr服务器. (2)配置SolrHome.(Solr服务的主目录,磁盘) (3)在Solr服务器中加载SolrHome. (4)java程序访问Solr服务器,实现全 ...
js时间戳转日期
//时间戳转日期 2017-04-30 13:20 //type=1--> 2017-04-30 13:20 //type=2-->2018年08月 //type=3-->2018- ...
用SQL表达交并差操作
交-并-差的处理 SQL语言:并运算UNION,交运算INTERSECT,差运算EXCEPT 基本语法形式: 子查询{UNION [ALL] | INTERSECT [ALL] | EXPECT [A ...
spring对bean的管理细节
<?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.spr ...
415 DOM 查找列表框、下拉菜单控件、对表格元素/表单控件进行增删改操作、创建元素并且复制节点与删除、对表格操作、通用性和标准的事件监听方法（点击后弹窗效果以及去掉效果）
DOM访问列表框.下拉菜单的常用属性: form.length.options.selectedindex.type 使用options[index]返回具体选项所对应的常用属性:defa ...
实验吧 deeeeeeaaaaaadbeeeeeeeeeef-20
题目描述: 图片是正确的吗? 解题思路: 这道题很有意思,常规的隐写思路没有线索,结果问题出现在照片的分辨率上,tEXtSource iPhone 5的后置摄像头是3264×2448的分辨率,前置摄像 ...
7个提升Python程序性能的好习惯
原文作者:爱coding,会编程的核电工程师. 个人博客地址:zhihu.com/people/zhong-yun-75-63 掌握一些技巧,可尽量提高Python程序性能,也可以避免不必要的资源浪费 ...
011_TCP专项研究监控
(1)In Segs 数据源: /proc/net/snmp; 采集方式:累计值,每10秒采集一次取差值: 指标:net.snmp.tcp (key: system); In Segs: tcp协议层 ...

scala_1

scala_1的更多相关文章

随机推荐

热门专题