掌握Spark机器学习库-07.6-线性回归实现房价预测

数据集

house.csv

数据概览

代码

package org.apache.spark.examples.examplesforml

import org.apache.spark.ml.feature.VectorAssembler

import org.apache.spark.ml.regression.LinearRegression

import org.apache.spark.sql.SparkSession

import org.apache.spark.{SparkConf, SparkContext}

import scala.util.Random

/*

日期：2018.10.15

描述：

7-6

线性回归算法

预测房价

数据集：house.csv

 */

object Linear {

  def main(args:Array[String]): Unit ={

    val conf=new SparkConf().setMaster("local[*]").setAppName("LinearregRession")

    val sc=new SparkContext(conf)

    val spark=SparkSession.builder().config(conf).getOrCreate()

    val file=spark.read.format("csv")

      .option("header","true")//y

      .option("sep",";")//分隔符

      .load("D:\\机器学习算法准备\\7-6线性回归-预测房价\\house.csv")

    import spark.implicits._

    val random =new Random()

    val data=file.select("square","price")

      .map(row => (row.getAs[String](0).toDouble,row.getAs[String](1).toDouble,random.nextDouble()))

      .toDF("square","price","rand")

      .sort("rand")

    data.show()

    val assembler=new VectorAssembler()

      .setInputCols(Array("square"))

      .setOutputCol("features")

    val dataset=assembler.transform(data)

    var Array(train,test)=dataset.randomSplit(Array(0.8,0.2),1234L)

    train.show()

    println(test.count())

    var regression=new LinearRegression().setMaxIter(10).setRegParam(0.3).setElasticNetParam(0.8)

    val model=regression.setLabelCol("price").setFeaturesCol("features").fit(train)

    model.transform(test).show()

    val s = model.summary.totalIterations

    println(s"iter: ${s}")

  }

}

输出：

掌握Spark机器学习库-07.6-线性回归实现房价预测的更多相关文章

掌握Spark机器学习库-07.14-保序回归算法实现房价预测
数据集 house.csv 数据集概览代码 package org.apache.spark.examples.examplesforml import org.apache.spark.ml.cl ...
掌握Spark机器学习库（课程目录）
第1章初识机器学习在本章中将带领大家概要了解什么是机器学习.机器学习在当前有哪些典型应用.机器学习的核心思想.常用的框架有哪些,该如何进行选型等相关问题. 1-1 导学 1-2 机器学习概述 1- ...
02-11 RANSAC算法线性回归(波斯顿房价预测)
目录 RANSAC算法线性回归(波斯顿房价预测) 一.RANSAC算法流程二.导入模块三.获取数据四.训练模型五.可视化更新.更全的<机器学习>的更新网站,更有python.go ...
Spark机器学习库（MLlib）官方指南手册中文版
中文https://blog.csdn.net/liulingyuan6/article/details/53582300 https://yq.aliyun.com/articles/608083 ...
掌握Spark机器学习库-07-回归算法原理
1)机器学习模型理解统计学习,神经网络 2)预测结果的衡量代价函数(cost function).损失函数(loss function) 3)线性回归是监督学习
掌握Spark机器学习库-09.6-LDA算法
数据集 iris.data 数据集概览代码 package org.apache.spark.examples.examplesforml import org.apache.spark.ml.cl ...
掌握Spark机器学习库-09.3-kmeans算法实现分类
数据集 iris.data 数据集概览代码 package org.apache.spark.examples.hust.hml.examplesforml import org.apache.s ...
掌握Spark机器学习库-08.7-决策树算法实现分类
数据集 iris.data 数据集概览代码 package org.apache.spark.examples.examplesforml import org.apache.spark.Spark ...
掌握Spark机器学习库-08.2-朴素贝叶斯算法
数据集 iris.data 数据集概览代码 import org.apache.spark.SparkConf import org.apache.spark.ml.classification.{ ...

随机推荐

make的特殊之处
1 规则的先后顺序问题规则的先后顺序只会影响默认的目标,没有其它的影响. 2 make对具有相同目标的规则的处理方式 2.1 如果是单冒号只能有一个规则是有命令的,然后对它们进行合并,即依赖合并. ...
Hypertext Transfer Protocol (HTTP/1.1): Semantics and Content
Content-Type https://tools.ietf.org/html/rfc7231#section-3.1.1.5 https://tools.ietf.org/html/rfc7231 ...
Windows 异步IO操作
Windows提供了4种不同的方法来接收I/O请求已经完成的通知:触发设备内核对象.触发事件内核对象.可提醒I/O和I/O完成端口. Windows的异步I/O 当线程向设备发起一个I/O异步 ...
git 如何让单个文件回退到指定的版本【转】
本文转载自:http://blog.csdn.net/ikscher/article/details/43851643 1.进入到文件所在文件目录,或者能找到文件的路径查看文件的修改记录 1 $ gi ...
wpa_supplicant drivers 查看跟踪
/**************************************************************************** * wpa_supplicant drive ...
BZOJ2049：Cave 洞穴勘测（LCT入门）
辉辉热衷于洞穴勘测.某天,他按照地图来到了一片被标记为JSZX的洞穴群地区.经过初步勘测,辉辉发现这片区域由n个洞穴(分别编号为1到n)以及若干通道组成,并且每条通道连接了恰好两个洞穴.假如两个洞穴可 ...
robotframework 随机选中下拉框中的值
示例脚本: click element id=provinceName #点击地区省 wait until element is enabled xpath=.//*[@id='provinceNa ...
我的JSP中文编码解决方案
虽然以前就知道编码问题,但是一直没有遇到问题,以前用asp.net和php的时候,感觉很自然地写程序,没怎么特别处理编码问题,这回改用java写,真心被恶心到了. 进行了一番查阅学习后,终于搞明白了一 ...
安装phpwind报错
在安装phpwind时,下面的报错提示是什么原因呢? 答:数据库密码应设置为空
ubuntu 12.04上安装QQ2013(转载)
转自:http://www.cnblogs.com/wocn/p/linux_ubuntu_QQ_install.html 环境介绍: OS:Ubuntu12.04 64bit QQ:WineQQ20 ...

掌握Spark机器学习库-07.6-线性回归实现房价预测

掌握Spark机器学习库-07.6-线性回归实现房价预测的更多相关文章

随机推荐

热门专题