spark mllib als 参数

在一定范围内按照排列组合方式对rank，iterations，lambda进行交叉评估（根据均方根误差），
找到最小误差的组合，用于建立矩阵分解模型。

Signature:

ALS.train(

    ratings,

    rank,

    iterations=5,

    lambda_=0.01,

    blocks=-1,

    nonnegative=False,

    seed=None,

)

Docstring:

Train a matrix factorization model given an RDD of ratings by users

for a subset of products. The ratings matrix is approximated as the

product of two lower-rank matrices of a given rank (number of

features). To solve for these features, ALS is run iteratively with

a configurable level of parallelism.

:param ratings:

  RDD of `Rating` or (userID, productID, rating) tuple.

:param rank:               #矩阵分解秩

  Number of features to use (also referred to as the number of latent factors).

:param iterations:    #迭代次数

  Number of iterations of ALS.

  (default: 5)

:param lambda_:  #正则系数

  Regularization parameter.

  (default: 0.01)

:param blocks:

  Number of blocks used to parallelize the computation. A value

  of -1 will use an auto-configured number of blocks.

  (default: -1)

:param nonnegative:

  A value of True will solve least-squares with nonnegativity

  constraints.

  (default: False)

:param seed:

  Random seed for initial matrix factorization model. A value

  of None will use system time as the seed.

  (default: None)

.. versionadded:: 0.9.0

File:      f:\anaconda\lib\site-packages\pyspark\mllib\recommendation.py

Type:      method

spark mllib als 参数的更多相关文章

Spark 实践——基于 Spark MLlib 和 YFCC 100M 数据集的景点推荐系统
1.前言上接 YFCC 100M数据集分析笔记和使用百度地图api可视化聚类结果, 在对 YFCC 100M 聚类出的景点信息的基础上,使用 Spark MLlib 提供的 ALS 算法构建推荐 ...
Spark MLlib回归算法------线性回归、逻辑回归、SVM和ALS
Spark MLlib回归算法------线性回归.逻辑回归.SVM和ALS 1.线性回归: (1)模型的建立: 回归正则化方法(Lasso,Ridge和ElasticNet)在高维和数据集变量之间多 ...
Spark Mllib里决策树回归分析如何对numClasses无控制和将部分参数设置为variance（图文详解）
不多说,直接上干货! 在决策树二元或决策树多元分类参数设置中: 使用DecisionTree.trainClassifier 见 Spark Mllib里如何对决策树二元分类和决策树多元分类的分类 ...
转载：Databricks孟祥瑞：ALS 在 Spark MLlib 中的实现
Databricks孟祥瑞:ALS 在 Spark MLlib 中的实现发表于2015-05-07 21:58| 10255次阅读| 来源<程序员>电子刊| 9 条评论| 作者孟祥瑞大 ...
Spark入门实战系列--8.Spark MLlib（上）--机器学习及SparkMLlib简介
[注]该系列文章以及使用到安装包/测试数据可以在<倾情大奉送--Spark入门实战系列>获取 .机器学习概念 1.1 机器学习的定义在维基百科上对机器学习提出以下几种定义: l“机器学 ...
Spark入门实战系列--8.Spark MLlib（下）--机器学习库SparkMLlib实战
[注]该系列文章以及使用到安装包/测试数据可以在<倾情大奉送--Spark入门实战系列>获取 .MLlib实例 1.1 聚类实例 1.1.1 算法说明聚类(Cluster analys ...
Spark MLlib 机器学习
本章导读机器学习(machine learning, ML)是一门涉及概率论.统计学.逼近论.凸分析.算法复杂度理论等多领域的交叉学科.ML专注于研究计算机模拟或实现人类的学习行为,以获取新知识.新 ...
Spark MLlib（下）--机器学习库SparkMLlib实战
1.MLlib实例 1.1 聚类实例 1.1.1 算法说明聚类(Cluster analysis)有时也被翻译为簇类,其核心任务是:将一组目标object划分为若干个簇,每个簇之间的object尽可 ...
Spark MLlib协同过滤算法
算法说明协同过滤(Collaborative Filtering,简称CF,WIKI上的定义是:简单来说是利用某个兴趣相投.拥有共同经验之群体的喜好来推荐感兴趣的资讯给使用者,个人透过合作的机制给予 ...

随机推荐

用 UniRx 实现 Timeline 式的异步操作
没接触 UniRx 之前,我在 Unity 中通常用 Coroutine 或 Callback 来实现异步操作.根据我的任务,一般都是去实现游戏组件的演出,比如:敌方角色图形显示后,我方角色 UI ...
5V 升压 8.4V，5V 转 8.4V 做两节锂电池充电芯片
5V 升压 8.4V SOT23-6 封装的六脚升压 IC PW5300 是一颗 DC-DC 异步整流升压转换器芯片,输入电压范围 2.6V-5.5V.最高输出电压 12V, PW5300 是一种电 ...
【2020CSP-S模拟赛day5】总结
爆零自闭赛写在前面于2022.11.1 这一次题目质量很高(以至于什么都不会) 再一度体验了省选Orz.比赛大体情况,刨去std, wzc神仙230分,比剩下的加起来都高.zyz神仙60分. 其余 ...
基于源码分析Vue的nextTick
摘要:本文通过结合官方文档.源码和其他文章整理后,对Vue的nextTick做深入解析.理解本文最好有浏览器事件循环的基础,建议先阅读上文<事件循环Event loop到底是什么>. 一. ...
On-the-fly Garbage Collection: an Exercise in Cooperation
On-the-fly Garbage Collection: an Exercise in Cooperation - Microsoft Research https://www.microsoft ...
ip_hash（不推荐使用）会话粘性问题分析 Cookie 的 Session Sticky
Nignx 连接tomcat时会话粘性问题分析_changyanmanman的专栏-CSDN博客_后端tomcat导致前端elb中断 https://blog.csdn.net/cymm_liu/a ...
Linux下unix socket 读写抓包
Linux下unix socket 读写抓包-ubuntuer-ChinaUnix博客 http://blog.chinaunix.net/uid-9950859-id-247877.html
（Oracle）看懂Oracle执行计划（转载）
最近一直在跟Oracle打交道,从最初的一脸懵逼到现在的略有所知,也来总结一下自己最近所学,不定时更新ing- 一:什么是Oracle执行计划? 执行计划是一条查询语句在Oracle中的执行过程或访问 ...
java的几种对象（PO,VO,DAO,BO,POJO）
一.PO persistant object 持久对象,可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数 ...
提高 Kafka 吞吐量
提高 Kafka 吞吐量 1.了解分区的数据速率,以确保提供合适的数据保存空间 2.除非您有其他架构上的需要,否则在写 Topic 时请使用随机分区 3.如果 Consumers 运行的是比 Kafk ...

spark mllib als 参数

spark mllib als 参数的更多相关文章

随机推荐

热门专题