Angel图算法

[2.0]CommonFriends

计算两个好友的共同好友数,某种程度上可以刻画两个节点之间的紧密程度。

输入

  • 输入数据路径:输入文件所在路径,无权网络数据, 数据格式为两列 srcId(long) | dstId(long), 其中|为分隔符,分隔字段表示空白符或者逗号等。
  • 输入文件类型:格式包括以下两种:
  • csv:csv 文件。
  • 输入数据包含 header 信息。
  • 输入数据分割符:主要包括逗号、空格、分号、星号等分割符。
  • parquet:列式存储格式 parquet。

输出

  • 输出数据路径:输出文件所在路径。
  • 输出数据格式:格式包括以下两种:
  • csv:csv 文件。
  • 输出数据包含 header 信息。
  • 输出数据分割符:主要包括逗号、空格、分号、星号等分割符。
  • parquet:列式存储格式 parquet。

参数说明

  • src:源节点列。
  • dst:目标节点列。
  • numPartition:分区数。

资源参数

  • drive 节点资源类型:请选择合适的 drive 节点机型。
  • executor 节点资源类型:请选择合适的 executor 节点机型。
  • num-executors:分配计算节点数目,可根据数据量来配置,一般训练数据量越大,需要的 worker 个数越多。
  • spark-conf:spark常用参数配置,如压缩、序列化、网络等。

[2.0]HyperAnf

估计网络的平均半径。

输入

  • 输入数据路径:输入文件所在路径,无权网络数据, 数据格式为两列 srcId(long) | dstId(long), 其中|为分隔符,分隔字段表示空白符或者逗号等。
  • 输入文件类型:格式包括以下两种:
  • csv:csv 文件。
  • 输入数据包含 header 信息。
  • 输入数据分割符:主要包括逗号、空格、分号、星号等分割符。
  • parquet:列式存储格式 parquet。

输出

  • 输出数据路径:输出文件所在路径。
  • 输出数据格式:格式包括以下两种:
  • csv:csv 文件。
  • 输出数据包含 header 信息。
  • 输出数据分割符:主要包括逗号、空格、分号、星号等分割符。
  • parquet:列式存储格式 parquet。

算法结果保存路径,共两列,其中第一列为 round 值,第二列为 anf 值,其中round = -1对应的 anf 为最终估计值。

参数说明

  • src:源节点列。
  • dst:目标节点列。
  • numPartition:分区数。
  • maxIter:最大迭代次数。

资源参数

  • drive 节点资源类型:请选择合适的 drive 节点机型。
  • executor 节点资源类型:请选择合适的 executor 节点机型。
  • num-executors:分配计算节点数目,可根据数据量来配置,一般训练数据量越大,需要的 worker 个数越多。
  • spark-conf:spark 常用参数配置,如压缩、序列化、网络等。

[2.0]LPA

LPA(Label Propagation Algorithm)是最简单的社区发现算法,通过标签扩散发掘网络的社区关系。

输入

  • 输入数据路径:输入文件所在路径。
  • 输入文件类型:格式包括以下两种:
  • csv:csv 文件。
  • 输入数据包含 header 信息。
  • 输入数据分割符:主要包括逗号、空格、分号、星号等分割符。
  • parquet:列式存储格式 parquet。

输出

  • 输出数据路径:输出文件所在路径。
  • 输出数据格式:格式包括以下两种:
  • csv:csv 文件。
  • 输出数据包含 header 信息。
  • 输出数据分割符:主要包括逗号、空格、分号、星号等分割符。
  • parquet:列式存储格式 parquet。

算法结果保存路径,共两列,其中第一列为节点 ID,第二列为节点对应的社区 ID。社区 ID 相同表示属于同一个社区。

参数说明

  • src:源节点列。
  • dst:目标节点列。
  • numPartition:分区数。

资源参数

  • num-executors:使用多少个 Spark 节点。
  • driver-memory:Spark driver 的内存大小。
  • executor-cores:每个 Spark 节点使用多少个 core。
  • executor-memory:每个 Spark 节点使用的内存大小。
  • spark-conf:Spark 的其他参数。 由于权限原因,需要用户额外提供 ugi 参数 spark.hadoop.hadoop.job.ugi=用户名:密码。

[2.0]EffectiveSize

EffectiveSize 是由结构空洞理论得到的网络度量指标,是 ego-network 中节点的重要衡量指标。

输入

  • 输入数据路径:输入文件所在路径。
  • 输入文件类型:格式包括以下两种:
  • csv:csv 文件。
  • 输入数据包含 header 信息。
  • 输入数据分割符:主要包括逗号、空格、分号、星号等分割符。
  • text:本文件。
  • parquet:列式存储格式 parquet。

输出

  • 输出数据路径:输出文件所在路径。
  • 输出数据格式:格式包括以下两种:
  • csv:csv 文件。
  • 输出数据包含 header 信息
  • 输出数据分割符:主要包括逗号、空格、分号、星号等分割符。
  • parquet:列式存储格式 parquet。

算法结果保存路径,共三列,其中第一列为节点 ID,第二列为 effectiveSize 值,第三列为 redundancyCol 值。

参数说明

  • src:源节点列。
  • dst:目标节点列。
  • numPartition:分区数。

资源参数

  • num-executors:使用多少个 Spark 节点。
  • driver-memory:Spark driver 的内存大小。
  • executor-cores:每个 Spark 节点使用多少个 core。
  • executor-memory:每个 Spark 节点使用的内存大小。
  • spark-conf:Spark 的其他参数。由于权限原因,需要用户额外提供 ugi 参数 spark.hadoop.hadoop.job.ugi=用户名:密码。

[2.0]PageRank

PageRank 是著名的节点排序算法,由 Google 发表。

输入

  • 输入数据路径:输入文件所在路径。
  • 输入文件类型:格式包括以下两种:
  • csv:csv 文件。
  • 输入数据包含 header 信息。
  • 输入数据分割符:主要包括逗号、空格、分号、星号等分割符。
  • text:本文件。
  • parquet:列式存储格式 parquet。

输出

  • 输出数据路径:输出文件所在路径。
  • 输出数据格式:格式包括以下两种:
  • csv:csv 文件。
  • 输出数据包含 header 信息
  • 输出数据分割符:主要包括逗号、空格、分号、星号等分割符。
  • parquet:列式存储格式 parquet。

算法结果保存路径,共三列,其中第一列为节点 ID,第二列为 effectiveSize 值,第三列为 redundancyCol 值。

参数说明

  • src:源节点列。
  • dst:目标节点列。
  • numPartition:分区数。
  • maxIter:最大迭代次数。
  • tol:最小容忍误差,当误差小于该值时,算法迭代提早结束。

资源参数

  • num-executors:使用多少个 Spark 节点。
  • driver-memory:Spark driver 的内存大小。
  • executor-cores:每个 Spark 节点使用多少个 core。
  • executor-memory:每个 Spark 节点使用的内存大小。
  • spark-conf:Spark 的其他参数。由于权限原因,需要用户额外提供 ugi 参数 spark.hadoop.hadoop.job.ugi=用户名:密码。

Angel图算法的更多相关文章

  1. 腾讯 angel 3.0:高效处理模型

    腾讯 angel 3.0:高效处理模型 紧跟华为宣布新的 AI 框架开源的消息,腾讯又带来了全新的全栈机器学习平台 angel3.0.新版本功能特性覆盖了机器学习的各个阶段,包括:特征工程.模型训练. ...

  2. 黑科技项目:英雄无敌III Mod <<Fallen Angel>>介绍

    英雄无敌三简介(Heroes of Might and Magic III) 英3是1999年由New World Computing在Windows平台上开发的回合制策略魔幻游戏,其出版商是3DO. ...

  3. 基于mapreducer的图算法

    作者现就职阿里巴巴集团1688技术部 引言 周末看到一篇不错的文章"Graph Twiddling in a MapReduce world" ,介绍MapReduce下一些图算法 ...

  4. Sad Angel (悲伤的天使)-Игорь Крутой

    悲伤的天使(neyanbhbin) -经典作曲Sad Angel( Печальныйангел)生活是一种连续的影响,每个小人物都有小人物的伟大故事.从开头的情侣,到美丽的丝带,从清洁老伯到卖气球的 ...

  5. 数据库备份还原工具EMS SQL Angel for SQL Server发布1.3版本

    EMS公司,是专门从事企业数据库以及内置于多层次客户服务器结构自动化开发.其EMS SQL Angel for SQL Server工具,便是SQL Servers数据库数据备份还原工具,并且还能使用 ...

  6. Angel - MemoryDataBlock - angel.task.estimize.sample.number

    angel.task.estimize.sample.number val validData = new MemoryDataBlock[LabeledData](isVali) trainData ...

  7. Angel - 模拟Kafka数据流调试FTRL的方法

    Angel - 模拟Kafka数据流调试FTRL的方法 Mac或者Linux版本(Win10的Linux子系统同样适用) 创建一个目录用来安装kafka以及zookeeper等相关软件,比如,新建一个 ...

  8. Angel 实现FFM 一、对于Angel 和分布式机器学习的简单了解

    Angel是腾讯开源的一个分布式机器学习框架.是一个PS模式的分布式机器学习框架. https://github.com/Angel-ML/angel   这是github地址. 我了解的分布式机器学 ...

  9. 大数据技术之_19_Spark学习_05_Spark GraphX 应用解析 + Spark GraphX 概述、解析 + 计算模式 + Pregel API + 图算法参考代码 + PageRank 实例

    第1章 Spark GraphX 概述1.1 什么是 Spark GraphX1.2 弹性分布式属性图1.3 运行图计算程序第2章 Spark GraphX 解析2.1 存储模式2.1.1 图存储模式 ...

随机推荐

  1. spring boot 或 spring 集成 atomikos jta 完成多数据源事务管理

    前言:对于事务,spring 不提供自己的实现,只是定义了一个接口来供其他厂商实现,具体些的请看我的这篇文章: https://www.cnblogs.com/qiaoyutao/p/11289996 ...

  2. 【ElasticSearch】文档路由的原理

    ElasticSearch集群环境下新增文档如何确认该文档被分配到哪个分片中? 路由算法: ⾸先这肯定不会是随机的,否则将来要获取⽂档的时候我们就不知道从何处寻找了.实际上,这个过程是根据下⾯这个公式 ...

  3. Vue学习(三)-Vue-router路由的简单使用

    一.Vue-Router环境的安装: 如果使用vue-cli脚手架搭建,项目创建过程中会提示你自否选择使用vue-router,选择使用即可, 二.路由学习 1.路由的配置    vue-cli项目自 ...

  4. hdu3117 斐波那契前后4位

    题意:       求斐波那契的前后4位,n <= 10^8. 思路:       至于前四位,和hdu1568的求法一样:       http://blog.csdn.net/u013761 ...

  5. UVA11134传说中的车(放棋子)

    题意:       给你一个n*n的棋盘,让你在棋盘上放n个棋子,要求是所有棋子不能相互攻击(同行或者同列就会攻击),并且每个棋子都有一个限制,那就是必须在给定的矩形r[i]里,输出每个棋子的位置,s ...

  6. layui的loading加载中

    var load = layer.load(1, { content: '数据加载中', shade: [0.4, '#393D49'], // time: 10 * 1000, success: f ...

  7. mongo中常用的命令

    命令使用mongo shell 执行 1.mongo中增加新字段 mongo shell 进入后执行use table选中要添加字段的库 db.getCollection('表名').update({ ...

  8. java使用户EasyExcel导入导出excel

    使用alibab的EasyExce完成导入导出excel 一.准备工作 1.导包 <!-- poi 相关--> <dependency> <groupId>org. ...

  9. golang:运算符总结

    算术运算符 运算符 示例 结果 + 10 + 5 15 - 10 - 5 5 * (除数不能为0) 10 * 5 50 / 10 / 5 2 % (除数不能为0) 10 % 3 1 ++ a = 0; ...

  10. 【打印机】无法连接 fail to connect to server cups 服务器错误 打印机

       打印机     fail to connect to server cups 服务器错误兆芯 打印机 连不上了####message可知 服务fail## systemd: cups.servi ...