LabelRank非重叠社区发现算法介绍及代码实现（A Stabilized Label Propagation Algorithm for Community Detection in Networks）

最近在研究基于标签传播的社区分类，LabelRank算法基于标签传播和马尔科夫随机游走思路上改装的算法，引用率较高，打算将代码实现，便于加深理解。

这个算法和Label Propagation 算法不同的是计算复杂度较高，对每个标签都确定了概率，但是准确性比Label Propagation算法好。

一、概念

相关概念不再累述，详情见前两篇文章

二、算法思路

首先建立一个标签集合，C={1，2，……n}，n是节点的数量。标签概率向量P_i（1*n），P_i(c)=节点i对标签c的概率估计，迭代过程中每个节点的对标签c的概率估计等于其邻居节点对标签c的概率估计平均，详见公式（1）

有此可得n*n维标签概率矩阵P（i→j）=[p_1,p_2,...p_n],迭代过程可以用矩阵乘法表示A*P，其中A是网络的邻接矩阵（01矩阵）。这个思路其实可以追溯到eigenvector Centrality算法¹，文献1已证明P会收敛下来。就这样就完了吗？并没有看到如何传递标签或者选择标签？

作者做的就是不停地缩放P中元素，然后删除一些概率较小的标签从P中，不停地减少标签个数，知道每个节点的标签序列不再变化，迭代停止，拥有最大概率的标签就是节点所属的社区。具体流程见下

（1）Propagation

初始阶段，每个节点访问邻居概率皆相等，见公式（3），每次迭代即左乘上一阶段的P，得到本阶段节点对每个标签的预估概率

（2）Inflation

根据公式（2）不停地迭代，矩阵中0，计算复元素逐渐被取代，复杂度越来越高，流程（2）和（3）就是为减少复杂度而做的工作。首先利用公式（4）将矩阵中的元素极端处理，使值大的越来越大，值小的越来越小

（3）Cut off

这一阶段就是在公式（4）的基础上进行删除操作，将P中低于r的阈值全都置换成0，最终得到的P参与下一次迭代

（4）Explicit Conditional Update

减少算法的另一个途径就是满足某一条件的节点停止更新，具体操作就是如果节点的最大标签（对n个标签估计概率最高的那个标签）和他的邻居节点最大标签的吻合度高于q（提前给出，一般去0.7左右），那么这个节点就可以停止更新了

（5）Stop Criterion

每个节点的最大评估概率的标签不再变化，迭代停止，具有相同标签的节点归为一个社区

三、参考文献

[1]Poulin R, Boily M C, Mâsse B R. Dynamical systems to define centrality in social networks[J]. Social Networks, 2000, 22(3):187-220.

Dynamical systems to define centrality in social networks

[2]Xie J, Szymanski B K. LabelRank: A stabilized label propagation algorithm for community detection in networks[C]// Network Science Workshop. IEEE, 2013:138-143.

A Stabilized Label Propagation Algorithm for Community Detection in Networks

四、代码（matlab）

代码目前还有一点点问题，后期调试后再更新

function [R,count]=LabelR(A,in,r,q)

%  LabelRank LabelRank: " A Stabilized Label Propagation

%  Algorithm for Community Detection in Networks "

%  Author: YY

%  Created on 2017.05.09

% Inputs :

% A : adjacent matrix

% in : Inflation parameter

%   : default =2

% q : Conditional Update parameter

%        default = 0.7

% r   : Cut off parameter

%  : default = 0.1

% Output :

% R : community classfication

%%

   %  Step1 : Propagation

Aori=A;

A=A+eye(length(A));%  add selfloop

k=repmat(sum(A,2),[1,length(A)]);

P0=A./k;

Ppre=A*P0;

a=1;

COM={};

count=0;

%%

   % Step2: Inflation

   while a

       Pnow=A*Ppre;

       Pin=Pnow.^in ;

       k=repmat(sum(Pin,2),[1,length(A)]);

       Pnow=Pin./k;

 %%

   % Step3: Cutoff

       index= Pnow<r;

       Pnow(index)=0;

%%

   % Step4: Explicit Conditional Update

    MaNow=max(Pnow,[],2);

    MaPre=max(Ppre,[],2);

    restart=[];

       for i=1:length(A)

           gain=0;

           Nb=find( Aori(i,:));

           MaxI=max(Pnow(i,:));

           MaxI=find(Pnow(i,:)==MaxI);

           MaxNb=MaNow(Nb);

           for k=1:length(Nb)

               MaxNbID=find(Pnow(Nb(k),:)==MaxNb(k));

               if all(ismember(MaxI,MaxNbID));% 1,2和1；1和1,2;1,2和1,2,4或者1,3,4

                   gain=gain+1;

               end

           end

           if gain>=q*length(Nb)

              restart=[i,restart];

           end

       end

        Pnow(restart,:)=Ppre(restart,:);

 %%

   % Step5: Stop Criterion

       if all(ismember(find(Pnow(i,:)==MaNow(i)),find(Ppre(i,:)==MaPre(i))))

           a=0;

       end

       Ppre=Pnow;

       count=count+1;

   end

   R=Pnow;

end

LabelRank非重叠社区发现算法介绍及代码实现（A Stabilized Label Propagation Algorithm for Community Detection in Networks）的更多相关文章

A Node Influence Based Label Propagation Algorithm for Community detection in networks 文章算法实现的疑问
这是我最近看到的一篇论文,思路还是很清晰的,就是改进的LPA算法.改进的地方在两个方面: (1)结合K-shell算法计算量了节点重重要度NI(node importance),标签更新顺序则按照NI ...
Top Leaders社区发现算法（top leaders community detection approach in information networks）
一.概念复杂网络:现实生活中各种系统都可以看做成复杂网络,复杂网络构成包括节点和边,节点是网络中的基本组成单元,节点之间的联系或者关系是网络中的边.例如电力网络:基站代表节点,基站之间是否互通表示 ...
社区发现算法问题&&NetworkX&&Gephi
在做东西的时候用到了社区发现,因此了解了一下有关社区发现的一些问题 1,社区发现算法 (1)SCAN:一种基于密度的社团发现算法 Paper: <SCAN: A Structural Clust ...
SLAP（Speaker-Listener Label Propagation Algorithm）社区发现算法
其中部分转载的社区发现SLPA算法文章一.概念社区(community)定义:同一社区内的节点与节点之间关系紧密,而社区与社区之间的关系稀疏. 设图G=G(V,E),所谓社区发现是指在图G中确定n ...
GNN 相关资料记录；GCN 与 graph embedding 相关调研；社区发现算法相关；异构信息网络相关；
最近做了一些和gnn相关的工作,经常听到GCN 和 embedding 相关技术,感觉很是困惑,所以写下此博客,对相关知识进行索引和记录: 参考链接: https://www.toutiao.com/ ...
模块度与Louvain社区发现算法
Louvain算法是基于模块度的社区发现算法,该算法在效率和效果上都表现较好,并且能够发现层次性的社区结构,其优化目标是最大化整个社区网络的模块度. 模块度(Modularity) 模块度是评估一个社 ...
社区发现算法 - Fast Unfolding（Louvian）算法初探
1. 社团划分 0x1:社区是什么在社交网络中,用户相当于每一个点,用户之间通过互相的关注关系构成了整个网络的结构. 在这样的网络中,有的用户之间的连接较为紧密,有的用户之间的连接关系较为稀疏.其中 ...
采样方法（二）MCMC相关算法介绍及代码实现
采样方法(二)MCMC相关算法介绍及代码实现 2017-12-30 15:32:14 Dark_Scope 阅读数 10509更多分类专栏: 机器学习版权声明:本文为博主原创文章,遵循CC 4 ...
标签传播算法（Label Propagation Algorithm, LPA）初探
0. 社区划分简介 0x1:非重叠社区划分方法在一个网络里面,每一个样本只能是属于一个社区的,那么这样的问题就称为非重叠社区划分. 在非重叠社区划分算法里面,有很多的方法: 1. 基于模块度优化的社 ...

随机推荐

xampp环境安装用法 composer
准备工作 1.打开PHP配置文件E:\xampp\php\php.ini确认以下模块已开启(移除前面的分号). extension=php_openssl.dll, extension=php_cur ...
CentOS yum 源的配置与使用（引用）
http://www.cnblogs.com/mchina/archive/2013/01/04/2842275.html
Dbutils学习（介绍和入门）
一:Dbutils是什么?(当我们很难理解一个东西的官方解释的时候,就让我们记住它的作用) Dbutils:主要是封装了JDBC的代码,简化dao层的操作. 作用:帮助java程序 ...
几个CSS-content的小例子
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
（KMP 水）Wow! Such Doge! -- hdu -- 4847
http://acm.hdu.edu.cn/showproblem.php?pid=4847 Wow! Such Doge! Time Limit:1000MS Memory Limit:32 ...
hdu 2058 The sum problem（数学题）
一个数学问题:copy了别人的博客 #include<cstdio> #include<cstdlib> #include<cmath> int main() { ...
FreeBSD查看即时网络流量
1.数据包 “netstat 1″一秒钟累计一次,”netstat 2″两秒钟累计一次.依此类推 2.查看网卡流量:”systat -if 1″每秒钟刷新一次,”systat -if 2″两秒钟刷新一 ...
Sql 辅助
1.清空数据表 SELECT 'TRUNCATE TABLE '+name AS TruncateSql FROM sys.tables
开源项目之ASP.NET Core + Vue.js 的前后端分离的通用后台管理系统框架
年前看了这个开源项目感觉很不错,这个小项目对于传统的.net 开发人员,想做技术提升是一个很不错的参考案例. 开源项目演示地址:https://dnczeus.codedefault.com/logi ...
Ruby on Rails 生成指定版本的 Rails 项目
ruby-on-rails ruby 本地 Rails 默认5.1.6 版本 $ gem list --local rails (5.1.6, 5.1.5, 5.1.4) 使用 version 生成指 ...

LabelRank非重叠社区发现算法介绍及代码实现（A Stabilized Label Propagation Algorithm for Community Detection in Networks）

LabelRank非重叠社区发现算法介绍及代码实现（A Stabilized Label Propagation Algorithm for Community Detection in Networks）的更多相关文章

随机推荐

热门专题