RFM模型


在众多的客户价值分析模型中,RFM模型是被广泛应用的,尤其在零售和企业服务领域堪称经典的分类手段。它的核心定义从基本的交易数据中来,借助恰当的聚类算法,反映出对客户较为直观的分类指示,对于没有数据分析和机器学习技术支撑的初创企业,它是简单易上手的客户分析途径之一。

RFM模型主要有三项指标:

Recency:最近消费时间间隔

Frequency:消费频率

Monetary:消费金额

我们为客户在这三项指标上进行打分,那么总共会有27种组合的可能,使用K-Means算法,能够缩减到指定的有限数量的分箱(一般会为5类),计算出每个客户在分箱的位置即客户的价值。

当然RFM模型还有更多衍生版本,可以参考WiKi:RFM (customer value)

ML.NET和K-Means


ML.NET自v0.2版本就提供了K-Means++ clustering的实现,也是非监督学习最常见的训练,正好适用于为RFM模型的分类执行机器学习。

动手实践


基本要求

  • Visual Studio 2017 或者 Visual Studio Code
  • DotNet Core 2.0+
  • ML.NET v0.3

数据来源

本案例数据来自UCI:Online Retail,这是一个跨国数据集,其中包含2010年12月1日至2011年12月9日期间在英国注册的非商店在线零售业务中发生的所有交易。该公司主要销售独特的全场礼品。该公司的许多客户都是批发商。

属性信息:

InvoiceNo:发票编号。标称值,为每个事务唯一分配的6位整数。如果此代码以字母'c'开头,则表示取消。

StockCode:产品(项目)代码。标称值,为每个不同的产品唯一分配的5位整数。

Description:产品(项目)名称。标称。

Quantity:每笔交易的每件产品(项目)的数量。数字。

InvoiceDate:发票日期和时间。数字,生成每个事务的日期和时间。

UnitPrice:单价。数字,英镑单位产品价格。

CustomerID:客户编号。标称值,为每个客户唯一分配的5位整数。

Country:国家名称。每个客户所在国家/地区的名称。

数据处理

  1. 使用Excel,对原始数据增加4个字段,分别是Amount(金额,单价与数量相乘的结果)、Date(InvoiceDate的整数值)、Today(当天日期的整数值)、DateDiff(当天与Date的差值)。

  1. 建立透视图,获取每个客户在Amount上的总和,DateDiff的最大和最小值,并且通过计算公式Amount/(DateDiff最大值-DateDiff最小值+1)算出频率值。

  1. 按照以下规则计算RFM的评分

    • R:(DateDiff最大值- DateDiff最小值-2000)的差值,小于480计3分,480-570之间计2分,570-750之间计1分,大于750计0分。
    • F:频率值,大于1000计5分,500-1000之间计4分,100-500之间计3分,50-100之间计2分,0-50之间计1分,小于0计0分。
    • M:Amount总和值,大于10000计5分,5000-10000之间计4分,2000-5000之间计3分,1000-2000之间计2分,0-1000之间计1分,小于0计0分。

有小伙伴可能存在疑问,为什么要这么划分,其实这就是对数据分布合理分段的一种思想,为了减小数据源的不平衡性对机器学习的影响,我们尽量使得数据的分布是自然的。

编码部分

还是熟悉的味道,创建DotNet Core控制台应用程序,通过Nuget添加对ML.NET的引用。

  • 创建用于学习的数据结构
public class ClusteringPrediction
{
[ColumnName("PredictedLabel")]
public uint SelectedClusterId;
[ColumnName("Score")]
public float[] Distance;
} public class ClusteringData
{
[Column(ordinal: "0")]
public string CustomId; [Column(ordinal: "1")]
public float Amount; [Column(ordinal: "2")]
public float MinDataDiff; [Column(ordinal: "3")]
public float MaxDataDiff; [Column(ordinal: "4")]
public float MeanAmount; [Column(ordinal: "5")]
public float M; [Column(ordinal: "6")]
public float F; [Column(ordinal: "7")]
public float RelativaDataDiff; [Column(ordinal: "8")]
public float R;
}
  • 训练部分
static PredictionModel<ClusteringData, ClusteringPrediction> Train()
{
int n = 1000;
int k = 5; var textLoader = new Microsoft.ML.Data.TextLoader(DataPath).CreateFrom<ClusteringData>(useHeader: true, separator: ',', trimWhitespace: false);
var pipeline = new LearningPipeline();
pipeline.Add(textLoader);
pipeline.Add(new ColumnConcatenator("Features",
"R",
"M",
"F"));
pipeline.Add(new KMeansPlusPlusClusterer() { K = k });
var model = pipeline.Train<ClusteringData, ClusteringPrediction>(); return model;
}
  • 评估部分
static void Evaluate(PredictionModel<ClusteringData, ClusteringPrediction> model)
{
var textLoader = new Microsoft.ML.Data.TextLoader(DataPath).CreateFrom<ClusteringData>(useHeader: true, separator: ',', trimWhitespace: false);
var evaluator = new ClusterEvaluator();
var metrics = evaluator.Evaluate(model, textLoader);
Console.WriteLine("AvgMinScore:{0}", metrics.AvgMinScore);
Console.WriteLine("Dbi:{0}", metrics.Dbi);
Console.WriteLine("Nmi:{0}", metrics.Nmi);
}
  • 预测部分
static void Predict(PredictionModel<ClusteringData, ClusteringPrediction> model)
{
var predictedData = new ClusteringData()
{
R = 3F,
M = 3F,
F = 1F
};
var predictedResult = model.Predict(predictedData);
Console.WriteLine("the predicted cluster id is: {0}", predictedResult.SelectedClusterId);
}
  • 调用部分
static void Main(string[] args)
{
var model = Train();
Evaluate(model);
Predict(model);
}
  • 运行结果

可以看到,我用于测试的客户,被分到了第2类上面。

尽管完成了聚类的工作,对于学习出来的这5个类别,仍然需要按原始数据集全部遍历预测出对应的分类,根据客户的RFM评分与分类的对应关系,才能够对每个类别的意义进行有效地解释。

结尾


这个简单的案例为大家展示了使用ML.NET完成聚类的机器学习。对于想要上手针对自己公司的业务,进行一些门槛较低的客户分析,使用ML.NET将是一个不错的选择。当然ML.NET还在不断迭代中,希望大家持续关注新的特性功能发布。

完整代码如下:

using Microsoft.ML;
using Microsoft.ML.Models;
using Microsoft.ML.Runtime.Api;
using Microsoft.ML.Trainers;
using Microsoft.ML.Transforms;
using System; namespace RMFClusters
{
class Program
{
const string DataPath = @".\Data\Online Retail.csv"; public class ClusteringPrediction
{
[ColumnName("PredictedLabel")]
public uint SelectedClusterId;
[ColumnName("Score")]
public float[] Distance;
} public class ClusteringData
{
[Column(ordinal: "0")]
public string CustomId; [Column(ordinal: "1")]
public float Amount; [Column(ordinal: "2")]
public float MinDataDiff; [Column(ordinal: "3")]
public float MaxDataDiff; [Column(ordinal: "4")]
public float MeanAmount; [Column(ordinal: "5")]
public float M; [Column(ordinal: "6")]
public float F; [Column(ordinal: "7")]
public float RelativaDataDiff; [Column(ordinal: "8")]
public float R;
} static PredictionModel<ClusteringData, ClusteringPrediction> Train()
{
int n = 1000;
int k = 5; var textLoader = new Microsoft.ML.Data.TextLoader(DataPath).CreateFrom<ClusteringData>(useHeader: true, separator: ',', trimWhitespace: false);
var pipeline = new LearningPipeline();
pipeline.Add(textLoader);
pipeline.Add(new ColumnConcatenator("Features",
"R",
"M",
"F"));
pipeline.Add(new KMeansPlusPlusClusterer() { K = k });
var model = pipeline.Train<ClusteringData, ClusteringPrediction>(); return model;
} static void Evaluate(PredictionModel<ClusteringData, ClusteringPrediction> model)
{
var textLoader = new Microsoft.ML.Data.TextLoader(DataPath).CreateFrom<ClusteringData>(useHeader: true, separator: ',', trimWhitespace: false);
var evaluator = new ClusterEvaluator();
var metrics = evaluator.Evaluate(model, textLoader);
Console.WriteLine("AvgMinScore:{0}", metrics.AvgMinScore);
Console.WriteLine("Dbi:{0}", metrics.Dbi);
Console.WriteLine("Nmi:{0}", metrics.Nmi);
} static void Predict(PredictionModel<ClusteringData, ClusteringPrediction> model)
{
var predictedData = new ClusteringData()
{
R = 3F,
M = 5F,
F = 1F
};
var predictedResult = model.Predict(predictedData);
Console.WriteLine("the predicted cluster id is: {0}", predictedResult.SelectedClusterId);
} static void Main(string[] args)
{
var model = Train();
Evaluate(model);
Predict(model);
}
}
}

使用ML.NET实现基于RFM模型的客户价值分析的更多相关文章

  1. 案例(一) 利用机器算法RFM模型做用户价值分析

      一.案例背景 在产品迭代过程中,通常需要根据用户的属性进行归类,也就是通过分析数据,对用户进行归类,以便于在推送及转化过程中获得更大的收益. 本案例是基于某互联网公司的实际用户购票数据为研究对象, ...

  2. 为啥我做的RFM模型被人说做错了,我错哪了?

    本文转自知乎 作者:接地气的陈老师 ————————————————————————————————————————————————————— 有同学问:“为啥我做的RFM模型被客户/业务部门批斗,说 ...

  3. RFM模型的变形LRFMC模型与K-means算法的有机结合

    应用场景: 可以应用在不同行业的客户分类管理上,比如航空公司,传统的RFM模型不再适用,通过RFM模型的变形LRFMC模型实现客户价值分析:基于消费者数据的精细化营销 应用价值: LRFMC模型构建之 ...

  4. 航空客户价值分析特色LRFMC模型——RFM升级

    本文转载自微信公众号TIpDM. 每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 我们说RFM ...

  5. RFM模型

    python信用评分卡(附代码,博主录制) https://study.163.com/course/introduction.htm?courseId=1005214003&utm_camp ...

  6. pandas 实现rfm模型

    import pandas as pd import numpy as np df = pd.read_csv('./zue_164466.csv') df['ptdate'] = pd.to_dat ...

  7. 大前端学习笔记整理【一】CSS盒模型与基于盒模型的6种元素居中方案

    概览 CSS盒模型,规定了元素框来处理元素的 内容.内边距.边框和外边距的方式 元素部分是指内容部分,也是最实际的内容,包围内容的称之为内边距,内边距外围是边框,边框外围就是外边距:且外边距是透明的, ...

  8. 中国快递包裹总量的预测-基于SARIMA模型

    code{white-space: pre;} pre:not([class]) { background-color: white; }if (window.hljs && docu ...

  9. 基于RBAC模型的通用企业权限管理系统

    1. 为什么我们需要基于RBAC模型的通用企业权限管理系统 管理信息系统是一个复杂的人机交互系统,其中每个具体环节都可能受到安全威胁.构建强健的权限管理系统,保证管理信息系统的安全性是十分重要的.权限 ...

随机推荐

  1. IntelliJ IDE 基础经验备案

    1.配置本地的JAVA环境 2.配置本地安装的Maven环境 详情 1.配置本地的JAVA环境 准备: 本地已经安装java环境,目录:C:\Program Files\Java\jdk1.8.0_1 ...

  2. unity打包exe中的资源管理

    给美术和产品用unity做一些exe工具,会频频遇到导入导出资源的情况. 首先所有的文件应该放在StreamingAssets文件夹下, 如果需要动态替换贴图,这样美术只要替换default.png就 ...

  3. 变量前缀__device__以及__managed__

    1.__device__ 作为变量前缀时,__device__限定符声明位于设备上的变量.如果此限定符单独使用,则变量具有以下特征: a.位于全局存储器空间中: b.与应用程序具有相同的生命周期: 可 ...

  4. PBRT笔记(10)——体积散射

    体散射处理过程 3个影响参与介质在环境中的辐射度分布的主要因素: 吸收:减少光能,并将其转化为别的能量,例如热量. 发光:由光子发射光能至环境中. 散射:由于粒子碰撞,使得一个方向的辐射度散射至其他方 ...

  5. angular1.3 video

    video标签动态获取播放链接是出现 Error: $interpolate:interr Interpolation Error Error: $sce:insecurl Processing of ...

  6. IntelliJ IDEA最新破解版2018.3.1(附2018.2.2 完美破解教程)

    2018.3.1最新版破解 1.官网下载IDEA 2018.3.1的商业版本点我去下载 2.破解jar下载:JetbrainsIdesCrack-3.4-release-enc.jar点我去下载 3. ...

  7. 用JDBC把Excel中的数据导入到Mysql数据库中

    步骤:0.在Mysql数据库中先建好table 1.从Excel表格读数据 2.用JDBC连接Mysql数据库 3.把读出的数据导入到Mysql数据库的相应表中 其中,步骤0的table我是先在Mys ...

  8. input标签实现小数点后两位保留小数

    短短一行代码就可以实现 <input type="number" min="0" max="100" step="0.01& ...

  9. go-设计思想

    1, 围绕 简单 这一核心的设计 隐式接口,切片, 类的弱化,强制用组合 简洁高效的并发 弱化的指针 err 判定,先判错的习俗. 2, 有自己的坚持,不盲目攀比 比优点比不过很多语言,没C快,没ja ...

  10. Android第三次作业

    制作音乐播放器 实现的功能: 歌曲的播放.暂停.停止.上一首.下一首.歌单列表的显示(获取本地歌曲). 成品图: 功能代码实现: 实现歌曲的播放.暂停.停止.上一首.下一首: public void ...