从洞察到决策,一文解读标签画像体系建设方法论丨DTVision分析洞察篇
一、数字营销是数字化转型排头兵
《⼗四五数字经济发展规划》中强调,要⼤⼒推进数字化转型,形成数据驱动的智能决策能⼒,提升企业整体运营效率。
要做好数字化转型,企业可从产、研、供、销、⽤等多个环节入手,而 “销” 恰好是第一关键要素,企业转型往往从营销场景入手,因此我们说数字化营销是企业数字化转型的排头兵。
在数字化营销转型过程中,由于各个企业的数字化建设进程不同,往往会遇到多种挑战,如:
· 企业数据如何打通?
· 客户画像如何建设?
· 营销ROI如何提升?
· 营销策略如何迭代?

要想解决以上问题,在业务⽣产与业务应⽤之前,让产业数字化营销,我们需要进⾏:
· 数据的统⼀存储;
· OneID 的数据打通;
· OneModel 的数据模型建设;
· 数据资产的统⼀管理。
打好这些基础,接下来就能开始建设企业自己的个性化标签体系,让标签作为企业数字化营销的基石,帮助消费者画像更加精确。
实现用数据指导营销,而不再只是含糊的经验;让活动的数据再回流到数仓中,作为标签数据来源的一部分,形成营销业务闭环。

二、标签体系建设方法论
那么如何帮助企业构建完美的标签体系呢?我们总结出“三目标 + 五步法”的方法论:

1、标签体系建设三目标
● 目标一:解决业务问题
要确定我们建设标签体系是为了解决什么具体的业务问题,想要达到什么效果,时间上要做到分期而治、小步快跑,早日推广应用。
● 目标二:业务人员好用、易用
标签体系的建设目标是要灵活可扩展,让业务人员可以轻松衍生标签、生产效率高。同时标签应用方式还需要多种多样,以适应不同的业务要求。
● 目标三:可持续更新迭代
标签体系作为重要数据资产,需要我们对它进行持续完善,形成业务应用与数据开发部门良好互动,助力生产更有价值的数据。
2、标签体系建设五步法
第一步 明确建设目标
在开始建设标签时,我们需要明确建设目标,目标可以指导我们的执行策略无偏差,最终达到想要的结果,否则在建设过程中随着一些信息的输入、困难的出现,容易今天一榔头明天一棒槌,顾此失彼,达不到业务期望的结果。

● 业务建设目标
业务建设目标,指通过标签项目想解决什么样的问题,达到什么样的业务效果。比如
· 现在属于粗略式的运营,需要基于标签体系实现精细化运营,将营销活动的转化率提升5%;
· 标签加工流程过于缓慢,从业务人员提需求到需求实现需要1-2周时间,需要将改时间缩短至1-3天;
· 现在数据来源过于单一,只有交易域,需要汇总其他域的数据,比如行为数据、评论数据、活动数据等丰富标签体系维度。
一般列举5-10条目标,业务部门与技术部门一起制定,基于这些目标,进行系统建设。
● 系统建设目标
为实现对应的业务目标,需要建设一个怎样的系统,是内部实现,还是外部采购,各自的实现周期与成本,若外部采购,采购的标准是什么等都需要考虑,该问题一般是技术部门来考虑。
· 系统给谁使用:是建设一个标签加工与管理的标签管理工具,主要给技术部门使用,因为企业已经有了营销系统、涵盖标签圈群与推送给的功能。还是需要一个集合加工、管理、圈群、分析一体化的工具,数据分析师、业务人员也要用。不同的使用对象,系统建设的内容不一样。
· 系统的技术架构要求:公司内部的大数据部门若已经用了一些底层平台或技术组件,从节省成本方面,应当尽量用同一套底层存储与计算平台,比如已经采购了CDH、TDH的Hadoop,那标签系统需要可直接对接这些系统进行数据存储与计算。以及标签系统需要和CRM系统、营销平台实现对接,便需要有相应的对接方案,如通过标签服务API接口,或数据同步、推送等当时,将数据给到下游系统。
· 系统功能要求:基于标签的加工、标签的生名周期管理、标签的数据安全、标签的评估治理、标签圈群、画像洞察、对外服务等多方面梳理需要的功能。
· 系统性能要求:基于司内的数据量,标签加工的速度、并发,标签圈群与分析的查询时间,所需要的部署资源、一年需要花费的成本需要进行评估与计算。
● 参与部门与执行计划
根据我们一些标签项目的建设经理,会出现这样的情况,大数据部门一期项目建好的标签,很难推动业务人员使用起来,主要有以下几点原因:
业务人员觉得建设的标签有用的很少,大多数都用不上;
用了一下标签,觉得数据不准确,不敢用;
领导没有说要用这些标签,还是按照自己的既定模式来工作好了。
基于这些问题,标签项目推进之初,需要拉上业务部门的领导、对接人一起参与,确定一个先应用标签的项目或场景,做出效果,再应用到更多的部门及项目,否则刚开始大而全,周期长、且没有目标性,往往后续推广使用时会遇到阻碍。
● 参与部门包含以下:
· 需要标签项目服务的业务部门(核心):如市场部、运营部、客服部、风控部等,各指定一名对接人员;
· 项目需求收集分析者:数据产品经理、数据分析师;
· 系统建设和标签加工者:数据科技部门。
● 制定执行计划:
· 项目是否需要分期,一期项目的目标和建设的标签有哪些;
· 各期项目时间周期、负责人,上线场景;
· 上线后业务人员需要持续反馈使用情况,业务变化情况,不断的优化迭代。
第二步 标签体系建设
明确好建设目标之后的下一步就是标签体系设计。
在此之前,我们先对一些标签的重要概念做一些介绍:

标签体系设计是一种对对象统一进行本质刻画的数据描述办法,把个体观察升级为群体观察,而非过去对个体现象的归纳,更具有面向未来的场景化适应能力。标签体系设计的整体流程可分为 4 大步骤 + 2 大阶段:

在此过程中我们需要:
● 规划实体对象
确定标签体系的对象,梳理标签间的关系,设计标签体系,做好标签类目创建。

实体指我们要建立标签体系的对象,如客户标签体系、商品标签体系、渠道标签体系、客户经理标签体系,客户、商品、渠道、客户经理都属于我们的实体对象。其类似一颗树的根,后续要基于“实体”,长出树的枝干、叶子、花等,所以划分正确的实体很重要。
关系指多个实体之间的关系,如“客户”购买“基金”,会使客户实体与基金实体发生关系,形成新的标签,比如加工“投资风险偏好”标签,标签值为“高风险”、“中高风险”、“低风险”等,需要利用客户最近一年的交易记录结合基金维表,当用户购买基金的基金类型包含高风险,且最近一年购买金额>5000时,为高风险偏好。需要用到2个实体形成一个关系,来加工这个标签。
● 探查数据
根据标准数据建仓规范,梳理下大概的客户的数据域、业务过程、数据表、表的数据量、数据分布等,掌握基于该数据,可以加工出哪些标签。

● 设计标签类目
基于已采集的业务需求、掌握的数据情况、规划的实体的对象,建立实体对象的标签类目体系。除根据客户业务建设外,也会提供一些行业通用模板,作为参考。
标签类目体系是“实体”树的枝干,为以后标签生长的繁茂建立基础,需要做到枝枝粗壮、分明,即每个类目需要有明显的分割,且标签的数量不能过多和过少,建议一个子类目不超过20个标签,不少于3个标签。
标签类目层级根据业务实际情况划分,一般2~3层即可(不包含标签、标签值)。如下图:

● 设计标签内容
包含标签定义、加工方法判断、加工范围判断等。

根据前面的需求调研、数据调研、类目划分,梳理标签体系中的标签,需包含以下内容:
· 标签中文、英文名:标签的中文名称、英文名称;
· 标签所属类目:标签所属一级、二级、三级类目;
· 标签类型:根据不同维度的划分,采用其中一种。比如事实标签、统计类标签、预测类标签,亦或是原子标签、衍生标签、组合标签、自定义标签等;
· 标签值定义:定义每个标签的标签值,如“近一个月买入金额区间”标签,可根据购买金额的区间段定义“零/低端”、“普通”、“中端”、“准高端”、“高端”等标签值;
· 标签含义(描述):描述该标签业务含义,如“最近30天的购买商品的金额区间,对用户消费力进行评估”;
· 业务口径:标签以哪个数据定义为准,如“用户活跃城市”标签,以用户购买次数最多的城市为口径加工,而不是浏览次数、评论次数等;
· 标签技术口径:描述该标签从哪个表的哪个字段取值,SQL取数逻辑是什么;
· 业务方来源:该标签的业务需求方是谁;
· 标签更新周期:描述标签更新频次,天(如T+1、T+2等)、周、月、小时、分钟更新等;
· 标签更新优先级:同一时间端跑多个标签时,若资源有限,先跑优先级高的标签。
第三步 标签加工与更新
标签加工与更新包含各类型标签加工、标签测试和标签上线与更新几个步骤,在技术层面实现营销需求。

● 判断标签加工方法
梳理标签的加工方式,判断哪些是离线标签、实时标签、算法标签,从而引入对应的产品和相应的开发人员来开发。业务场景中,离线标签偏多,实时标签次之,算法标签少之。
· 离线标签:定时跑批,一般为天粒度,T+1跑批,晚上跑标签结果,业务人员第二天做查询。一些标签若高频率更新,也支持小时、分钟粒度的更新。常需要Spark、Presto、Impala等跑批组件及产品。
· 实时标签:实时加工,一般为秒或毫秒级加工,常见于用户行为实时传上来,基于用户的实时行为,打标签,进行商品推荐等。常需要采用Kafka消息队列、Flink实时计算引擎组及产品。
· 算法标签:利用机器学习算法、深度学习算法,做一些预测类标签,如根据用户的购物商品和频率,预测家里是否有小孩、小孩年龄等。常需要Python开发环境和机器学习算法包。
不同的加工类型,往往需要采用不同的计算引擎和框架,需判断企业内容是否有这样的能力加工,若无,外部采购的话需要供应商有什么样的能力,需要有大致的判断。
● 划分加工范围
标签的使用人员是业务人员,在以往老的流程中,需要业务人员向数据开发提需求加工新标签,开发一个新标签的周期一般1-2周之间。
为了使业务人员能够灵活的加工规则标签,尽快提取自己想要的数据,标签的加工、管理目前多通过产品化的方式,使数据开发、数据分析师、业务人员都能参与标签的开发。
这里便涉及到哪些标签由开发人员加工,哪些标签由业务人员加工,标签加工流程是什么等。

可按照上述流程,在数据开发和业务人员之间有个标签管理团队,用来维护标签的生命周期,包括标签需求的分解、上下架等,可由数据分析师、业务人员组成。
● 大的划分原则是:
基础标签的标签由数据开发团队加工,这类标签是基于数仓数据加工的最细粒度标签(是能打在用户身上的标签,不是某个单纯的字段),不能再被拆解。
基于基础标签可通过规则衍生的,由业务人员完成。
以上图为例:当有一个“是否30天登录未注册用户”标签需求时,标签管理团队可判断该标签是否可基于基础标签衍生,若不行,则由数据开发加工对应的标签。
若可以,则判断是否有对应的基础标签可衍生,如举例标签,可拆解成“APP最近一次登录日期”或”距最近一次登录时间”,与“是否注册”2个基础标签,便可基于基础标签,业务人员完成这2个标签的加工与上线。
第四步 标签生命周期管理
标签生命周期管理是指包含标签评估、标签治理和标签迭代等几个对标签的实际使用状态负责的管理流程,帮助实现标签建设与营销的有机结合,不浪费任何一个动作指标。

● 从以下维度来评估标签的重要性
标签使用度评分:根据标签引用次数、标签分析次数、标签调用次数来评估标签的使用度;
标签关注度评分:根据标签搜索次数、标签浏览次数、标签收藏次数来评估标签的关注度;
标签质量评分:根据标签值的覆盖情况来评估标签的质量,若null值过多,则说明标签规则设置不合理;
标签持续优化度评分:根据标签上线后,再编辑优化的次数来评估标签的持续优化情况;
标签安全评分:根据标签是否脱敏、是否设置行级权限、是都需要申请、是否设置可见性来判断标签的安全度。
基于以上5个维度计算标签的综合评分,可查看各标签的评分、评估标签的重要性。
同时,基于标签使用度评分、标签关注度评分、标签持续优化度评分来计算热门标签排行、沉默标签排行,找出不太用的标签进行下线,完成标签的“定义——开发——上线——优化——下线”全生命周期管理。
第五步 标签应用与回流
标签应用与回流则是指标签圈群、画像洞察和对外服务几项具体的落地结果操作,也是标签建设必不可少的一环。

● 以一个场景举例:
· 营销策略:为维持老顾客的忠诚度,并引导现在购买初级产品的老客户向高级产品进阶,圈选出为“老顾客升级”用户,为这些客户发放高端产品的优惠券;
· 人群包选择:“最近1年购买次数>=1”且“最近1年消费金额>=1000”且“性别=女”的客户。
● 基于目前群组进行画像洞察:
· 群组画像:进一步分析“老客户升级”这批用户的会员等级、月消费支出、是否为活跃用户等,进一步掌握群组特征,根据活动预算调整自己的营销策略。
· 群组分析:圈选出一个“高端产品用户”群组,监控每天忠实用户的人数,看是不是有明显波动,某些活动发放后,数据是否有提升;某个时间人数是否有骤减,保障群组的稳定持续上升。
· 群组交并差计算:分析“老顾客升级”群组与“高端客户”的重合度,看是否有重复人群,最终推送优惠券可进行策略调整,不针对这部分重合客户进行本次推送。
确定好人群后,便可进行市场投放,看其对业务带来的作用,除分析活动带来的GMV、客单价提升外,我们也需要知道活动参与情况也是用户行为数据的一种,需要将这些数据也回流至数仓,生成新的标签。
三、标签体系在某基金的建设案例
在上文中我们介绍了标签体系建设的方法论,如何将理论落地实践,袋鼠云数栈智能标签产品给出了答案。
客户数据洞察平台(DataTag),通过标签萃取、标签管理、群组细分、全面画像,构建以业务价值为导向的标签体系和多样化群组,将数据资产标签化,数据标签价值化,应用于企业智能化运营与营销。

接下来我们以某基金客户的案例,来为大家介绍标签体系建设的实际应用。
1、项目背景
身处一个全方位数字化的平台型经济时代,企业的数字化转型已是由内而外的必然趋势,在数字化浪潮下,基金客户的各项业务迅猛发展、客户数据量急剧增长,公司对客户、产品、渠道、反洗钱等方面的数据分析、运营提出了更高要求,在此背景下,搭建一套完整的标签平台,提升营销效率,无疑是最佳的选择。
2、客户痛点
· 客户数据分散在各个系统,无统一的分析平台;
· 各类数据分析和提取大多采用半自动的工作模式,无科学的标签体系;
· 客户活动开发周期长,运营不精准,营销效果缺乏及时追踪、运行反馈不及时。
3、建设方案
· 对接星环 TDH引擎;
· 提供标签实施服务,为客户梳理标签体系,完标签开发,建立客户标签体系,支持销售、服务、合规等不同角度的需求;
· 便捷的标签开发、运算、展示和输出等全生命周期管理;支持客户个体及群组画像、客户群圈选和对比,支持快速推广、智能营销、精准服务。

4、建设流程
· 业务层面:以客户实际业务现状和业务需求为基础,量身定制适用于业务的标签体系;
· 数据层面:将各业务系统中消费者数据回流至数据中台,根据标签设计,进行数据探查、清洗、建模、开发等工作并实施上线。

5、业务效果
· 标签体系:建立客户、基金、基金经理、渠道 4 个标签体系;
· 标签数量:600 + 标签;
· 加工效率:标签加工效率从 1 周缩短到 2 天,运营效率提升至 2~3 次 / 周;
· 标签应用:应用在基金营销、反洗钱风险控制、用户流失召回等多个方向。

袋鼠云开源框架钉钉技术交流qun(30537511),欢迎对大数据开源项目有兴趣的同学加入交流最新技术信息,开源项目库地址:https://github.com/DTStack
从洞察到决策,一文解读标签画像体系建设方法论丨DTVision分析洞察篇的更多相关文章
- Jquery操作文档标签
1.插入动作 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UT ...
- python全栈开发day39-CSS继承性和层叠性、权重问题、盒模型和其属性、文本级标签和块级标签、浮动
一.上次内容回顾 1.CSS的三种引入方式: 行内式 内接式 外接式 链接式 导入式 2.基础选择器和高级选择器 1)标签选择器 p{} 2) id选择器 #nva{} 3) 类选择器 .nva{} ...
- jQuery---jq操作标签文本(html(),text()),jq操作文档标签(插入,删除,修改),克隆,,jq操作属性,jq操作class属性,jq操作表单value,jq操作css,jq操作盒子(重要),jq操作滚动条
jQuery---jq操作标签文本(html(),text()),jq操作文档标签(插入,删除,修改),克隆,,jq操作属性,jq操作class属性,jq操作表单value,jq操作css,jq操作盒 ...
- 民生银行十五年的数据体系建设,深入解读阿拉丁大数据生态圈、人人BI 是如何养成的?【转】
早在今年的上半年我应邀参加了由 Smartbi 主办的一个小型数据分析交流活动,在活动现场第一次了解到了民生银行的阿拉丁项目.由于时间关系,嘉宾现场分享的内容非常有限.凭着多年对行业研究和对解决方案的 ...
- 一文让你从此告别HTTP乱码(二)Response篇
#circle { background-color: #8fcbec; border: 3px } 概述 开发Web项目的过程中,经常遇到浏览器中显示的内容乱码,或者服务器获取浏览器请求参数时乱码的 ...
- 地图POI类别标签体系建设实践
导读 POI是“Point of interest”的缩写,中文可以翻译为“兴趣点”.在地图上,一个POI可以是一栋房子.一个商铺.一个公交站.一个湖泊.一条道路等.在地图搜索场景,POI是检索对象, ...
- 一文让你从此告别HTTP乱码(一)Request篇
#circle { background-color: #8fcbec; border: 3px } 概述 开发Web项目的过程中,经常遇到浏览器中显示的内容乱码,或者服务器获取浏览器请求参数时乱码的 ...
- 一文解读AIoT (转)
AIoT即AI+IoT,指的是人工智能技术与物联网在实际应用中的落地融合.目前,越来越多的行业及应用将AI与IoT结合到了一起,AIoT已经成为各大传统行业智能化升级的最佳通道,也是未来物联网发展的重 ...
- 一文解读AI芯片之间的战争 (转)
2015年的秋天,北京的雨水比往年要多些,温度却不算太冷.这一年里,年仅23岁的姚颂刚刚拿到清华大学的毕业证书;32岁的陈天石博士毕业后已在中科院计算所待了整整8年;而在芯片界摸爬滚打了14年的老将何 ...
- Programming好文解读系列(—)——代码整洁之道
注:初入职场,作为一个程序员,要融入项目组的编程风格,渐渐地觉得系统地研究下如何写出整洁而高效的代码还是很有必要的.与在学校时写代码的情况不同,实现某个功能是不难的,需要下功夫的地方在于如何做一些防御 ...
随机推荐
- MySQL中怎么分析性能?
MySQL中主要有4种方式可以分析数据库性能,分别是慢查询日志,profile,Com_xxx和explain. 慢查询日志 先用下面命令查询慢查询日志是否开启, show variables lik ...
- Fetch 别名查找
if (PlanClass.Attributes.Contains("new_excelcolor_avg")) ...
- 【教程】C语言入门
C语言入门 首先导入头文件 #include<stdio.h> 接下来编写主函数 #include<stdio.h> int main() { retuen 0; } 最后,在 ...
- Asp.net mvc基础(五)Redirect和View
1.重定向 (1)return RedirectToAction("Action名称"); //重定向到在同一个Controller下的Action方法下 (2)return Re ...
- Sentinel源码—4.FlowSlot实现流控的原理
大纲 1.FlowSlot根据流控规则对请求进行限流 2.FlowSlot实现流控规则的快速失败效果的原理 3.FlowSlot实现流控规则中排队等待效果的原理 4.FlowSlot实现流控规则中Wa ...
- jmeter之多并发
1.做压力测试时需要设置线程数,2.造数据时跑多接口多条数据需要设置线程数,并且保证每个线程的多接口顺序执行.3.需要设置数据不重复或者自增 一.设置线程数 主要用于压力测试需要多并发时设置线程数,以 ...
- cocos3 Shader的CCProgram模板详解
这段内容描述的是一个 着色器(Shader) 的基本结构模板,可能用于一种自定义的着色器语言或框架(例如基于某种图形渲染引擎或中间表示语言扩展的着色器定义方式).以下是逐部分解析其含义: 1. CCP ...
- 关于:js怎么获取元素的自定义属性的问题(原生JavaScript)
最近项目需要把后端传过来的数据隐藏的保存在页面中,方便后边做事件处理时使用.鉴于之前总是在后端处理后的页面中看到元素里除了常见的id.name属性外的data-xxx,就想到:元素的属性必然是可以自定 ...
- 最强AI数字人,口型、表情、动作全同步!Kairos下载介绍
在数字化浪潮汹涌澎湃的今天,视频合成技术如同一颗璀璨的明星,照亮了内容创作的广阔天地 Kairos是一款顶级数字人制作工具,它基于先进的 AI 算法,能够快速克隆出用户的数字分身,并且精准匹配外貌.声 ...
- ServletContext相关
简介 如何得到对象 有什么作用 1.获取全局配置参数 2.获取web工程中的资源 3.存取数据,servlet间共享数据 域对象 ServlerContext的生命周期 ServletContext ...