四、 如何构建电商用户画像

4.1 构建电商用户画像技术和流程

构建一个用户画像,包括数据源端数据收集、数据预处理、行为建模、构建用户画像

有些标签是可以直接获取到的,有些标签需要通过数据挖掘分析到!

4.2 源数据分析

用户数据分为2类:动态信息数据、静态信息数据

静态信息数据来源:

  • 用户填写的个人资料,或者由此通过一定的算法,计算出来的数据

  • 如果有不确定的,可以建立模型来判断,比如用户的性别注册没有填写,可以建立模型,根据用户的行为来判断用户性别是什么,或者它的概率

动态信息数据来源:

  • 用户行为产生的数据:注册、游览、点击、购买、签收、评价、收藏等等。

  • 用户比较重要的行为数据:游览商品,收藏商品、加入购物车、关注商品

根据这些行为特性可以计算出:用户注册时间、首单时间、潮妈族、纠结商品、最大消费、订单数量、退货数量、败家指数、品牌偏好等等。

4.3 目标分析

用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。

如,红酒 0.8、李宁 0.6。

标签:表现了内容,用户对该内容有兴趣、偏好、需求等等。

权重:表现了指数,用户的兴趣、偏好指数,也可能表现用户的需求度,可以简单的理解为可信度,概率。

4.4 用户画像建模

4.4.1 用户基本属性表

根据用户所填写的属性标签和推算出来的标签。用于了解用户的人口属性的基本情况和按不同属性维度统计。

作用:按人口属性营销、比如营销80后,对金牛座的优惠,生日营销。

主要数据来源:用户表、用户调查表、孕妇模型表、马甲模型表。

用户表:记录用户最基本的属性特性。

用户调查表:补充用户的其他基本信息。

用户所填写的基本信息:用户ID、用户名、密码、性别、手机号、邮箱、年龄、户籍省份、身份证编号、注册时间、收货地址等

用户所填信息计算得到的指标:

生日、星座、城市等级、手机前几位、手机运营商、邮件运营商

用户调查表得到:学历、收入、职业、婚姻、是否有小孩、是否有车有房、使用手机品牌。

根据算法得到:

身高、体重、性别模型、孩子性别概率、潜在汽车用户概率、是否孕妇、孩子年龄概率、手机品牌、更换手机频率、是否有小孩,是否有车,使用手机档次,疑似马甲标准、疑似马甲账号数、用户忠诚度、用户购物类型。

模型算法---性别模型

  • 用户自己也填写了性别,但仍然要用算法算一次性别

  • 性别验证方法

随机抽样几千条数据让客户打电话确认。

与用户自己填的性别做对比,确认百分比。

模型算法---用户汽车模型

模型算法---用户忠诚度模型

  • 忠诚度越高的用户越多,对网站的发展越有利

模型算法---用户身高尺码模型

模型算法---用户马甲标志模型

  • 马甲是指一个用户注册多个账号

  • 多次访问地址相同的用户账号是同一个人所有

  • 同一台手机登陆多次的用户是同一个人所有

  • 收货手机号相同的账号同一个人所有

模型算法---手机相关标签模型

  • 对于手机营销参考意义比较大

  • 使用手机品牌: 最常用手机直接得到

  • 使用手机品牌档次:根据档次维表

  • 使用多少种不同的手机:手机登陆情况

  • 更换手机频率(月份):按时间段看手机登陆情况

4.4.2 客户消费订单表

根据客户消费的情况提取的客户标签,用于了解用户的消费总体情况,

最终的目的根据用户消费习惯与消费能力做营销。

主要数据来源:订单表、退货表、用户表、购物车表

订单表可以得到相关标签:

第一次消费时间、

最近一次消费时间、

首单距今时间、

尾单距今时间------分析用户什么时候来购买商品以及多久没有购买了。

最小消费金额、

最大消费金额、

累计消费次数(不含退拒)、

累计消费金额(不含退拒)、

累计使用代金券金额、

累计使用代金券次数。-----分析用户总体消费情况。

客单价(含退拒)、

近60天客单价(含退拒)-----分析用户消费水平。

常用收货地址、

常用支付方式----分析用户常用的消费属性,方便做定向营销。
近30天购买次数(不含退拒)、

近30天购买金额(不含退拒)

近30天购买次数(含退拒)、

近30天购买金额(含退拒)----分析用户最近的消费能力。

退货商品数量、

退货商品金额、

拒收商品数量、

拒收商品金额、

最近一次退货时间-----分析用户拒收和退货习惯。
最近30天购物车次数、

最近30天购物车商品件数、

最近30天购物车提交商品件数、

最近30天购物车放弃件数、

最近30天购物车成功率------分析用户购物车使用习惯
学校下单总数、

单位下单总数、

家里下单总数、

上午下单总数、

下午下单总数、

晚上下单总数----分析用户购物时间与地点习惯。

4.4.3 客户购买类目表

根据客户购买类目的情况提取客户标签,用于了解类目的购买人群情况和针对某一类目的营销等。

主要数据来源:订单表、购物车表、类目维表

一级分类ID、

一级分类名称、

二级分类ID、

二级分类名称、

三级分类ID、

三级分类名称-----分析用户都购买了哪些类目。

电商的三级类目:

京东商城:

淘宝:

订单表和类目维表可以得到相关标签:

近30天购买类目次数、

近30天购买类目金额、

近90天购买类目次数、

近90天购买类目金额、

近180天购买类目次数、

近180天购买类目金额、

累计购买类目次数、

累计购买类目金额----分析用户最近都购买了哪些类目。

最近一次购买类目时间、

最后一次购买类目距今天数----分析用户多久没有购买这个类目。

购物车表和类目维表可以得到相关标签

近30天购物车类目次数、

近30天购物车类目金额、

近90天购物车类目次数、

近90天购物车类目金额----分析用户最近都挑中哪些类目。

4.4.4 用户访问信息表

根据客户访问的情况提取相关客户标签。

用于了解用户的访问总体情况,方便根据客户游览习惯做营销

主要数据来源:点击流日志行为表(PC/APP端)

点击流日志行为表可以得到相关标签:

最近一次APP/PC端访问日期、

最近一次APP/PC端访问使用操作系统、

最近一次APP/PC端访问使用游览器、

最近一次访问IP地址、

最近一次访问城市、

最近一次访问的省份-----分析用户最近一次访问情况。

第一次APP/PC端访问日期、

第一次APP/PC端访问使用操作系统、

第一次APP/PC端访问使用游览器、

第一次访问IP地址、

第一次访问城市、

第一次访问的省份-----分析用户第一次访问情况。

近7天APP/PC端访问次数、

近30天APP/PC访问次数、

近60天APP/PC端访问次数、

近90天APP/PC端访问次数、

近180天APP/PC端访问次数、

近365天APP/PC端访问次数----分析用户APP/PC端访问次数。

近30天PC/APP端访问天数、

近30天PC/APP端访问并购买次数、

近30天PC/APP端访问PV、

近30天PC/APP端访问平均PV、

近30天PC/APP端最常用的游览器、

近30天PC/APP端不同IP数、

近30天PC/APP端最常用IP-----分析用户访问详情。

近30天0-5点访问的次数、

近30天6-7点访问的次数、

近30天8-9点访问的次数、

近30天10-12点访问的次数、

近30天13-14点访问的次数、

近30天15-17点访问的次数、

近30天18-19点访问的次数、

近30天20-21点访问的次数、

近30天22-23点访问的次数----分析用户喜欢在哪个时间上网访问。

![1620890989969](C:\Users\defaultuser0\AppData\Roaming\Typora\typora-user-images\1620890989969.png)

SparkSQL电商用户画像(二)之如何构建画像的更多相关文章

  1. SparkSQL电商用户画像(三)之环境准备

    五. 电商用户画像环境搭建 众所周知,Hive的执行任务是将hql语句转化为MapReduce来计算的,Hive的整体解决方案很不错,但是从查询提交到结果返回需要相当长的时间,查询耗时太长.这个主要原 ...

  2. SparkSQL电商用户画像(五)之用户画像开发(客户基本属性表)

    7.电商用户画像开发 7.1用户画像--数据开发的步骤 u 数据开发前置依赖 -需求确定 pv uv topn -建模确定表结构 create table t1(pv int,uv int,topn ...

  3. SparkSQL电商用户画像(四)之电商用户画像数据仓库建立

    六.  电商用户画像数据仓库建立 7.1  数据仓库准备工作 为什么要对数据仓库分层?星型模型 雪花模型 User----->web界面展示指标表 l    用空间换时间,通过大量的预处理来提升 ...

  4. Flink SQL结合Kafka、Elasticsearch、Kibana实时分析电商用户行为

    body { margin: 0 auto; font: 13px / 1 Helvetica, Arial, sans-serif; color: rgba(68, 68, 68, 1); padd ...

  5. 通过Dapr实现一个简单的基于.net的微服务电商系统(十二)——istio+dapr构建多运行时服务网格

    多运行时是一个非常新的概念.在 2020 年,Bilgin Ibryam 提出了 Multi-Runtime(多运行时)的理念,对基于 Sidecar 模式的各种产品形态进行了实践总结和理论升华.那到 ...

  6. Spark项目之电商用户行为分析大数据平台之(十二)Spark上下文构建及模拟数据生成

    一.模拟生成数据 package com.bw.test; import java.util.ArrayList; import java.util.Arrays; import java.util. ...

  7. Spark项目之电商用户行为分析大数据平台之(二)CentOS7集群搭建

    一.CentOS7集群搭建 1.1 准备3台centos7的虚拟机 IP及主机名规划如下: 192.168.123.110 spark1192.168.123.111 spark2192.168.12 ...

  8. Spark大型项目实战:电商用户行为分析大数据平台

    本项目主要讲解了一套应用于互联网电商企业中,使用Java.Spark等技术开发的大数据统计分析平台,对电商网站的各种用户行为(访问行为.页面跳转行为.购物行为.广告点击行为等)进行复杂的分析.用统计分 ...

  9. Spark项目之电商用户行为分析大数据平台之(六)用户访问session分析模块介绍

    一.对用户访问session进行分析 1.可以根据使用者指定的某些条件,筛选出指定的一些用户(有特定年龄.职业.城市): 2.对这些用户在指定日期范围内发起的session,进行聚合统计,比如,统计出 ...

随机推荐

  1. CCPC-2020 黑龙江省赛——Let’s Get Married

    题意:~~ 思路:题目给出的数字太少了,我们多写几个,就会发现每层最左边的值等于1.2*k(k+1) ,k代表层数,找规律发现如果一个点的坐标为2.(x,y)且|a|+|b|=k,id<=2*k ...

  2. ch2_8_1求解n阶螺旋矩阵问题

    思路:循环输出,注意边界控制 import java.util.Scanner; public class ch2_8_1求解n阶螺旋矩阵问题 { public static void main(St ...

  3. C语言之文件操作

    C语言之文件操作 在本节我们将会讲解有关文件的读写操作: 纲要: 一些需要掌握的知识点 文件名 文件类型 数据流 文件缓冲区 文件指针 与文件操作相关的一些函数 文件的打开及关闭 文件的顺序读写 文件 ...

  4. Elasticsearch 主节点和暖热节点解析

    Elasticsearch 主节点和暖热节点解析 主节点 控制整个集群,进行一些轻量级操作,列如:跟踪哪些节点是集群中的一部分,决定节点分片分配,负责集群健康, 不包含数据,也不参与搜索和索引操作,对 ...

  5. 【spring源码系列】之【xml解析】

    1. 读源码的方法 java程序员都知道读源码的重要性,尤其是spring的源码,代码设计不仅优雅,而且功能越来越强大,几乎可以与很多开源框架整合,让应用更易于专注业务领域开发.但是能把spring的 ...

  6. 如果要做优化,CSS提高性能的方法有哪些?

    一.前言 每一个网页都离不开css,但是很多人又认为,css主要是用来完成页面布局的,像一些细节或者优化,就不需要怎么考虑,实际上这种想法是不正确的 作为页面渲染和内容展现的重要环节,css影响着用户 ...

  7. 自动化kolla-ansible部署ubuntu20.04+openstack-victoria之基础配置-04

    自动化kolla-ansible部署ubuntu20.04+openstack-victoria之基础配置-04 欢迎加QQ群:1026880196 进行交流学习 近期我发现网上有人转载或者复制原创博 ...

  8. 嗨,你知道吗,Spring还有这些高级特性!

    目录 Spring介绍 设计理念 核心组件的协同工作 设计模式的应用 代理模式 策略模式 特性应用 事件驱动编程 异步执行 定时任务 日常开发使用非常多的Spring,它的设计理念是什么呢?有哪些核心 ...

  9. day9.函数2

    一.函数对象 函数是第一类对象,第一等公民,函数对象即函数可以被当作变量去用. 具体分为四个方面: 1.可以被赋值 def func(): print('from func') f = func pr ...

  10. 004-Java中的运算符

    @ 目录 一.运算符 一.分类 二.算数运算符 三.关系运算符 四.逻辑运算符 五.赋值运算符 六.条件运算符(三目运算符) 七.+运算符 一.运算符 一.分类 二.算数运算符 加  $+$ 减  $ ...