MaxCompute 助力衣二三构建智能化运营工具
摘要:本文由衣二三CTO程异丁为大家讲解了如何基于MaxCompute构建智能化运营工具。
衣二三作为亚洲最大的共享时装平台,MaxCompute是如何帮助它解决数据提取速度慢、数据口径差异等问题呢?程异丁通过衣二三数据体系架构,从用户运营应用、商品运营应用以及算法推荐系统三方面给大家剖析了MaxCompute是如何助力衣二三构建智能化运营工具的。
以下是精彩视频内容整理。
衣二三是谁?
衣二三是亚洲最大的共享时装平台。衣二三提供女性服饰包月租赁制服务,会员们在APP上挑选喜爱的衣服,可以在平台上用固定的月费在一整月内不断地换穿衣服,衣二三通过快递将衣服送到客户手中,客户只要会员期有效,就可以一直穿这件衣服,当会员不想穿的时候,衣二三还会通过快递按照约定的时间地点将衣服收回,这样会员就可以继续下新的订单,可以不断地换穿各种衣服。我们的客户从没有毕业的学生到工作多年的白领,多种类型的客户都能从APP上找到合适自己的衣服。
如今,电子商务发展非常成熟,线下逛街也是大家喜欢的生活方式,那为什么在这种情况下还要租衣服呢?衣二三为客户解决了以下几个痛点:
1.打开衣橱总是找不到今天想穿的衣服。使用衣二三,用户可以灵活的换装,不断地尝试不同风格;
2.费用高。衣二三标准的月费只有499元,相当于买一件衣服的价格,用户可以用买一件衣服的价格换穿一整月的不同服装。
3.大城市的房屋空间有限,拥有一个衣橱对于很多用户来说更是奢望。衣二三可以回收衣服,帮助用户节约空间,同时还负责清洗衣服,正如宣传语所说的那样——“你负责貌美如花,我负责清洗收发”;
4.卫生问题。衣二三联合福奈特、天天洗衣等共同打造了智能化现代化的洗衣工厂,每一件衣服需要经过多达16道清洗消毒流程,比自己家里洗衣服还要干净;
5.购买和退换问题。衣二三通过体验式的方式帮助用户从款式、尺码等方面找到真正适合自己的衣服,并且允许用户买下来。
为什么使用 MaxCompute?
衣二三的前后端运营比较复杂,前端需要让客户在尽可能短的时间认识我们,了解我们,才能形成转化;后端也是特别复杂,与一般的电商相比,衣二三有明显的异同,常规电商的客户在前端下好单后,会通过订单管理系统,将订单派发到仓储中心,仓储中心会对订单进行拣货、配货、包装、物流等,最终将商品送到客户手中,也可能伴随着一小部分的退货或返修,对于一般电商来讲,整个流程到这里就基本结束了,但是对于衣二三来说,该流程只进行了一半,我们需要对所有的衣服进行回收、清洗和质检,才能够再次上架让客户挑选,如此复杂的运营自然离不开大数据的支持,MaxCompute作为整个数据体系的核心,帮助了衣二三很多。
那么,在未使用MaxCompute前我们遇到了哪些问题呢?主要包括以下几方面:
- 数据提取速度慢。随着系统不断地变复杂,SQL越跑越慢。
- 数据口径差异。每个工程师将逻辑都写在SQL里,不同工程师得到的数据结果可能不一样,这就是因为我们没有集中化标准化的数据仓库对每一个数据维度和业务的指标有相应明确的定义,造成所有的逻辑都在SQL中。
- Python脚本实现基础ETL。作业调度与依赖难于维护与迭代,运维也是比较令人头疼的,修复时间长。
- 人工数据提取及报表制作。工程师忙于提供各个业务部门的数据支持。
这些问题促使我们想要做出改变,起初我们想做一套完整的hadoop全家桶进行替代,但评估后发现其运维代价和资源消耗对于我们的数据团队和运维团队来说,都是比较大的负担,而且很难快速体现价值。后来,我们很幸运的遇到了MaxCompute,从试用开始,我们逐渐把数据仓库和数据体系建构在MaxCompute上。
MaxCompute有哪些好处呢?主要从以下几个维度来分析:
1.MaxCompute是基于云端的大数据仓库,无需复杂作业运维工作
2.数据吞吐量大,查询性能好,支持UDF
3.可视化任务编辑界面,易于上手
4.使用成本低,适合初创公司
5.与阿里云大数据产品生态融为一体,比如RDS,应用层的Quick BI,Blink以及日志服务。
如何应用MaxCompute?
衣二三数据体系架构如图所示,最底层是数据源,包括RDS生产数据库和日志服务等,通过日志服务、DataHub等投递到数据计算层;数据计算层以MaxCompute为核心,同时配合我们自己做的脚本和UDF进行数据存储和计算,生成的结果反馈到前端数据应用层;数据应用层是数据分析展示工具,包括YConsole、QuickBI以及DataV等,我们使用DataV做展示业务全局的看板,让我们快速了解全国各地谁在下单、仓储中心的储备情况等。
我们还有包括用户画像、商品画像、爆款识别、衣二三指数和实时人效监控等。
用户运营应用
用户运营对于互联网公司来讲,都是极其重要的,它有两个业务指标,一是转化,一是留存。转化是指尽快让客户了解我们的价值,同时形成付费和转化;留存是指让已经成为我们用户的用户在平台上得到好的体验,让用户喜欢这种生活方式并留下来。
我们结合了MySQL数据和用户日志放到MaxCompute中,经过PAI平台,我们自己做了数据分析,包括使用数据挖掘算法和随机森林等的数据维度分析,对我们整个用户运营做了很多量化指标,我们通过邮件日报对运营指标监控,基于这些指标我们开发了自有用户分群体系推进用户精细化运营;基于阿里云机器学习计算平台PAI,我们建立了预测模型,预测用户的转化率等;引入流失预警计算体系后,运营根据用户的流失指数进行精准挽留营销,将会员流失降低了超过50%。
商品运营应用
衣二三的每一个商品都有结构化的数据,我们专业的买手会给商品打上20+维度的标签。此外,我们会总结用户行为,用户与商品之间的互动都放在MaxCompute中做相关性分析,形成商品的一系列指标,比如爆款识别,通过爆款识别去预测满足哪些属性和维度的衣服会形成爆款,我们的买手会带着数据工具一起进行采购,极大的提高了运营效率。
我们还结合商品各个表现维度,包括库存深度、出租情况等计算出衣二三指数,它可以对商品进行排名。除了给合作伙伴应有的租赁收益外,我们还会提供数据工具,最大化业务模式的价值。
商品的灵魂就是标签,只要将标签做的足够细,才能从结构化上去理解它,去做一些预测性的指标。我们通过商品不同的标签及风格场景热度指数进行备货指导,通过最终商品空置率进行商品调拨及库存关联,通过衣二三指数反映商品热度排行,根据用户行为促进租售转化,完成商品流动闭环。
算法推荐系统
如何让用户在很短的时间内找到适合一个月穿的衣服呢?这就需要推荐算法的支持。
衣二三的推荐算法也是基于MaxCompute,把用户对商品的行为通过日志收集到MaxCompute中,对用户进行用户画像,对用户画像进行模型训练,最终落地到商品列表展示给用户。使用推荐系统给我们的业务带来很大提升,选衣页推荐的点击率增加了70%,人均点击数增加了50%;相关单品推荐的点击率增加了150%,人均点击率增加了110%。
总结下来,大数据的魅力大家已经认识到,MaxCompute这样的产品对于初创公司来讲将大数据门槛降的非常低,让大数据能够面向各种各样的公司来贡献力量和发挥价值。谢谢在场各位的倾听,以上就是我的分享。
本文作者:晋恒
本文为云栖社区原创内容,未经允许不得转载。
MaxCompute 助力衣二三构建智能化运营工具的更多相关文章
- 华为视频编辑服务(Video Editor Kit),助力开发者高效构建应用视频编辑能力
视频编辑服务(Video Editor Kit)是华为开放给开发者快速构建视频编辑能力的服务,提供视频导入.编辑处理.特效渲染.视频导出.媒体资源管理等一站式视频处理能力.视频编辑服务为全球开发者提供 ...
- 智能化管理工具:商业智能BI
BI(商业智能)是在ERP等信息化管理工具的基础上提出的,是基于信息技术构建的智能化管理工具,它实时地对ERP.CRM.SCM等管理工具生成的企业数据进行各种分析,并给出报告,帮助管理者认识企业和市 ...
- 推荐一款App运营工具:AYL爱盈利App榜单监控
对包括开发者.产品运营.投资人在内的诸多移动互联网从业人员而言,国内Android应用市场和IOS应用市场的榜单变化数据时大家的必修功课之一:看看这段时间所关注的垂直领域里最火的是哪几款应用:看看竞争 ...
- Maven-项目构建技术(工具)
Maven-项目构建技术(工具) 主要的内容目标:如何创建项目.如何导入jar.如何进行其他配置.如何管理生命周期 今天的主要安排: maven的概述(为什么要用?是什么) 快速入门(配置.名词解释. ...
- java并发编程(7)构建自定义同步工具及条件队列
构建自定义同步工具 一.通过轮询与休眠的方式实现简单的有界缓存 public void put(V v) throws InterruptedException { while (true) { // ...
- 阿里云吴天议:云原生SDWAN 应用 构建智能化云原生SDWAN生态
2019年11月16日 SDWAN 大会在北京正式召开.阿里云网络资深产品专家吴天议先生继阿里云网络研究员祝顺民先生发表了对云原生SDWAN的进化与展望之后(原文请见https://bit.ly/2K ...
- Ganglia与Centreon整合构建智能化监控报警平台
一.智能运维监控报警平台的组成 随着大数据时代的来临,运维工作的难度越来越大,每个运维人员都要面临不计其数的服务器和海量的数据,如何保证众多服务器和业务系统稳定高效地运行并尽量减少死机时间,成为考核运 ...
- 阿里大数据产品Dataphin上线公共云,将助力更多企业构建数据中台
日前,由阿里数据打造的智能数据构建与管理Dataphin,重磅上线阿里云-公共云,开启智能研发版本的公共云公测!在此之前,Dataphin以独立部署方式输出并服务线下客户,已助力多家大型客户高效自动化 ...
- Jetstrap 在线构建 Bootstrap 的工具
Jetstrap 是一个 100% 基于 Web 的 Twitter Bootstrap 构建工具,无需下载软件,只需登录并构建即可.并且别人可以访问你构建的产品.
随机推荐
- CCA Spark and Hadoop 开发者认证技能点【2016只为hadoop达到巅峰】
Required Skills 技能要求: Data Ingest 数据消化: The skills to transfer data between external systems and you ...
- [TJOI2017]城市 【树的直径+暴力+优化】
Online Judge:Luogu P3761 Label:树的直径,暴力 题目描述 从加里敦大学城市规划专业毕业的小明来到了一个地区城市规划局工作.这个地区一共有n座城市,n-1条高速公路,保证了 ...
- Beyond Compare注册码
注册码: --- BEGIN LICENSE KEY --- H1bJTd2SauPv5Garuaq0Ig43uqq5NJOEw94wxdZTpU-pFB9GmyPk677gJ vC1Ro6sbAvK ...
- python 日记 day4
1.为何数据要分类 数据是用来表示状态的,不同的状态应该用不同类型的数据来表示. 2.数据类型 数字 字符串 列表 元组 字典 集合 列表:列表相比于字符串,不仅可以储存不同的数据类型,而且可以储存大 ...
- 一个班六个人,学号语文、数学、英语,接收成绩(不接受学号),输出学号成绩,总分、平均分,按总分排序(原生JS)
<!doctype html> <html> <head> <meta charset="utf-8"> <title> ...
- 责任链模式(Chain of Responsibility、Handler)(请求处理建立链)
(使多个对象都有机会处理请求,从而避免了请求的发送者和接受者之间的耦合关系.将这些对象连成一条链,并沿着这条链传递该请求,直到有对象处理它为止.) 从名字中看出 ,系统中将会存在多个有类似处理能力的对 ...
- 在scrapy中利用Selector来提取数据
1.创建对象 Selector类的实现位于scrapy.selector模块,创建Selector对象的时候,可以将页面的Html文档字符串传递给Selector构造器方法 2.选中数据 调用Sele ...
- python-基础-字符串-列表-元祖-字典
1 字符串 1.1 下标和切片 1.2 切片 1.3 字符串常见操作 如有字符串mystr = 'hello world itcast and itcastcpp',以下是常见的操作 <1> ...
- Redis源码解析:30发布和订阅
Redis的发布与订阅功能,由SUBSCRIBE,PSUBSCRIBE,UNSUBSCRIBE,PUNSUBSCRIBE,以及PUBLISH等命令实现. 通过执行SUBSCRIBE命令,客户端可以订阅 ...
- CF 549B Looksery Party
题面 解题思路 如果a数组全部>0,那么都不去即可.从这个角度出发,每次选出a[i]为0的,让它们去更新a数组,相当于拓补排序. 代码 #include<iostream> #inc ...