基于 MaxCompute 的智能推荐解决方案
简介: 在互联网行业红利已过、在获客成本越来越高、在用户在线时长全网基本无增长以及信息大爆炸的情况下,如何更好的转化新用户和提升老用户粘性就变得至关重要,智能化的个性化推荐无疑是经过验证的重要手段之一,我们每天使用的移动App或企业内都处处有其身影。
本文作者 吴世龙 阿里云智能 高级产品专家
一、背景介绍
行业趋势
“2018年天猫双11共产生了453亿次AI个性化推荐,阿里巴巴副总裁、淘宝总裁蒋凡表示淘宝可能是全世界最大人工智能的应用,他说:“在今年双11我们也可以看到,基于个性化推荐的流量已经超过了搜索等方式带来的流量,这是一个非常非常大的变化”
信息爆炸一词最早出现在20世纪80年代,各种信息以指数级增长,如何处理过载的信息成为了重要的问题,而这对于无论是消费者还是信息发布者还是承载的平台,都意味着眼下和未来都面临着巨大的挑战,而个性化推荐系统的本质则是高效连接信息和用户,于用户满意度提升,于信息发布者获得合理的用户群,于平台价值转化最大化。
MaxCompute产品背景
MaxCompute 是面向分析的企业级 SaaS 模式云数据仓库,以 Serverless 架构提供快速、全托管的在线数据仓库服务,消除了传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您可以经济并高效的分析处理海量数据。数以万计的企业正基于 MaxCompute 进行数据计算与分析,将数据高效转换为业务洞察。
智能推荐产品背景
智能推荐,基于阿里巴巴领先的大数据和人工智能技术,根据用户的兴趣偏好,解决用户需求和内容展示中间的关联问题。结合阿里巴巴在电商、内容、新闻、视频直播和社交等多个行业领域的积累,为全球企业及开发者提供云推荐服务与机器学习平台。
智能推荐在我们生活和工作中都是会遇到的,比如某工业客户,在企业内部有许多的资料供员工查看。智能推荐不止是对于ToC的企业,ToB的企业在企业内部,包括一些知名的企业,内部都是用很多资料,能够让员工方便的,快速的,高效的供员工查看。这个需求在ToB企业中也是普遍现象。ToC企业的需求更加明显,如果大家关注行业报告,会发现互联网的红利已经基本结束,用户的渗透率已经很高。那在行业发展和用户增量达到瓶颈时,用户的在线时长从2020年的6.1小时,仅仅增加到6.3小时,用户的在线时间基本上处于停滞不增加的阶段。那企业随之也会面临两个问题,一企业用户获客成本越来越高,增量的难度也越来越高。二获客成本越来越高的情况下,存量客户怎么去增加在线时长。从这两个问题表明,如何充分、高效转化不管是增量还是存量的用户,对于企业来说都是非常重要的一环。
二、智能推荐业务场景与价值
哪些行业需要智能推荐
不管是电商行业、内容行业、新闻行业包括上文讲到的行业,其实行行业业都会用到智能推荐。大家一听到智能推荐都会想到ToC的行业,但ToB的行业也是需要智能推荐,因为企业内部有大量的资料和文章。推荐本身已经渗透到我们平时用到的产品的方方面面,从产品形态来看电商,内容,新闻等都有它的身影,通过大数据+算法预测出我们更感兴趣的内容,极大的改善了用户体验;
痛点
电商/零售行业
•获客成本高用户留存差
•成交转化率低复购率低
•人工规则推荐效率低效果差
内容/资讯/视频行业
•获客成本高用户留存差
•用户粘性/活跃度低
•人工规则推荐效率低效果差
场景
电商/零售行业
•App首页瀑布流
•店铺首页瀑布流
•商品详情页
•卖场活动页
•其他
内容/资讯/视频行业
•首页瀑布流
•内容/资讯/视频详情页
•主题/专题瀑布流
客户使用智能推荐后的效果
从下图表中可以看出,在企业使用完智能推荐之后,各项效果指标有了明显的提升。
某知名垂类社区商城 |
某知名垂类电商 |
中青看点个性化推荐 |
某食谱类APP |
|
|
|
|
成交转化率提升 40%+ |
CVR提升 100% |
CTR提升 80%+ |
PV_CTR提升 38% |
GMV提升 50%+ |
每用户下单数提升 89% |
用户均停留时长提升 10Min |
UV_CTR提升 34% |
基于数据仓库的智能推荐架构
智能推荐是典型的大数据应用场景,所以强依赖于数据仓库。智能推荐在数据对接方面,基于MaxCompute来实现,通过应用MaxCompute内部的一些计算能力,能够更好的分析、管理企业的数据,从而实现智能推荐的业务场景。如果您的数据量较小,也可以通过SDK把数据推送到智能推荐,实现您的业务场景。智能推荐支持算法定制和业务定制,给予企业充分的灵活自主可控的能力。
三、自建痛点与产品优势
自建痛点(智能推荐)
搭建成本
•人员要求高:自建推荐系统对人员要求较高,系统开发、数据处理、召回、排序模型开发及调优,均需要高级开发&算法工程师长期参与。
•上线周期长:推荐系统架构复杂,为达到上线效果需要反复调优,所需开发时间多于3个月。
•运维成本高:升级迭代、自建系统后期有较高的维护成本。
推荐效果
•效果调优困难:套用主流算法不一定有好的效果,还需考虑应用领域数据、相关性、新颖度、时效性等多维度推荐效果
•核心指标难统一:想提高CTR的同时又增加用户停留时长,无法兼顾多个核心指标
•迭代周期长与业务快节奏:业务节奏通常很快,而内部人力有限,既要快节奏又要人力占用少还要服务稳定性高更要见效快
后续维护
•适配难度大:任何一套推荐引擎都无法完全适配企业的业务诉求,阿里云智能推荐提供了黑白盒一体化
•运营易用性:推荐系统较复杂,不具备算法知识但需要干预的运营人员上手难度大
•服务稳定性:推荐场景通常用于高流量页面,对系统性能及稳定性以及弹性要求极高
自建数据仓库面临的挑战
企业为了使用数据驱动业务发展,在建设和运营企业数据仓库时面临的问题:
1、启动成本高、建设周期长,价值难以快速验证
2、如何处理多样数据,拥抱新技术,充分挖掘数据价值
3、难以共享企业数据资产、数据创新成本高
4、平台架构复杂、运营成本高
5、满足业务需要的扩展性和弹性
业务增长
通过自建的方式搭一套智能推荐系统是没问题的,但搭建推荐的效果如何保障。智能推荐的效果在不同行业的定义不同,在提升效果的同时,需要在推荐系统内做大量的工作。
多场景&业务适配
•不同企业(业务目标和效果不同)
•同一企业不同阶段
•同一阶段不同场景
•同一场景不同诉求
实验平台
•选品
•召回
•排序
•业务诉求
阿里云智能推荐=领先的算法能力+稳定且高效的工程体系+完整且灵活的产品能力
智能推荐产品优势
开箱即用
•高度产品化、行业化(电商/内容/新闻)
•覆盖全链路(支持友盟SDK行为采集)
推荐精准
•行业、场景定向优化
•行业与阿里自研主流算法封装
•猜你喜欢&相关推荐
•多目标模型训练
全托管
•保障在线服务稳定性
•灵活升降配服务
•丰富的数据质量诊断功能,在线服务监控告警
灵活适配
•运营助手:产品和运营可快速干预推荐
•开发和算法:集成强大的离线、在线链路开发能力
MaxCompute产品优势
简单、易用
- 数据仓库(Data Warehouse)
- 面向数仓优化高性能存储、计算
- 多服务预集成、标准SQL,开发简单
- 企业级服务-内建完善的管理和安全能力
- 服务化(As a Service)
- Serverless、免运维
- 按量付费、不用不花钱
- 自动升级
匹配业务发展的弹性扩展
- 动态扩缩容,无需提前容量规划,满足突发业务增长
- 存储-计算独立扩展,无扩展性限制
- 业务增长性能不降级
多分析场景支持
近实时化、交互分析、AI分析、数据湖分析方面增强,支持更多业务场景
- 机器学习
- PAI原生集成
- 内置Spark ML
- Mars科学计算
- 传统数仓
- ETL:SQL +UDF
- BI:查询加速、MC-Hologres
- 数据湖分析
- SQL外表
- 联邦查询
- 非结构化数据处理
- 近实时数仓
- 近实时写入
- 近实时分析
开放的平台
全托管服务上支持开放接口和生态,为数据、应用迁移、二次开发提供灵活性。
- 管理接口开放
- Java/Python SDK
- 标准JDBC接口
- 数据开放
- 开放的导入导出数据接口(Tunnel 上下传)
- LOAD/UNLOAD:免费、高性能导入/导出ORC、Parquet开放格式到数据湖
- 兼容主流语法
- MaxCompute SQL兼容Hive SQL语法
- 支持原生Spark作业
- 开放的生态
- Flink/Kafka/Presto Connector
- Airflow/Azkaban/Kettle调度
- 支持Tableau、FineBI及通用JDBC BI工具
四、配置与启动服务
产品使用基础流程
成本优化:可在POC阶段使用入门版实例测试,测试完成后一键升配标准版正式切流。
主要分成四个步骤:1、数据准备;2、创建实例;3、策略配置;4、测试、发布。
实现基础服务搭建只需1个普通水平的工程师花费3-5天即可完成。
通过历史数据( MaxCompute)启动实例
控制台配置流程
通过服务端SDK启动实例
通过友盟+服务端SDK启动实例
五、重点功能解读
猜你喜欢+相关推荐
在电商行业,智能推荐支持猜你喜欢、相关推荐这2种推荐服务类型。猜你喜欢主要应用于首页以及商品TAB页的商品瀑布流推荐,相关推荐主要应用于商品展示页、详情页的推荐。其中,种草社区可基于AIRec内容行业搭建。
实时推荐
实时交互是促进消费者沉浸式浏览的必备基础功能。智能推荐可实时学习消费者当前兴趣表达、变化,并更新在下一次生成的推荐结果中,从而实现实时的互动式推荐功能。
负反馈
推荐系统在与用户互动的过程中,有可能出现不符用户预期的推荐结果,而负反馈成为推荐与用户对话的重要入口。智能推荐支持单个商品维度、商品类目维度以及商品其他特征类维度的负反馈功能。
业务策略配置
可针对精品做人工加权,实时上下架,保证推荐质量。
可通过设置去重规则,保证在设置时间区间内,不重复给用户推荐同一商品或内容。
通过设置类目多样性规则,保证推荐的多样性,避免产品单一性。
多场景
场景作为个性化推荐的流量入口,在不同的页面/不同的用户群可进行差异化的定制。如,首页的推荐、频道页推荐、个人中心页、搜索空结果页、商品详情页、购物车页等等。推荐PLUS支持定制差异化的场景选品规则。
控制台配置规则
左侧业务定制->场景管理
A/B实验平台
流程如下
控制台配置规则
机器学习平台
100+算法组件、完整业务开发框架、拖拽式开发平台
推荐业务逻辑封装、算法模型开箱即用
可视化分析模型指标
支持离线、在线的模型部署方式
六、MaxCompute + 智能推荐学习阵地
MaxCompute学习阵地
SaaS 模式云数据仓库 MaxCompute 官网,海量学习资料,助您开启云数仓之旅!
智能推荐学习阵地
智能推荐(Artificial Intelligence Recommendation,简称AIRec)基于阿里巴巴领先的大数据和人工智能技术,结合在电商、内容、新闻、视频直播和社交等多个行业领域的积累,为全球企业及开发者提供个性化推荐服务。
基于 MaxCompute 的智能推荐解决方案的更多相关文章
- 数据算法 --hadoop/spark数据处理技巧 --(9.基于内容的电影推荐 10. 使用马尔科夫模型的智能邮件营销)
九.基于内容的电影推荐 在基于内容的推荐系统中,我们得到的关于内容的信息越多,算法就会越复杂(设计的变量更多),不过推荐也会更准确,更合理. 本次基于评分,提供一个3阶段的MR解决方案来实现电影推荐. ...
- 阿里云智能推荐AIRec产品介绍
一.智能推荐(AIRec)简介 AIRec背景介绍 智能推荐(简称AIRec)基于阿里巴巴集团领先的大数据和人工智能技术,结合阿里巴巴在电商.内容.新闻.视频直播和社交等多个行业领域的积累,为全球企业 ...
- #研发解决方案介绍#基于StatsD+Graphite的智能监控解决方案
郑昀 基于李丹和刘奎的文档 创建于2014/12/5 关键词:监控.dashboard.PHP.graphite.statsd.whisper.carbon.grafana.influxdb.Pyth ...
- 基于MaxCompute的媒体大数据开放平台建设
摘要:随着自媒体的发展,传统媒体面临着巨大的压力和挑战,新华智云运用大数据和人工智能技术,致力于为媒体行业赋能.通过媒体大数据开放平台,将媒体行业全网数据汇总起来,借助平台数据处理能力和算法能力,将有 ...
- 在windows下安装gulp —— 基于 Gulp 的前端集成解决方案(一)
相关连接导航 在windows下安装gulp —— 基于 Gulp 的前端集成解决方案(一) 执行 $Gulp 时发生了什么 —— 基于 Gulp 的前端集成解决方案(二) 常用 Gulp 插件汇总 ...
- Recommending music on Spotify with deep learning 采用深度学习算法为Spotify做基于内容的音乐推荐
本文参考http://blog.csdn.net/zdy0_2004/article/details/43896015译文以及原文file:///F:/%E6%9C%BA%E5%99%A8%E5%AD ...
- 基于MaxCompute的数仓数据质量管理
声明 本文中介绍的非功能性规范均为建议性规范,产品功能无强制,仅供指导. 参考文献 <大数据之路——阿里巴巴大数据实践>——阿里巴巴数据技术及产品部 著. 背景及目的 数据对一个企业来说已 ...
- 毕业设计——基于ZigBee的智能窗户控制系统的设计与实现
题目:基于物联网的智能窗户控制系统的设计与实现 应用场景:突降大雨,家里没有关窗而进水:家中燃气泄漏,不能及时通风,威胁人身安全,存在火灾的隐患:家中窗户没关,让坏人有机可乘.长时间呆在人多.封闭的空 ...
- 基于ESP32的智能家居管理系统的设计与实现
基于ESP32的智能家居管理系统的设计与实现 ESP32的智能家居管理系统访问链接: https://www.cnblogs.com/easyidea/p/13101165.html 一.需求分析 1 ...
- 构建一个基本的前端自动化开发环境 —— 基于 Gulp 的前端集成解决方案(四)
通过前面几节的准备工作,对于 npm / node / gulp 应该已经有了基本的认识,本节主要介绍如何构建一个基本的前端自动化开发环境. 下面将逐步构建一个可以自动编译 sass 文件.压缩 ja ...
随机推荐
- 3D渲染慢,直接买显卡还是用云渲染更划算?
3D渲染对建筑师和设计师来说并不陌生,3D渲染的过程中出现渲染卡顿.特殊材质难以渲染,或者本地配置不足.本地渲染资源不够时,常常会影响工作效率.本文比较了3D渲染时,为提高工作效率,买显卡还是用云渲染 ...
- KingbaseES V8R6 中unlogged表
前言 KingbaseESV8R6有一种表称为unlogged,在该表新建的索引也属于unlogged.和普通表的区别是,对该表进行DML操作时候不将该表的变更记录变更写入到wal文件中.在数据库异常 ...
- python打包Windows.exe程序(pyinstaller)
python打包Windows.exe程序(pyinstaller) 基础命令 pip install pyinstaller 使用pip命令来安装pyinstaller模块. -F: pyinsta ...
- 链表栈(LinkedListStack)
链式栈:就是一种操作受限的单向链表,每次入栈一个元素,向链表中添加一个节点,出栈一个元素,释放一个节点.因为栈具有"后进先出"的特点,如果每次在链表的尾部进行插入和删除,就要遍 ...
- HashSet 存对象的时候是如何判断是不是同一个对象,其中含有重写equals方法和hashcode方法 后续
一开始,set集合里面只存进一个对象, 存第二个对象时候,由于重写了hashcode方法,只要价格都是10就返回1,所以hashcode一样的话,再去进行equals方法判断,此时这个也重写了,thi ...
- 首届OpenHarmony竞赛训练营结营颁奖,75所高校学子助力建设开源生态
由OpenAtom OpenHarmony(以下简称"OpenHarmony")项目群工作委员会和OpenHarmony项目群技术指导委员会主办的首届OpenHarmony竞赛 ...
- 数仓调优实战:GUC参数调优
本文分享自华为云社区<GaussDB(DWS)性能调优系列实战篇七:十八般武艺之GUC参数调优>,作者: 黎明的风. 1. 前言 适用版本:[8.1.1及以上] GaussDB(DWS)性 ...
- Qt调用摄像头二,Pro版
本示例,为纯Qt调用摄像头,功能会比版本一要多一点:打开摄像头,设置参数,完整拍照,框选拍照,切换分辨率,旋转,水平镜像,垂直镜像,放大,缩小 上一个版本,使用的显示窗口直接显示出摄像头画面,所以可操 ...
- openGauss每日一练第四天
openGauss 每日一练第四天 本文出处:https://www.modb.pro/db/193083 学习地址 https://www.modb.pro/course/133 学习目标 学习 o ...
- keycloak~RequiredActionProvider的使用
使用场景 RequiredActionProvider,它是在认证过程中,需要当前登录的用户执行个性化的动作:当用户符合条件,就被执行RequiredActionProvider对作,当Require ...