Pinterest凭什么拥有那么多用户:机器学习是答案
目前,Pinterest月平均活跃用户量达到1亿,这家以图片为主的公司是如何留住用户并盈利的呢?Pinterest的主要目标是向用户推荐相关的图片或内容,推荐的内容足够精确才能提高用户黏性。近期,《快公司》发文表示,Pinterest 正从机器学习切入,向用户推荐更精准的内容,并拓展新的在线业务。
在Pinterest 平台上,人们可以搜索、下载全网范围内的图片和文章,找到与自己喜好契合的内容自然能够增加他们的用户忠诚度。Pinterest 推荐的相关内容提高了30% 的参与度和 25% 的购买度。这些精准推荐都是依托尖端的数据驱动技术和大量实验的结果。
用户可以通过Pinterest 台的虚拟钉板收藏全网范围的在线商品、帖子、图片,就是说这个平台完全是基于用户兴趣偏好建立的。Pinterest 无需像其他社交网络一样,根据用户的点击模式或者特定页面停留时间来猜测其兴趣。这也意味着它的算法能推测到 750亿个收藏的内容数据库中相互关联的信息,因为相似的内容更容易被固定在同一个钉板上,从而轻易识别用户偏好。
Pinterest 可以说是一个社交图,由数十亿相互联系的用户、被不同用户收藏的同一个项目、收藏类似项目的虚拟钉板三部分构成,这样的组成结构同时决定了其用户量将会不断增长。
Pinterest 的高级发现科学工程师 Mohammad Shahangian 说,“我们通过数百次的实验对我们的算法做出微小修正,确定发现问题的方向“。简单地根据用户关注人群决定为其推荐内容的模型是不理想的,假设一个用户正在策划自己的婚礼,她的虚拟钉板添加了很多礼服款式的图片,而她的关注者并不一定需要这类服饰,为他们推荐礼服可能造成无意义的重复。而 Pinterest 所有的数据可以让 Pinterest 的用户获得 。
Shahangian 表示,“ 如果你的虚拟钉板收藏了一个厨房水槽的链接,我们是否需要向你推送一万多款厨房水槽,或启发你怎么能整体设计你的厨房呢?” 为了在这样的情况下做出正确判断,该公司的工程师们测试了多种机器学习算法,来研究不同公式如何执行对相似或不同的测试集的收藏,以及他们最终如何影响现实世界的用户的参与度。
然而,事实上,Pinterest 的技术研发缺乏实例测试,研究员无法通过给某个特定的用户付钱来测试他是否会接受一组新的推荐。虽然后面的测试过程无法进行,目前的算法已经基本可以实现通过用户的收藏内容来判定此人是否愿意担任人工测试者。Pintesrest 从自身的一路发展中收获了不少启发,个性化一直是提高用户参与度最大的影响因素之一。与此同时,该公司也一直致力于提高视觉搜索功能,帮助用户获取与目标图片相似的内容。 今年早些时候,Pinterest 的工程师们与来自伯克利加利福尼亚大学视觉与学习中心的研究人员一起开发了可自动检测图像内容的深度学习技术。
Pinterest 的高级视觉搜索工程师 Dmitry Kislyuk 说,当我们试图去分辩图片内容是一只猫还是一条狗时,这并不算一个分类任务,关键在于保证实时性的前提下寻找图像之间的视觉相似性。可视化搜索工具尤其适合收集家居装饰和时尚类商品的信息。未来,公司希望提高将目标内容映射到其类别的能力,举例来讲,当用户想找同一种食材的新食谱时,就不要只提供这种食材的类似照片。
高级视觉搜索工程师 Andrew Zhai 指出, “我认为我们的模型可以更语义化,有效地将深度学习应用于映射更加概念化的图像。与此同时,Pinterest 的的工程师们正在专注于完善目标的检测和搜索开发一款应用程序,让智能手机用户通过给现实世界中需求物品拍照,上传到平台后,得到相关的推荐。
Pinterest凭什么拥有那么多用户:机器学习是答案的更多相关文章
- 【机器学习】Google机器学习工程的43条最佳实践
https://blog.csdn.net/ChenVast/article/details/81449509 本文档旨在帮助那些掌握机器学习基础知识的人从Google机器学习的最佳实践中获益.它提供 ...
- 7个最好的Java机器学习开发库
摘要:现如今,拥有深度学习和机器学习领域的技术是科技界的趋势之一,并且企业则希望雇佣一些拥有良好的机器学习知识背景的程序开发工程师.本文将介绍一些目前流行的.强大的基于Java的机器学习库,希望给大家 ...
- 机器学习基石(台湾大学 林轩田),Lecture 1: The Learning Problem
课程的讲授从logo出发,logo由四个图案拼接而成,两个大的和两个小的.比较小的两个下一次课程就可能会解释到它们的意思,两个大的可能到课程后期才会解释到它们的意思(提示:红色代表使用机器学习危险,蓝 ...
- WindowsError的错误代码详解
0操作成功完成. 1功能错误. 2系统找不到指定的文件. 3系统找不到指定的路径. 4系统无法打开文件. 5拒绝访问. 6句柄无效. 7存储控制块被损坏. 8存储空间不足,无法处理此命令. 9存储控制 ...
- GetLastError()函数返回值及含义
GetLastError返回的值通过在api函数中调用SetLastError或SetLastErrorEx设置.函数并无必要设置上一次错误信息,所以即使一次GetLastError调用返回的是零值, ...
- GetLastError返回值的含义
[0]-操作成功完成. [1]-功能错误. [2]-系统找不到指定的文件. [3]-系统找不到指定的路径. [4]-系统无法打开文件. [5]-拒绝访问. [6]-句柄无效. [7]-存储控制块被损坏 ...
- 现代工程仿真CAE技术介绍
随着现代科学技术的发展,人们正在不断建造更为快速的交通工具.更大规模的建筑物.更大跨度的桥梁.更大功率的发电机组和更为精密的机械设备.这一切都要求工程师在设计阶段就能精确地预测出产品和工程的技术性能, ...
- [python]WindowsError的错误代码详解
转自:http://www.aichengxu.com/view/46906 WindowsError的错误代码详解 0操作成功完成. 1功能错误. 2系统找不到指定的文件. 3系统找不到指定的路径. ...
- Windows Error Code(windows错误代码详解)
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足,无法处理此 ...
随机推荐
- 【JavaScript】快速入门
摘抄地址快速入门 No1: JavaScript严格区分大小写 No2: JavaScript不区分整数和浮点数,统一用Number表示 NaN表示Not a Number,当无法计算结果时用NaN表 ...
- datetime.timedelta类
datetime.timedelta对象代表两个时间之间的时间差,两个date或datetime对象相减就可以返回一个timedelta对象. Python中datetime模块中的timedelta ...
- ubantu16.04安装sougou输入法
安装搜狗拼音输入法下载安装包:http://pinyin.sogou.com/linux/?r=pinyin如果直接安装不了,则按如下方法进行安装:sudo dpkg -i sogoupinyin_ ...
- PHP foreach 循环
foreach (array_expression as $value) statementforeach (array_expression as $key => $value) ...
- 在cikuapi.com上抓取相关词
最近用到文本相关性计算,要在开放域语料上操作,找了好久没找到好的方法,后来看到了清华的梁斌老师建的cikuapi,上面能查询一些相关词,自己写代码爬的时候出现中文解码问题,遂到Github上找了下相关 ...
- 2017-9-8-Linux下VNC server开启&图形界面显示
之前有一个写树莓派3B怎么只使用网线VNC远程的blog,里面写的比较粗糙(其实是很长时间没搞我也忘了怎么装的了,照着原来的看一遍应该能想起来),所以重新来在新的环境下搭建一下VNC server. ...
- python基础一 ------如何获取多个字典相同的键
需求: 足球赛第一场进去统计 {"A":3,"B":2,"C":1}足球赛第二场进去统计 {"A":3," ...
- vim小技巧2
yyp:复制当前行到下一行 cw:改变当前字符串 xp:交换当前字符和右边字符
- token和盐
// 盐,加密后密码获取 Map<String, String> map = new HashMap<String, String>(); map.put(&quo ...
- redis:aof恢复与rdb服务器间迁移
1. aof恢复与rdb服务器间迁移: 1.1. Aof恢复: 如果不小心执行了flushdb或flushall了怎么办? (1)立马执行命令:shutdown nosave 关闭服务器,为了防止其他 ...