利用Transformer模型提升产品检索效果
利用Transformer模型提升产品检索效果
当顾客点击产品搜索结果列表中的某个商品时,暗示该商品优于未点击项。传统"学习排序"模型通过比较点击/未点击结果的"成对比较"或"列表排序"方式利用这种隐式反馈。但这种方法存在缺乏绝对反馈的缺陷——例如当列表中无任何点击时,模型无法利用这一负面信号。
在KDD 2023会议上,我们提出了一种融合绝对反馈的新型学习排序方法RankFormer。该模型采用自然语言处理中流行的Transformer架构,能够:
- 通过分类令牌捕捉列表整体质量
- 利用注意力机制动态评估商品特征的上下文重要性
- 对零点击列表仍能进行有效学习
技术架构
模型输入包含商品特征(XI)和分类令牌(x[CLS])。Transformer编码器生成的特征表示(ZI和z[CLS])分别传递至两个评分头:
- 商品评分头(hs)预测单个商品相关性
- 列表评分头(hd)评估整体列表质量
训练过程采用双损失函数优化:
- 商品级损失(Ly)基于点击/购买标签
- 列表级损失(Lt)依据列表最高价值项
实验结果
在公开数据集测试中,梯度提升决策树(GBDT)仍保持优势。但在包含丰富特征的亚马逊内部搜索数据上,我们的模型实现全面超越:
- 准确率提升12%超过基线神经网络
- 首次在工业级数据集上超越GBDT模型
- 特别擅长处理零点击或全点击的特殊场景
研究表明,当数据集具备以下特征时,神经排序器才能展现最佳性能:
- 海量训练样本
- 高维特征空间
- 复杂特征分布
应用价值
该方法已应用于亚马逊商品搜索系统,通过更精准地解读用户点击行为,显著提升转化率。我们特别关注以下场景的优化:
- 无点击列表的负样本学习
- 全点击列表的质量判别
- 跨价格区间的上下文感知
未来将继续深化客户反馈信号的研究,包括:
- 多模态检索中的Transformer应用
- 长尾查询的冷启动优化
- 购买与浏览行为的差异建模
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)
公众号二维码
![]()
利用Transformer模型提升产品检索效果的更多相关文章
- Transformer模型总结
Transformer改进了RNN最被人诟病的训练慢的缺点,利用self-attention机制实现快速并行. 它是由编码组件.解码组件和它们之间的连接组成. 编码组件部分由一堆编码器(6个 enco ...
- 文本分类实战(八)—— Transformer模型
1 大纲概述 文本分类这个系列将会有十篇左右,包括基于word2vec预训练的文本分类,与及基于最新的预训练模型(ELMo,BERT等)的文本分类.总共有以下系列: word2vec预训练词向量 te ...
- NLP与深度学习(四)Transformer模型
1. Transformer模型 在Attention机制被提出后的第3年,2017年又有一篇影响力巨大的论文由Google提出,它就是著名的Attention Is All You Need[1]. ...
- RealFormer: 残差式 Attention 层的Transformer 模型
原创作者 | 疯狂的Max 01 背景及动机 Transformer是目前NLP预训练模型的基础模型框架,对Transformer模型结构的改进是当前NLP领域主流的研究方向. Transformer ...
- 外媒速递:十大最佳心理学概念助你提升Web设计效果
外媒速递是核子可乐精选的近日国外媒体的精彩文章推荐,希望大家喜欢! 本期给大家推荐的是帮助你提升Web设计效果的十大最佳心理学概念.改善企业云环境协作效率的九款卓越工具.选择移动应用开发工具时要考虑的 ...
- 利用GBDT模型构造新特征具体方法
利用GBDT模型构造新特征具体方法 数据挖掘入门与实战 公众号: datadw 实际问题中,可直接用于机器学**模型的特征往往并不多.能否从"混乱"的原始log中挖掘到有用的 ...
- 【高德API】如何利用MapKit开发全英文检索的iOS地图
原文:[高德API]如何利用MapKit开发全英文检索的iOS地图 制作全英文地图的展示并不困难,但是要制作全英文的数据检索列表,全英文的信息窗口,你就没办法了吧.告诉你,我有妙招!使用iOS自带的M ...
- 详解Transformer模型(Atention is all you need)
1 概述 在介绍Transformer模型之前,先来回顾Encoder-Decoder中的Attention.其实质上就是Encoder中隐层输出的加权和,公式如下: 将Attention机制从Enc ...
- 作业六:小学生四则运算之NABCD模型与产品Backlog。
NABCD模型与产品Backlog NABCD模型 ) N (Need 需求) 方便了老师和学生,使他们可以想要的时候随时可以得到,省时省力,快速出题,马上得到答案. ) A (Approach 做法 ...
- 再谈Cognos利用FM模型来做同比环比
很早之前已经讲过 <Cognos利用DMR模型开发同比环比>这篇文章里说的是不利用过滤器,而是采用 except (lastPeriods (-9000,[订单数据分析].[日期维度].[ ...
随机推荐
- WPF中Resx文件中添加Byte[]
参考:https://learn.microsoft.com/zh-tw/dotnet/api/system.resources.resxresourcewriter.generate?view=wi ...
- RocketMQ源码详解(消息存储、Consumer)
消息存储 消息存储核心类 private final MessageStoreConfig messageStoreConfig; //消息配置属性 private final CommitLog c ...
- Spring Boot2.5 集成数据库连接池 HikariCP
目录 §工程环境 §数据库连接池介绍 数据库连接池工作原理剖析 §Java常见数据库连接池性能比较 §数据库连接池选型 Druid vs HikariCP性能对比 §HikariCP为什么这么快 §数 ...
- 50道常见Redis面试题,干货汇总
哪些大厂在使用Redis?github.twitter.微博.Stack Overflow.百度.阿里巴巴.美团和搜狐等都在用,所以今天小编当作搬运工,为大家整理了一份Redis面试题,合计50个 ...
- 二叉排序树BST及CRUD操作
摘要 构造一颗二叉排序树(也叫二叉搜索树,BST,Binary Search Tree)十分简单.一般来讲,大于根节点的放在根节点的右子树上,小于根节点的放在根节点的左子树上(如果等于根节点,则可视情 ...
- 特殊恢复:最简单的BBED修改ASM的数据块的方法
我们的文章会在微信公众号Oracle恢复实录和博客网站同步更新 ,欢迎关注收藏,也欢迎大家转载,但是请在文章开始地方标注文章出处,谢谢! 由于博客中有大量代码,通过页面浏览效果更佳. 前天在客户现场遇 ...
- BeatifulSoup
BeatifulSoup (1)介绍 Beautiful Soup是Python库,用于解析HTML和XML文档.它提供简单而强大的工具,帮助用户从网页中提取数据.通过查找元素.遍历文档树和处理编码问 ...
- [CF878E]Numbers on the blackboard
E - Numbers on the blackboard 最后的答案肯定为\(\sum_{l\leq i\leq r} 2^{p_i}\times a_i\) 然后这个\(p\)满足以下限制: \( ...
- vue脚手架搭建,出现无法将“vue”项识别....
前言: 肯定有很多小伙伴和我一样,想在各种开发工具的终端运行命令来新建vue-cli脚手架,可是vue命令就是识别不到,然后又很烦,不妨看看我这个解决方案吧!!! 遇见问题: vue : 无法将&qu ...
- Sql Server日常运维!
内容来源于网络,如有侵权,请联系我删除. 一.基础命令 查看当前数据库的版本 SELECT @@VERSION; 查看服务器部分特殊信息 select SERVERPROPERTY(N'edition ...
