利用Transformer模型提升产品检索效果
利用Transformer模型提升产品检索效果
当顾客点击产品搜索结果列表中的某个商品时,暗示该商品优于未点击项。传统"学习排序"模型通过比较点击/未点击结果的"成对比较"或"列表排序"方式利用这种隐式反馈。但这种方法存在缺乏绝对反馈的缺陷——例如当列表中无任何点击时,模型无法利用这一负面信号。
在KDD 2023会议上,我们提出了一种融合绝对反馈的新型学习排序方法RankFormer。该模型采用自然语言处理中流行的Transformer架构,能够:
- 通过分类令牌捕捉列表整体质量
- 利用注意力机制动态评估商品特征的上下文重要性
- 对零点击列表仍能进行有效学习
技术架构
模型输入包含商品特征(XI)和分类令牌(x[CLS])。Transformer编码器生成的特征表示(ZI和z[CLS])分别传递至两个评分头:
- 商品评分头(hs)预测单个商品相关性
- 列表评分头(hd)评估整体列表质量
训练过程采用双损失函数优化:
- 商品级损失(Ly)基于点击/购买标签
- 列表级损失(Lt)依据列表最高价值项
实验结果
在公开数据集测试中,梯度提升决策树(GBDT)仍保持优势。但在包含丰富特征的亚马逊内部搜索数据上,我们的模型实现全面超越:
- 准确率提升12%超过基线神经网络
- 首次在工业级数据集上超越GBDT模型
- 特别擅长处理零点击或全点击的特殊场景
研究表明,当数据集具备以下特征时,神经排序器才能展现最佳性能:
- 海量训练样本
- 高维特征空间
- 复杂特征分布
应用价值
该方法已应用于亚马逊商品搜索系统,通过更精准地解读用户点击行为,显著提升转化率。我们特别关注以下场景的优化:
- 无点击列表的负样本学习
- 全点击列表的质量判别
- 跨价格区间的上下文感知
未来将继续深化客户反馈信号的研究,包括:
- 多模态检索中的Transformer应用
- 长尾查询的冷启动优化
- 购买与浏览行为的差异建模
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)
公众号二维码
![]()
利用Transformer模型提升产品检索效果的更多相关文章
- Transformer模型总结
Transformer改进了RNN最被人诟病的训练慢的缺点,利用self-attention机制实现快速并行. 它是由编码组件.解码组件和它们之间的连接组成. 编码组件部分由一堆编码器(6个 enco ...
- 文本分类实战(八)—— Transformer模型
1 大纲概述 文本分类这个系列将会有十篇左右,包括基于word2vec预训练的文本分类,与及基于最新的预训练模型(ELMo,BERT等)的文本分类.总共有以下系列: word2vec预训练词向量 te ...
- NLP与深度学习(四)Transformer模型
1. Transformer模型 在Attention机制被提出后的第3年,2017年又有一篇影响力巨大的论文由Google提出,它就是著名的Attention Is All You Need[1]. ...
- RealFormer: 残差式 Attention 层的Transformer 模型
原创作者 | 疯狂的Max 01 背景及动机 Transformer是目前NLP预训练模型的基础模型框架,对Transformer模型结构的改进是当前NLP领域主流的研究方向. Transformer ...
- 外媒速递:十大最佳心理学概念助你提升Web设计效果
外媒速递是核子可乐精选的近日国外媒体的精彩文章推荐,希望大家喜欢! 本期给大家推荐的是帮助你提升Web设计效果的十大最佳心理学概念.改善企业云环境协作效率的九款卓越工具.选择移动应用开发工具时要考虑的 ...
- 利用GBDT模型构造新特征具体方法
利用GBDT模型构造新特征具体方法 数据挖掘入门与实战 公众号: datadw 实际问题中,可直接用于机器学**模型的特征往往并不多.能否从"混乱"的原始log中挖掘到有用的 ...
- 【高德API】如何利用MapKit开发全英文检索的iOS地图
原文:[高德API]如何利用MapKit开发全英文检索的iOS地图 制作全英文地图的展示并不困难,但是要制作全英文的数据检索列表,全英文的信息窗口,你就没办法了吧.告诉你,我有妙招!使用iOS自带的M ...
- 详解Transformer模型(Atention is all you need)
1 概述 在介绍Transformer模型之前,先来回顾Encoder-Decoder中的Attention.其实质上就是Encoder中隐层输出的加权和,公式如下: 将Attention机制从Enc ...
- 作业六:小学生四则运算之NABCD模型与产品Backlog。
NABCD模型与产品Backlog NABCD模型 ) N (Need 需求) 方便了老师和学生,使他们可以想要的时候随时可以得到,省时省力,快速出题,马上得到答案. ) A (Approach 做法 ...
- 再谈Cognos利用FM模型来做同比环比
很早之前已经讲过 <Cognos利用DMR模型开发同比环比>这篇文章里说的是不利用过滤器,而是采用 except (lastPeriods (-9000,[订单数据分析].[日期维度].[ ...
随机推荐
- 一文搞懂 GPU 共享方案: NVIDIA Time Slicing
本文主要分享 GPU 共享方案,包括如何安装.配置以及使用,最后通过分析源码了 TImeSlicing 的具体实现.通过配置 TImeSlicing 可以实现 Pod 共享一块物理 GPU,以提升资源 ...
- 知识蒸馏 -- 定位蒸馏LD
定位蒸馏 定位蒸馏:Localization Distillation,简称LD 论文地址: Localization Distillation for Dense Object Detection ...
- C#之字符串和正则表达式
在C#中string关键字的映射实际上是指向.NET基类System.String.System.String是一个功能非常强大且用途非常广泛的基类,但它不是.NET库中唯一与字符串相关的类. Sys ...
- dify+MCP多应用,构建灵活的AI应用生态系统
一.概述 前面几篇文章写很多MCP应用,基本上一个dify工作流使用一个MCP应用. 那么一个dify工作流,同时使用多个MCP应用,是否可以呢?答案是可以的. 先来看一下效果图 说明: 这里使用了问 ...
- React-Native开发鸿蒙NEXT-蓝牙信标读取
.markdown-body { line-height: 1.75; font-weight: 400; font-size: 16px; overflow-x: hidden; color: rg ...
- Django Web应用开发实战第四章
一.设置响应方式 网站的运行原理遵从HTTP协议,分为HTTP请求和HTTP响应.HTTP响应也称为状态码,分为5种状态:消息.成功.重定向.请求错误和服务器错误.若以使用频率划分,HTTP状态码分为 ...
- Android Studio 虚拟机一直黑屏原因及解决办法
虚拟机一直黑屏原因: android模拟器在创建时,一般默认设置为热启动,所以每次关闭模拟器时,会提示保存当前运行界面状态,若选择取消,则下一次启动会以最近一次保存的状态启动显示.如果某次关闭时保存的 ...
- 数据库的DML与DQL语句
1: DML语句 insert into values 1 insert into 表 values(值1,值2,值n); 2 insert into 表(字段1,字段2,字段n) values( ...
- gyp verb check python checking for Python executable "python2" in the PATH - noda-sass安装的艰难之路。
第一次安装出现如下错误: gyp verb check python checking for Python executable "python2" in the PATH gy ...
- html背景图片居中
* { margin: 0; padding: 0 } .box { width: 100%; height: 1728px; border: 1px solid rgba(0, 128, 0, 1) ...
