（论文笔记）Learning Deep Structured Semantic Models for Web Search using Clickthrough Data

利用点击数据学习web搜索的深度学习模型

【总结】

该模型可以得到query和item的低维度向量表示，也可以得到二者的余弦语义相似度。

学习过程是通过最大化后验概率的极大似然估计得到的参数。

【模型解读】

A.输入：

1）x是词表长度的向量，维度大，一般是one-hot太大了，所以需要降；

2）Q为query， D为doc，包含正样本（曝光点击的doc），负样本4个（曝光但是未点击的doc），类似word2vec中的负采样；

B.中间过程：

1）经过word hashing ，将x的维度降下来（ngram方法）；

2）多层线性层+tanh激活函数l1层 l2层；

C.输出：

1）得到的y为低纬度的稠密语义表示向量，128维；

2）query分别和正/负doc计算余弦相似度R；

3）得到余弦相似度后加上平滑因子计算softmax：

3）学习目标就是最大化query和点击的正样本的相关性后验概率的极大似然估计：

【优缺点】

论文提的优缺点：

️1.采用word hashing ，解决了lsa等用奇异值分解造成的维度高的问题，因为对于英文来说ngram有限

️2.ngram可以有效表示新词；（？）

️3.有监督的学习语义表示，不是直接把无监督模型得到的词向量在输入端作为输入了。

️4.免人工特征

1.word hashing可能有冲突（冲突不大）；

2.词袋模型损失了上下文信息；

3.在排序中，搜索引擎的排序由多种因素决定，由于用户点击时doc的排名越靠前，点击的概率就越大，如果仅仅用点击来判断是否为正负样本，噪声比较大；

个人认为的优缺点：

1.对中文来说ngram的方法略落后，而且会忽略掉一些专有名词的含义，远距离的文字信息会丢失，全局信息；

【参考链接】

更多改进的model参考：+lstm or dnn️cnn

https://blog.csdn.net/xixiaoyaoww/article/details/105683329?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_title~default-0.no_search_link&spm=1001.2101.3001.4242.1&utm_relevant_index=3

（论文笔记）Learning Deep Structured Semantic Models for Web Search using Clickthrough Data的更多相关文章

DSSM(DEEP STRUCTURED SEMANTIC MODELS)
Huang, Po-Sen, et al. "Learning deep structured semantic models for web search using clickthrou ...
论文笔记——A Deep Neural Network Compression Pipeline: Pruning, Quantization, Huffman Encoding
论文<A Deep Neural Network Compression Pipeline: Pruning, Quantization, Huffman Encoding> Prunin ...
论文笔记：Deep feature learning with relative distance comparison for person re-identification
这篇论文是要解决 person re-identification 的问题.所谓 person re-identification,指的是在不同的场景下识别同一个人(如下图所示).这里的难点是,由于不 ...
论文笔记：Deep Residual Learning
之前提到,深度神经网络在训练中容易遇到梯度消失/爆炸的问题,这个问题产生的根源详见之前的读书笔记.在 Batch Normalization 中,我们将输入数据由激活函数的收敛区调整到梯度较大的区域, ...
论文笔记：Deep Attentive Tracking via Reciprocative Learning
Deep Attentive Tracking via Reciprocative Learning NIPS18_tracking Type:Tracking-By-Detection 本篇论文地主 ...
论文笔记 — L2-Net: Deep Learning of Discriminative Patch Descriptor in Euclidean Space
论文: 本文主要贡献: 1.提出了一种新的采样策略,使网络在少数的epoch迭代中,接触百万量级的训练样本: 2.基于局部图像块匹配问题,强调度量描述子的相对距离: 3.在中间特征图上加入额外的监督: ...
论文笔记之：Instance-aware Semantic Segmentation via Multi-task Network Cascades
Instance-aware Semantic Segmentation via Multi-task Network Cascades Jifeng Dai Kaiming He Jian Sun ...
论文笔记之： Bilinear CNN Models for Fine-grained Visual Recognition
Bilinear CNN Models for Fine-grained Visual Recognition CVPR 2015 本文提出了一种双线性模型( bilinear models),一种识 ...
论文笔记：A Structured Self-Attentive Sentence Embedding
A Structured Self-Attentive Sentence Embedding ICLR 2017 2018-08-19 14:07:29 Paper:https://arxiv.org ...
论文笔记(4)-Deep Boltzmann Machines
Deep Boltzmann Machines是hinton的学生写的,是在RBM基础上新提出的模型,首先看一下RBM与BM的区别很明显可以看出BM是在隐含层各个节点以及输入层各个节点都是相互关联的 ...

随机推荐

数字成像系统—ISP
ISP是什么Image Signal Processor,图像信号处理器.作用:处理Image Sensor(图像传感器)的输出数据.对前端图像传感器输出的信号做后期处理.如AWB等.DSP是什么Di ...
MySql密码忘记怎么办？
第一步服务 net stop mysql 第二步,执行指令 mysqld --console --skip-grant-tables --user=mysql --shared-memory 第三步, ...
Salesforce Connect 连接两个不同的Org（实际设置方法）
利用Salesforce的标准功能:Salesforce Connect,可以轻松的将两个组织(Org)连接起来.实现Object的共享(包括参照和编辑). 要求: ①两个组织必须是开发者Edtion ...
浅谈JS中的element.style和window.getComputedStyle()的区别
MDN对于element.style的解释被高光的句子中的inline style属性是指css内联样式,即元素的style属性的属性值总结一下,element.style只能获取到元素的styl ...
git clone 指定分支/指定commit
方法一下载整个branch及历史记录,文件较大,耗时 git clone --depth 1 [git-url] -b [branch-name] git reset --hard [commit- ...
Visual Studio 2022(VS2022) 产品密钥
Visual Studio 2022(VS2022) 激活码: Pro: TD244-P4NB7-YQ6XK-Y8MMM-YWV2JEnterprise: VHF9H-NXBBB-638P6-6JHC ...
SCI论文写作技巧-introduction和related works
introduction怎么写 a)背景介绍,现状(介绍别人研究),存在问题,怎样解决,我的做法,有何亮点 b)研究背景和重要性.引出该领域科研空白.点题-指出本文的研究课题.概述文章的核心方法论和主 ...
淘淘商城项目技术点-8：vsftpd
FTP(文件传输协议)全称是:Very Secure FTP Server. Vsftpd是linux类操作系统上运行的ftp服务器软件. vsftp提供三种登陆方式:1.匿名登录 2.本地用户 ...
通过ASP生成html纯静态页面的简单示例
本站收录这篇文章通过ASP生成html纯静态页面的简单示例,详细解说文章中相关静态 asp 技术与知识,欢迎能给大家一些在这方面的支持和帮助!下面是详细内容: 原理:通过浏览器传送变量,如 http: ...
Lecture 2. Fundamental Concepts and ISA - Carnegie Mellon - Computer Architecture 2015 - Onur Mutlu
并不只有冯诺依曼模型,按照控制流顺序执行指令还有 data flow 模型,按照数据流顺序执行指令冯诺依曼模型和数据流模型的编程语言的一个对比 Control-driven 编程模型和 data- ...

（论文笔记）Learning Deep Structured Semantic Models for Web Search using Clickthrough Data

（论文笔记）Learning Deep Structured Semantic Models for Web Search using Clickthrough Data的更多相关文章

随机推荐

热门专题