搜索下拉提示(Query
Auto Completion,简称QAC)如今差点儿是每一个搜索引擎必备的基本功能,作用是在用户在搜索框输入查询词的过程中,给用户展示一系列搜索查询query供用户选择,能够方便用户输入、缩短用户搜索时间、提高用户搜索体验。在这方面的研究已经有非常多,如基于上下文、基于时间序列等预測query的热度、个性化排序等,但关于用户怎样与搜索下拉提示(下文简称QAC)交互的研究眼下还是一个空白。

微软的Katja Hofmann前几天(11.3-11.7)刚刚填补了这一空白。她在CIKM
2014会议上发表了一篇paper——An Eye-tracking Study of User
Interactions with Query Auto Completion。研究了用户与QAC的交互过程。通过眼睛定位技术,记录和分析了用户与QAC的交互,得出一系列有趣的结论。本文在阅读论文的基础上,简明扼要的提炼了论文的结论。总结了一点自己的启示。


实用的思路和结论
 
      1. 将用户的QAC交互过程分为:query examination、query formulation、task completion3个过程。query examination为用户查看QAC的过程。该过程中用户注意到有QAC的提示,并将注意力集中到QAC的结果。query formulation是用户使用QAC的过程。依据QAC提供的结果选择的过程。

task completion是用户选择了QAC的结果后在搜索结果页面的行为。记录用户的搜索任务完毕情况。


 
      2. 针对每一个过程设计了一系列跟QAC相关的统计指标,以反映QAC的质量,详细指标例如以下:
 
      TFF
记录用户敲键盘到将注意力转移到QAC下拉列表的时间间隔,这个时间跟QAC下拉结果的排序没有关系。

 
      CFT
记录用户注意力集中在QAC下拉列表上所累计停留的时间,这个时间跟QAC下拉结果的排序有关,排序结果质量越好,越跟用户搜索意图相关的query越靠前,用户停留的时间越短。
 
      UQ
表示用户提交的单一query数,描写叙述的是一个用query构造的情况。假设QAC质量不好,用户非常难构造一个比較恰当的query。则在没法构造query的情况下就会放弃继续搜索。(笔者见解:也有可能是质量好,一次query搜索就找到须要的结果)
 
      UR
表示用户打开一个搜索结果页面就完毕搜索的数量,描写叙述搜索结果质量。打开越少,说明搜索结果质量越高,越早完毕搜索任务。TFCTCT与其类似。仅仅是从其它角度统计。

 
      3. QAC有非常强的position bias,排名越靠前的query被关注和点击的概率越大,例如以下两图:
  
        右图横轴表示query在QAC的排序位置,左边纵轴表示用户的注意力停留时间,右边纵轴表示点击的概率。每一个位置分别都有两个不同的实验,对照QAC有排序和随机序的情况。
        从图能够看出,无论QAC结果是否有排序,top几个位置的query获得的注意力是最高的,被点击的概率也明显高于其它位置的query。这说明top几的query被关注到的概率最大。与query的是否排过序无关,仅仅要在top的位置,肯定会被关注到,有非常强的position
bias,也側面说明QAC的排序终于决定了哪个query被作为查询query。
 
      但也能够观察到,排序过的结果被点击的概率比随机排序的大一些,由于排序会把更符合用户搜索意图的query排到前面。

        4. 虽然不管QAC的结果排序与否,排序位置靠前的query获得的注意力都一样大,但搜索结果质量是不同的。通过实验记录的UQ、UR、TFC、TCT数据表明。高质量query的搜索结果比較好。能够让用户更快找到须要的内容。结束搜索任务。

因此须要把更符合用户意图的query排到更靠前的位置,添加这类query的曝光有助于带来更好的搜索结果质量(电商类的有助于提高成交转化率)


        5. 总结了用户使用QAC的3种pattern:a.
依赖QAC搜索的用户。边输边看QAC的结果;b. 偶尔使用QAC的用户;c. 从不使用QAC的用户,这类用户一般在输入的过程中注意力是集中在键盘,不看屏幕。属于电脑使用不熟练的用户,比例较小。

        6. 总结了用户使用QAC的2个目的:a.
拼写提示或拼写纠错;b. query补全

        7. 实验证明MRR这种评价QAC质量的指标的合理性,该指标基于这种如果。排序越靠后的结果被用户注意到的可能性越小,结果就是排序越靠后的结果被点击的可能性越小,从3的实验结果能够得到验证。


启示
        1. QAC的排序非常重要。直接影响搜索结果的质量,对于电商类搜索,会影响终于的转化率。因此能够在排序中引入搜索结果页质量相关的特征,如ctr、成交情况、NDCG等。
        2. 用户使用QAC的一个功能是拼写提示。因此能够增加拼写纠错的提示功能,不不过简单的prefix匹配。

參考

转载请注明出处。本文转自http://blog.csdn.net/huagong_adu/article/details/40951409
本博客搬迁至:http://ralphadu.com/

版权声明:本文博主原创文章,博客,未经同意不得转载。

在最完整的搜索提示降史上的用户交互的研究——阅读《An Eye-tracking Study of User Interactions with Query Auto Completion》的更多相关文章

  1. [Git] 写文章 史上最全文献检索、阅读及管理攻略

    copy from  : https://zhuanlan.zhihu.com/p/30605683 一.查文献 首先,我认为需要常备几个体量大.文献全的数据库,有针对性找哦!下面列出了一些适合所有专 ...

  2. 高德地图搜索提示获取信息回传activity刷新ui(二)

    应用场景: 在主activity中点击进入到另一个activity搜索提示,获取经纬度,点确定返回到主activity,虽然说需求很奇葩,但是遇到了没办法.. 主要包含两部分,搜索提示+activit ...

  3. lucene的suggest(搜索提示功能的实现)

    1.首先引入依赖 <!-- https://mvnrepository.com/artifact/org.apache.lucene/lucene-suggest --> <!-- ...

  4. C# WinForm 技巧:COMBOBOX搜索提示

    comboBox和textBox支持内置的搜索提示功能, 在form的InitializeComponent()中添加如下语句:   this.comboBox1.AutoCompleteCustom ...

  5. Android--多选自动搜索提示

    一. 效果图 常见效果,在搜素提示选中之后可以继续搜索添加,选中的词条用特殊字符分开 二. 布局代码 <MultiAutoCompleteTextView android:id="@+ ...

  6. 讨论asp.net通过机器cookie仿百度(google)实现搜索input搜索提示弹出框自己主动

    为实现自己主动弹出通过用户输入关键词相关的搜索结果,在这里,我举两个解决方案,对于两个不同的方案. 常用的方法是建立一个用户数据库中查找关系表.然后输入用户搜索框keyword异步调用数据表中的相关数 ...

  7. Android AutoCompleteTextView控件实现类似百度搜索提示,限制输入数字长度

    Android AutoCompleteTextView 控件实现类似被搜索提示,效果如下 1.首先贴出布局代码 activity_main.xml: <?xml version="1 ...

  8. 浅谈asp.net通过本机cookie仿百度(google)实现搜索input框自己主动弹出搜索提示

    对于通过用户输入关键词实现自己主动弹出相关搜索结果,这里本人给两种解决方式,用于两种不同的情形. 常见方法是在数据库里建一个用户搜索关系表,然后通过用户搜索框输入的keyword异步调用数据表中的相关 ...

  9. 史上最完整promise源码手写实现

    史上最完整的promise源码实现,哈哈,之所以用这个标题,是因为开始用的标题<手写promise源码>不被收录 promise自我介绍 promise : "君子一诺千金,承诺 ...

随机推荐

  1. Max Sum (hdu 1003 简单DP水过)

    Max Sum Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others) Total Su ...

  2. cocos2d-x 旅程開始--(实现瓦片地图中的碰撞检測)

    转眼隔了一天了,昨天搞了整整一下午加一晚上,楞是没搞定小坦克跟砖头的碰撞检測,带着个问题睡觉甚是难受啊!还好今天弄成功了.只是感觉程序不怎么稳定啊.并且发现自己写的东西让我重写一遍的话我肯定写不出来. ...

  3. 斯坦福ML公开课笔记14——主成分分析

    上一篇笔记中,介绍了因子分析模型,因子分析模型使用d维子空间的隐含变量z来拟合训练数据,所以实际上因子分析模型是一种数据降维的方法,它基于一个概率模型,使用EM算法来预计參数. 本篇主要介绍PCA(P ...

  4. PSU 离11.2.0.3.0 -&gt; 11.2.0.3.11 如果解决冲突的整个

    Oracle rdbms 扑灭psu离11.2.0.3.0升级到11.2.0.3.11 参考patch :18522512 停止应用,停止听音乐并DB,将db的oracle_home在下面OPatch ...

  5. Ubuntu12.04下载Repo

    操作系统:Ubuntu12.04LTS 64bit "#"号后面表示凝视内容 $cd ~ #进入下载文件夹 $mkdir bin #创建bin文件夹用于存储Repo脚本 $PATH ...

  6. 特里-HDOJ-1671

    Phone List Time Limit: 3000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others) Total ...

  7. Windows phone 8 学习笔记(2) 数据文件操作

    原文:Windows phone 8 学习笔记(2) 数据文件操作 Windows phone 8 应用用于数据文件存储访问的位置仅仅限于安装文件夹.本地文件夹(独立存储空间).媒体库和SD卡四个地方 ...

  8. 【oracle案件】ORA-19502,ORA-27072

    1.1.1. ORA-19502,ORA-27072 日期:2014-05-12 00:12 环境:试验机 [错误号] $ oerr ora 19502 19502, 00000, "wri ...

  9. 如何使用ZEROBRANE STUDIO远程调试COCOS2D-X的LUA脚本(转)

    http://www.cocos2d-x.org/docs/manual/framework/native/v2/lua/lua-remote-debug-via-zerobrane/zh ZeroB ...

  10. [原创] linux 下上传 datapoint数据到yeelink 【golang版本】同时上传2个数据点

    /* Create by sndnvaps<sndnvaps@gmail.com> * data: 2015-04-12* upload 2 datapoint to yeelink.ne ...