探索式搜索中的难题

我们给大家带来了一项全新的研究，主题是解决探索式搜索中的难题。先来说说问题：用户在进行探索式搜索时，通常会遇到三个不确定：目标不确定、策略不确定和结果不确定。之前的研究试图通过系统提前想好关键词来解决问题，却忽略了用户可能一开始就陷入泥潭。而且真实搜索是动态演进的，静态推荐词难以适应这种变化。所以我们把研究重点放在了如何实时帮助用户解决这个难题。具体来说，我们把用户动态搜索过程本身当作一项资产。当用户在搜索中遇到困难时，我们就会实时给他们推送“下一站该去哪”，帮助他们回到正轨。接下来给大家介绍一下我们要解决的两个关键问题。第一个问题RQ1是，推送更好的搜索路径能不能真正帮到遇到困难的用户，让他们更快更准确地完成任务？第二个问题RQ2是，如果答案是肯定的，能不能给出一些量化指标来证明推荐路径确实更好？搜索路径到底是什么呢？我们沿用了White与Huang（2010）的定义：从一个检索式开始，经过一系列被访问页面，直到用户输入新查询或任务结束为止。这个过程中包含了关键词选择和页面跳转。我们想通过这个研究来解析动态路径推荐。研究设计方面我们采用了三步闭环：先预测遇到困难的用户，然后生成推荐路径给他们进行实时推送并评估效果。数据来源方面我们选取了实验室、课堂和真实场景进行实验。实验室研究是在受控环境下进行的主题固定实验；课堂研究模拟真实焦虑感；实地研究是在真实搜索引擎场景下进行的自由搜索。这三组实验覆盖了健康、环境和新闻等不同主题，确保结果具有泛化性。评估指标上我们考虑了三个维度：网页被发现可能性、查询顺序和页面浏览顺序。我们参考Open Directory Project（ODP）分层数据来计算覆盖率和匹配度。研究发现推荐路径带来了显著提升：信息空间覆盖率增加了很多。而且推荐时机越早效果越明显。三项指标都领先于用户原路径和随机路径。这说明推荐路径能提前把隐藏相关页面浮出来。我们认为这个技术可以大幅度减少后续查询的工作量。当然还有不足之处需要改进：比如假设用户会原路返回可能和现实不同；还有任务难度梯度缺失等问题。未来我们可能加入“强制引导”或者“提示按钮”。同时也要考虑到不同背景用户的需求差别。最后给大家总结一下：这次研究提醒学术界应该把“顺序”放回搜索核心位置。不同阶段看到同一页面价值会有差别。未来研发如果想取得更好成绩的话可以考虑将“顺序智能”作为核心模块来开发系统。让系统像导航一样告诉用户下一步该查什么、怎么看才能找到更好的结果。