探索式搜索中的难题

我们给大家带来了一项全新的研究,主题是解决探索式搜索中的难题。先来说说问题:用户在进行探索式搜索时,通常会遇到三个不确定:目标不确定、策略不确定和结果不确定。之前的研究试图通过系统提前想好关键词来解决问题,却忽略了用户可能一开始就陷入泥潭。而且真实搜索是动态演进的,静态推荐词难以适应这种变化。所以我们把研究重点放在了如何实时帮助用户解决这个难题。 具体来说,我们把用户动态搜索过程本身当作一项资产。当用户在搜索中遇到困难时,我们就会实时给他们推送“下一站该去哪”,帮助他们回到正轨。接下来给大家介绍一下我们要解决的两个关键问题。第一个问题RQ1是,推送更好的搜索路径能不能真正帮到遇到困难的用户,让他们更快更准确地完成任务?第二个问题RQ2是,如果答案是肯定的,能不能给出一些量化指标来证明推荐路径确实更好? 搜索路径到底是什么呢?我们沿用了White与Huang(2010)的定义:从一个检索式开始,经过一系列被访问页面,直到用户输入新查询或任务结束为止。这个过程中包含了关键词选择和页面跳转。我们想通过这个研究来解析动态路径推荐。研究设计方面我们采用了三步闭环:先预测遇到困难的用户,然后生成推荐路径给他们进行实时推送并评估效果。 数据来源方面我们选取了实验室、课堂和真实场景进行实验。实验室研究是在受控环境下进行的主题固定实验;课堂研究模拟真实焦虑感;实地研究是在真实搜索引擎场景下进行的自由搜索。这三组实验覆盖了健康、环境和新闻等不同主题,确保结果具有泛化性。评估指标上我们考虑了三个维度:网页被发现可能性、查询顺序和页面浏览顺序。我们参考Open Directory Project(ODP)分层数据来计算覆盖率和匹配度。 研究发现推荐路径带来了显著提升:信息空间覆盖率增加了很多。而且推荐时机越早效果越明显。三项指标都领先于用户原路径和随机路径。这说明推荐路径能提前把隐藏相关页面浮出来。我们认为这个技术可以大幅度减少后续查询的工作量。 当然还有不足之处需要改进:比如假设用户会原路返回可能和现实不同;还有任务难度梯度缺失等问题。未来我们可能加入“强制引导”或者“提示按钮”。同时也要考虑到不同背景用户的需求差别。 最后给大家总结一下:这次研究提醒学术界应该把“顺序”放回搜索核心位置。不同阶段看到同一页面价值会有差别。未来研发如果想取得更好成绩的话可以考虑将“顺序智能”作为核心模块来开发系统。让系统像导航一样告诉用户下一步该查什么、怎么看才能找到更好的结果。