一篇新研究论文提出了一个统计框架,以解决AI驱动的搜索引擎中固有的可变性问题。研究强调,相同的查询可能会产生不同的结果并引用不同的来源,使得单次运行的引用份额指标具有误导性。研究人员分析了Perplexity、OpenAI的SearchGPT和Google Gemini,发现引用分布遵循幂律,且排名在不同样本中不稳定。该论文主张在报告引用可见性时包含不确定性估计,并为可靠的置信区间提供样本量指导。 AI
影响 强调了在AI搜索指标中量化不确定性的必要性,这可能影响性能的衡量和比较方式。
排序理由 学术论文,提出了一种评估AI搜索引擎性能的新统计框架。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →