PulseAugur
实时 15:55:48
实体 Lost in the Middle: How Language Models Use Long Contexts

Lost in the Middle: How Language Models Use Long Contexts

PulseAugur coverage of Lost in the Middle: How Language Models Use Long Contexts — every cluster mentioning Lost in the Middle: How Language Models Use Long Contexts across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_73221 ·

    GPT-3.5-Turbo在长提示中处理中间信息时遇到困难

    一项研究发现,当答案位于长提示(特别是20k token上下文窗口)的中间时,GPT-3.5-Turbo的准确率会显著下降。这一现象在论文“Lost in the Middle: How Language Models Use Long Contexts”中有记载,归因于Transformer模型中的注意力模式,这种模式偏好提示的开头或结尾的信息,而忽略中间部分。这个问题并非检索错误,而是由于训练数据限制导致模型注意力权重在中心区域衰减。