PulseAugur
实时 11:43:07
实体 RAB-Cred

RAB-Cred

PulseAugur coverage of RAB-Cred — every cluster mentioning RAB-Cred across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_30757 ·

    LLMs在庇护决定可信度评估方面展现潜力

    研究人员探索了使用大型语言模型(LLMs)对丹麦庇护决定中的可信度评估进行标注,这是一项新颖的法律NLP任务。他们引入了RAB-Cred数据集,其中包含专家标注和元数据,用于在零样本和少样本设置中评估21个开放权重模型和各种提示组合。研究发现,虽然LLMs在成本效益标注方面显示出潜力,但它们的标注并不完美且不一致,因此需要仔细考虑,不能仅依赖单一模型预测。