PulseAugur
实时 14:04:01
实体 Nico lá s Benjamín Ocampo

Nico lá s Benjamín Ocampo

PulseAugur coverage of Nico lá s Benjamín Ocampo — every cluster mentioning Nico lá s Benjamín Ocampo across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_56324 ·

    大型语言模型在论证质量评估中与人类判断呈中度相关

    研究人员探索了使用大型语言模型(LLMs)评估论证质量的方法,并比较了12个开源模型。研究发现,LLMs与人类专家的判断之间存在有希望但中度的相关性。Llama-70B 与专家的对齐度最高,达到了中度的 Cohen's \u03ba = 0.493。研究结果表明,LLMs能够部分但互补地理解论证质量维度,并且其预测在多次运行中保持稳定。