PulseAugur
实时 04:57:54
实体 this http URL-1.5

this http URL-1.5

PulseAugur coverage of this http URL-1.5 — every cluster mentioning this http URL-1.5 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_107813 ·

    新的基准测试 BehaviorBench 评估 AI 在行为科学任务上的表现

    研究人员推出了一项名为 BehaviorBench 的新基准测试,旨在评估基础模型在行为科学相关任务(如心理学和社会学)上的表现。该基准测试从个体和群体层面评估模型在行为预测、策略决策、特质推断和知识应用方面的能力。与 BehaviorBench 一同推出的还有 http URL-1.5,这是一个在行为数据上微调的行为基础模型系列,与通用专有模型相比,该系列展示了更优越的分布对齐能力。