PulseAugur
实时 16:33:36
实体 TF1-EN-3M

TF1-EN-3M

PulseAugur coverage of TF1-EN-3M — every cluster mentioning TF1-EN-3M across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_15947 ·

    新方法涌现,用于控制大语言模型的道德推理并用合成寓言训练模型

    研究人员开发了一种名为“收敛-发散路由”(Convergent-Divergent Routing)的新颖方法,可在推理时引导大语言模型遵循特定的道德框架,同时保持通用能力。该技术涉及识别和修改Transformer块内影响道德推理的关键路径,从而能够校准道德决策。另外,一个名为TF1-EN-3M的新数据集已被创建,该数据集包含由小型语言模型生成的三个百万个合成道德寓言,旨在训练和评估开源模型在道德叙事和价值对齐方面的能力。