实体 TF1-EN-3M

TF1-EN-3M

PulseAugur coverage of TF1-EN-3M — every cluster mentioning TF1-EN-3M across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

最近 · 第 1/1 页 · 共 1 条

RESEARCH · CL_15947 · May 5 · 04:00

新方法涌现，用于控制大语言模型的道德推理并用合成寓言训练模型

研究人员开发了一种名为“收敛-发散路由”（Convergent-Divergent Routing）的新颖方法，可在推理时引导大语言模型遵循特定的道德框架，同时保持通用能力。该技术涉及识别和修改Transformer块内影响道德推理的关键路径，从而能够校准道德决策。另外，一个名为TF1-EN-3M的新数据集已被创建，该数据集包含由小型语言模型生成的三个百万个合成道德寓言，旨在训练和评估开源模型在道德叙事和价值对齐方面的能力。