PulseAugur
实时 10:22:17
实体 Seong Hah Cho

Seong Hah Cho

PulseAugur coverage of Seong Hah Cho — every cluster mentioning Seong Hah Cho across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_70377 ·

    研究发现:大型语言模型混淆道德、语法和经济价值

    一篇新的研究论文探讨了大型语言模型(LLMs)如何混淆不同类型的“善”,特别是道德、语法和经济价值。研究人员发现,LLMs倾向于在语法和经济背景下过度强调道德考量,偏离了人类的规范。这种“价值纠缠”是通过分析模型行为和嵌入(embeddings)来观察到的,研究表明选择性地移除道德激活向量可以修复这种混淆。