研究人员正在质疑大型语言模型 (LLM) 的基础数据和训练过程。他们正在调查这些模型所训练的具体基底以及它们继承的激活向量。此外,还在探索人类反馈强化学习 (RLHF) 对这些向量的影响及其对人工智能对齐的意义。 AI
影响 对 LLM 的训练数据和对齐提出了根本性问题,可能影响未来的研究方向。
排序理由 该集群讨论了关于 LLM 训练和对齐的研究问题。[lever_c_demoted from research: ic=1 ai=1.0]
在 Mastodon — sigmoid.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →