实体
Alignment
Alignment
PulseAugur coverage of Alignment — every cluster mentioning Alignment across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
LLM 训练基底和 RLHF 对齐的影响受到质疑
研究人员正在质疑大型语言模型 (LLM) 的基础数据和训练过程。他们正在调查这些模型所训练的具体基底以及它们继承的激活向量。此外,还在探索人类反馈强化学习 (RLHF) 对这些向量的影响及其对人工智能对齐的意义。
-
LLM personality tests fail to predict model behavior
Researchers have found that traditional human psychometric questionnaires do not accurately predict the behavior of large language models. Studies indicate that LLMs can provide stable self-reports on personality invent…