实体 Falcon3-7B

Falcon3-7B

PulseAugur coverage of Falcon3-7B — every cluster mentioning Falcon3-7B across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

最近 · 第 1/1 页 · 共 1 条

TOOL · CL_22450 · May 8 · 04:00

人工智能安全研究揭示区域性大语言模型偏见差异

一篇新研究论文引入了一个因果分析框架，用于审计大语言模型（LLM）的安全机制，超越了观察性偏见测量。该研究应用Pearl的do-算子来分离人口统计信息注入提示的因果效应，涉及来自美国、欧洲、阿联酋、中国和印度的七个指令调优模型。研究结果表明，由于上下文毒性，标准的公平性指标可能高估人口统计偏见，并揭示了不同的对齐趋势，其中西方模型对某些群体的因果拒绝率更高，而东方模型则表现出有针对性的敏感性。