研究人员开发了新的方法来评估针对大型语言模型(LLM)的成员推理攻击(MIA),特别关注音频和文本模态。第一项研究引入了一种系统性的评估方法,用于大型音频语言模型(LALM),使用“多模态盲基线”来控制分布偏移,揭示了记忆是跨模态的,并且与说话人的声音身份有关。第二篇论文CheckMIABench提出了一种基于中间训练检查点和公共数据进行LLM原则性MIA评估的框架,展示了其在Pythia和OLMo模型上的应用,并发布了一个模块化库以供进一步研究。 AI
影响 这些新的评估框架和研究结果对于开发更私密的LLM和建立健全的审计标准至关重要。
排序理由 该集群包含两篇在arXiv上发表的学术论文,详细介绍了评估语言模型隐私风险的新研究方法。
- CheckMIABench
- Hugging Face
- Jia-Kai Dong
- Large Audio-Language Models
- Membership Inference Attacks
- OLMo
- Pythia
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →