PulseAugur
实时 05:05:22
实体 Md Asiful Islam

Md Asiful Islam

PulseAugur coverage of Md Asiful Islam — every cluster mentioning Md Asiful Islam across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_06706 ·

    新的轻量级防护栏方法增强了提示安全性和可解释性

    研究人员开发了一种名为轻量级可解释防护栏(LEG)的新方法,用于识别AI模型不安全的提示。LEG采用多任务学习方法,同时对提示进行分类,并识别提示中证明安全决策依据的具体词语。该系统使用合成数据进行训练,以减轻LLM确认偏见,并采用一种新颖的损失函数来改进弱监督。