PulseAugur
实时 06:38:54
实体 Jigsaw-to-DynaHate

Jigsaw-to-DynaHate

PulseAugur coverage of Jigsaw-to-DynaHate — every cluster mentioning Jigsaw-to-DynaHate across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_117779 ·

    DriftGuard框架通过安全感知漂移检测改进毒性内容审核

    研究人员开发了DriftGuard,一个旨在增强自动化毒性内容审核系统鲁棒性的新框架。该系统采用安全感知多监控器漂移检测来识别演进中的有害行为,包括传统方法可能忽略的隐晦语言和目标人群的变化。当检测到重大变化时,DriftGuard会使用优先适应集选择性地更新审核模型,重点关注可能的假阴性和高风险示例。实验表明,与Civil Comments和DynaHate等数据集上的基线方法相比,DriftGuard显著提高了毒性召回率和准确性。