研究人员开发了一种新的分类法,用于识别在 TikTok 和 Bluesky 等社交媒体平台上用于逃避审核的间接语言表达(ILE)。该分类法对编码语言的底层机制进行分类,而不仅仅是沟通意图。当集成到大语言模型的提示中时,所提出的分类法在检测伪装含义方面显著优于现有方法,准确率提高了 4.7%,F1 分数提高了 5.4%。 AI
影响 这项研究可能通过提高大语言模型检测伪装语言的能力,从而带来更有效的社交媒体平台内容审核工具。
排序理由 该集群包含一篇学术论文,详细介绍了用于基于大语言模型的编码语言检测的新分类法。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →