English(EN) Community-Specific Slang and Entity Detection via Semantic Shift in Fine-Tuned Language Models

LLM语义偏移方法可检测社区俚语和实体

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 04:00

研究人员开发了一种无监督方法，通过分析微调语言模型的语义偏移来识别在线社区中的俚语和独特实体。该技术通过衡量模型在社区特定文本上训练后单词表示的变化来隔离具有最显著偏移的单词。该研究成功地使用在Reddit数据上微调的DistilRoBERTa来找出具有独特社区含义的单词，将其与普遍理解的术语区分开来。 AI

影响该方法可以改善对在线社区中专业语言的理解和分析，有助于内容审核和信息检索。

排序理由该集群包含一篇详细介绍语言模型分析新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Julia Kruk, Sanchita Porwal, Amitrajit Bhattacharjee, Mansi Phute · 2026-06-09 04:00

通过微调语言模型的语义偏移进行特定社区的俚语和实体检测

arXiv:2606.07522v1 Announce Type: cross Abstract: We propose an unsupervised method of resolving slang, unique entities, and folklore from online communities by isolating words in the lexicon that have the highest magnitude of semantic shift. Semantic shift is defined as the evol…

报道来源 [1]

通过微调语言模型的语义偏移进行特定社区的俚语和实体检测

相关实体

相关话题