PulseAugur
实时 08:10:01
实体 Kushal Jayesh Tatariya

Kushal Jayesh Tatariya

PulseAugur coverage of Kushal Jayesh Tatariya — every cluster mentioning Kushal Jayesh Tatariya across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_15943 ·

    研究人员审计低资源NLP任务的维基百科数据质量

    一项新研究审计了低资源和多语言自然语言处理(NLP)任务的维基百科数据质量。研究人员发现存在显著的质量问题,包括脚本和语言污染、机器人生成内容以及模板文章,尤其是在非英语版本中。过滤这些数据在多种场景下提高了语言模型的性能,特别是对于质量较低的语言版本,这表明在NLP数据集整理中需要有质量意识的最佳实践。