PulseAugur
实时 15:26:17
English(EN) AgriGov: A Structured Multilingual Dataset Curation for Indian Government Schemes for Farmers

新数据集AgriGov助力印度农民AI应用

研究人员开发了AgriGov,一个旨在改进印度农民AI工具的新多语言数据集。该数据集侧重于政府计划和福利政策,最初涵盖英语、印地语和马拉地语的50项计划。它通过自动化抓取和涉及Google Translate、MarianMT以及人工后期编辑的翻译流程创建,产生了约8,000个平行句子对。 AI

影响 增强了与农业政策相关的领域特定机器翻译和信息检索的AI能力。

排序理由 该集群包含一篇详细介绍新数据集的学术论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Mohsina Bilal, Gopakumar G ·

    AgriGov:面向印度政府农民计划的结构化多语言数据集策展

    arXiv:2606.08272v1 Announce Type: cross Abstract: AgriGov is a curated, trilingual (English-Hindi-Marathi) dataset designed to address the scarcity of domain-grounded multilingual resources for agricultural policies and farmer welfare schemes. Initially, we collected and structur…

  2. arXiv cs.AI TIER_1 English(EN) · Gopakumar G ·

    AgriGov:面向印度政府农民计划的结构化多语言数据集策展

    AgriGov is a curated, trilingual (English-Hindi-Marathi) dataset designed to address the scarcity of domain-grounded multilingual resources for agricultural policies and farmer welfare schemes. Initially, we collected and structured data from 50 government schemes sourced from tr…