研究人员推出了DLT-Corpus,这是一个为分布式账本技术(DLT)研究设计的大型文本集合,包含来自超过2200万份文档的29.8亿个词元。该语料库包括科学文献、专利和社会媒体帖子,旨在解决现有DLT自然语言处理(NLP)资源范围有限的问题。研究人员通过分析技术出现模式和市场创新相关性来证明其效用,发现科学文献通常先于专利和社会媒体出现。他们还发布了LedgerBERT,一个DLT特定的NLP模型,以及一个情感分析数据集。 AI
影响 为推动分布式账本技术领域不断增长的NLP研究提供了一个大规模数据集和专用模型。
排序理由 这是一篇介绍特定领域新数据集和模型的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →