美国法官已允许针对 Databricks 的集体诉讼继续进行,该诉讼指控其 DBRX 大型语言模型使用了盗版的受版权保护的书籍进行训练。作者声称 Databricks 收购了 MosaicLM,而 MosaicLM 使用了包含约 196,000 种图书(包括他们的作品)的 RedPajama 数据集。Databricks 辩称作者无法证明 DBRX 是使用该特定数据训练的,但法官要求提供更多信息以确定是否发生了版权侵权。 AI
影响 版权侵权案件中可能产生的巨额赔偿,可能会影响 LLM 训练数据的获取策略。
排序理由 关于 LLM 训练数据版权侵权的集体诉讼正在进行中。
- Anthropic
- Book3
- Brian Keene
- Databricks
- DBRX
- Hugging Face
- Jason Reynolds
- Judge Charles Breyer
- LLAMA
- Meta
- MosaicLM
- Rebeccas Makkai
- RedPajama
- Stuart O’Nan
- The Great Believers
- U.S. District Court in Northern California
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →