PulseAugur
实时 18:20:48
English(EN) Just awk'ed the sum of all the garbage iocaine shipped to AI crawlers for all of my hosts. :blobcatgiggle: 329 GB Shipped to 124,291,278 AI crawler requests. :b

AI爬虫访问了Mastodon用户329 GB的数据

一位Mastodon用户报告称,在响应超过1.24亿次AI爬虫的请求时,发送了329 GB的数据。该用户对这些自动化系统访问的数据量表示不满。此事件凸显了人们对大型语言模型和AI训练过程中的数据消耗的担忧。 AI

影响 凸显了AI训练潜在的数据隐私和资源消耗问题。

排序理由 用户对AI爬虫数据使用的投诉,并非可验证事件或新模型/产品发布。

在 Mastodon — mastodon.social 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

AI爬虫访问了Mastodon用户329 GB的数据

报道来源 [1]

  1. Mastodon — mastodon.social TIER_1 English(EN) · [email protected] ·

    刚刚用 awk 统计了所有我托管的机器上发送给 AI 爬虫的所有垃圾 iocaine 数据。:blobcatgiggle: 329 GB 数据发送给 124,291,278 个 AI 爬虫请求。:b

    Just awk'ed the sum of all the garbage iocaine shipped to AI crawlers for all of my hosts. :blobcatgiggle: 329 GB Shipped to 124,291,278 AI crawler requests. :blobcat_thisisfine: Noice. # iocaine # ai # llm # claude # OpenAI # FckAI # FckLLMs