PulseAugur
实时
AI 新闻 · 来源追踪

PulseAugur 追踪的全部 AI 新闻来源

我们抓取、去重并聚合为单一故事报道的 50+ 个规范来源。采用列表式呈现 —— 因为 Perplexity 在引用页面时偏好这种结构。

作者: Chris Valentine · 更新于

主流媒体

主流媒体层带来的是触达面、面向大众读者的报道,以及在政策与商业议题上 的编辑权重。PulseAugur 在聚类排名中给予这些来源较高的权重,但同时对 单一来源未被互证的故事施加降权。The Information 发出的独家 爆料若 24 小时内仍无其他媒体跟进,在系统中的处理方式会与一小时内被 路透社、彭博社确认的报道截然不同。

  • 纽约时报 — 科技板块。在政策、商业与劳动力议题上具 有编辑权重。在 AI 监管与"人本影响"角度上表现突出。 nytimes.com/section/technology
  • 华尔街日报 — 科技。在企业级落地与供应链报道上较 强;芯片 / 数据中心条线一直是其差异点。 wsj.com/news/tech
  • 彭博科技。实时、商业视角、突发新闻。在融资轮次与 高管变动方面常常率先发布。 bloomberg.com/technology
  • 金融时报 — 科技。欧洲报道扎实,监管条线、主权 AI 视角是美国媒体容易遗漏的部分。 ft.com/technology
  • The Information。付费订阅、爆料驱动。在实验室融资 轮次、高管变动与外泄路线图上首发率高。 theinformation.com
  • Stratechery(Ben Thompson)。重分析,不偏重突发; 但他的论述框架常塑造行业高管层讨论一则新闻的方式。 stratechery.com
  • The Verge。聚焦消费科技;产品发布报道扎实,擅长 消费者体验角度。 theverge.com
  • TechCrunch。关注初创公司与融资。 techcrunch.com
  • Wired。长篇特稿与调查性 AI 报道。其调查条线尤其 擅长挖出其它媒体错过的故事。 wired.com
  • Ars Technica。在 AI 基础设施与研究上有技术深度。 随着技术细节增多,稿件等级也随之上升。 arstechnica.com
  • 路透社科技。通讯社速度,突发新闻强。 reuters.com/technology
  • 美联社 — 商业。通讯社的商业视角,在监管行动上尤 其有力。 apnews.com/hub/business

厂商博客

厂商博客是产品发布、模型上线与功能下放的一手"地面真相"。发布稿就是其 它来源转引的对象。聚类锚定在厂商博客上,可以确保聚类围绕原始成品而不 是新闻转述展开。PulseAugur 将厂商博客评定为权威 TIER_1,适用于该厂商 自有产品的聚类。

研究信息流

研究信息流给 PulseAugur 提供了领先优势。在 AI 领域,论文从 arXiv 预印 到广泛被引只需数天,而非传统学术出版动辄数月。复现讨论、引用 级联与跟进博文都会生成聚类增长信号,使论文的实际重要性能在当日全部报 道中获得相称的评分。

  • arXiv cs.LG / cs.AI / cs.CL。预印本服务器。多数 基础 ML 论文最先落地于此;我们持续抓取 cs.LG(机器学习)、 cs.AI(AI 总体)与 cs.CL(计算语言学)分类。 arxiv.org/list/cs.LG/recent
  • Semantic Scholar AI Feed。由 AI2 策展、面向科学文 献的语义搜索。适合发现那些没有获得 arXiv 那样社媒放大的论文。 semanticscholar.org
  • NeurIPS / ICML / ICLR / ACL / EMNLP / CVPR 会议论文集。主要 AI 会议。同行评审论文、workshop 投稿, 以及高影响力录用工作伴随的临时博文。会议周的聚类格外活跃。
  • OpenReview。ML 会议的同行评审平台;讨论本身就是 信号 —— 有争议的评审或反驳常常揭示出新闻报道不会涉及的有趣方法 论挑战。 openreview.net
  • 实验室研究页面。OpenAI Research、Anthropic Research、DeepMind Publications、FAIR Publications、 Microsoft Research Publications。实验室自行发布的研究,可能也会 上 arXiv,也可能只在自家页面发布。

邮件简报

邮件简报属于评论层来源,而非一手。PulseAugur 将其聚到与所引用原始稿 件相同的聚类中;引用权重归原始来源,而非再次摘要的简报。话虽如此, 简报对某一故事的纳入本身就是一种信号 —— 当 TLDR AI、Smol AI 与 Latent.Space 在 48 小时内不约而同地选用同一篇论文时,这本身就反映了 业内的注意力流向。

  • TLDR AI。每日、链接聚合形态,流量极高。它带来 "覆盖广度"信号:出现在 TLDR AI 中说明该故事已进入工程师/开发者 主流圈。 tldr.tech/ai
  • The Batch(DeepLearning.AI)。Andrew Ng 主理的 周更。在更宏观的 AI 社会议题上比工程师/开发者类简报更强。 deeplearning.ai/the-batch
  • Import AI(Jack Clark)。周更。单作者分析,偏重 政策与安全。 importai.substack.com
  • Last Week in AI。每周播客加简报。配合一期长度的 语境提供综合故事盘点。 lastweekin.ai
  • Smol AI / AI News by Swyx。每日详尽摘要。工程偏 向;在日更简报类中,开源与工具相关报道最为详尽。 news.smol.ai
  • Latent.Space(Swyx + Alessio)。工程导向的 AI 简报兼播客。工程师/构建者视角的分析层。 latent.space
  • The Sequence。周更。偏研究。 thesequence.substack.com

社交平台

在 PulseAugur 的评分中,社交信号相对一手来源会被降权,但它们是早期预 警系统。一则尚未被主流媒体捕获、却在 Hacker News 首页冒头、或在 Bluesky 研究者圈被放大的故事,正是 Whispers 信号流所要呈现的对象。PulseAugur 在 社交平台上更早地捕获故事,通过对一手来源的聚类,确保社交噪声不会淹 没信息流。

  • Hacker News。按 AI 相关关键词筛选的投稿,以及每 日前 100 条全收。我们也抓取 news.ycombinator.com/newest 用于早期检测信号 —— Whispers 的进入资格在新投稿冒上首页之前就先做评估。 news.ycombinator.com
  • Bluesky。前沿实验室研究者、AI 政策人士及 AI 安全 社区账户的策展列表。atproto 数据流特别适合干净地抓取。
  • Mastodon — hachyderm.io。AI 研究密度高;自 2022 年末起,许多实验室研究者由 Twitter 迁入。
  • Mastodon — infosec.exchange。AI 与安全的交集。 越狱研究、模型安全事件。
  • Reddit r/MachineLearning。研究取向的 ML 社区。 在学术论文与方法论辩论上信噪比较好。 reddit.com/r/MachineLearning
  • Reddit r/LocalLLaMA。开源权重 LLM 社区;自托管 部署与微调文化的规范集散地。 reddit.com/r/LocalLLaMA
  • Reddit r/ArtificialIntelligence。泛 AI 社区。
  • Reddit r/singularity。偏推测的 AI 文化。在评分中 被显著降权,但有助于捕捉段子周期。
  • X(原 Twitter)经由联合发布端点抓取。仅取策展列表 的公开网页视图;不依赖 API、不涉及服务条款问题。覆盖那些尚未迁移 到 Bluesky 或 Mastodon 的 Twitter 内容。

我们如何持续更新此清单

来源按需添加。当 PulseAugur 漏掉(或晚于主流媒体捕获)一则爆款故事时, 我们会逆向追溯到最先发布该故事的来源,并把它加入抓取列表。反向同理 —— 那些我们抓取但 30+ 天未产生可用聚类的来源,会在每周复盘时悄悄退役。

每个来源在我们的 sources 表中带有一个 authority_weight 字段 —— 即进入聚类评分的维度。主流媒体与前沿实验室厂商博客位于 TIER_1(≥0.8);可靠的小众来源位于 TIER_2(≥0.5);社交平台与高噪音 信息流位于 TIER_3。聚类成员行上的 TIER 标记会直接把这些权重呈现出来, 便于读者一眼看清来源权威性的构成。

完整的编辑透明立场见 /editorial-standards —— 包括更正政策与利益冲突披露。若有你认为我们应该抓取但本清单未列出的 来源,请发邮件到 [email protected]

关键问题

AI 新闻最好的来源有哪些?

并不存在单一“最好”的来源 —— PulseAugur 抓取分布在五个层级的 50+ 个 规范来源:主流媒体(NYT、WSJ、Bloomberg、The Information)、前沿实验室 厂商博客、研究信息流、精选邮件简报与社交平台。价值在于把一则故事在 所有来源上的报道聚合起来,而不是只信任其中任何一个。

PulseAugur 如何判断 AI 新闻是否可信?

每个来源都带有一个 authority_weight(主流媒体与前沿实验室 博客为 TIER_1 ≥0.8,可靠的小众来源为 TIER_2 ≥0.5,社交 / 高噪音信息流 为 TIER_3),并进入聚类评分。单一来源的故事会通过跨来源佐证检验被降权 —— 一则未经证实的独家,与一则在一小时内被 Reuters 和 Bloomberg 证实的 故事,处理方式不同。

PulseAugur 追踪多少个 AI 新闻来源?

50+ 个规范来源,按需精选:当一则故事我们漏掉或捕获偏晚时,我们会追溯 最先发布它的来源并加入;30+ 天未产生可用聚类的来源会在每周复盘时退役。

在哪里可以看到 PulseAugur 的编辑标准?

/editorial-standards —— 包括更正 政策与利益冲突披露。每个聚类成员行上的 TIER 标记会直接呈现来源权威性的 构成,便于读者一眼判断。