PulseAugur
实时 10:17:59
English(EN) Your AI Agent Is Paying for HTML It Never Reads — I Measured the 7x Token Tax

AI代理通过原始HTML网络访问面临7倍Token税

一位开发者测量了AI代理访问网页时产生的显著Token开销,发现原始HTML消耗的Token量可能高达实际文本内容的七倍。这些标记语言,包括脚本和CSS,会用噪音填充上下文窗口并增加成本,其中一个页面在原始Token上花费了0.55美元,而在清理后仅花费0.078美元。一个使用标准库和`tiktoken`分词器的简单Python脚本可以剥离这些不必要的标记语言,从而大大减少Token使用量和成本。 AI

影响 通过最小化网络抓取过程中的Token使用量,降低了AI代理的运营成本并提高了效率。

排序理由 该集群描述了一个用于优化AI代理网络访问的实用工具/脚本。

在 dev.to — LLM tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. dev.to — LLM tag TIER_1 English(EN) · Alex Spinov ·

    Your AI Agent Is Paying for HTML It Never Reads — I Measured the 7x Token Tax

    <p>I gave an agent a <code>fetch_page</code> tool, asked it to read one Wikipedia article, and watched that single page cost <strong>48,703 tokens</strong> before the model produced a word. The readable text on that page is about 7,300 tokens. I was paying for ~41,000 tokens of <…