PulseAugur
实时 12:57:00
English(EN) Proposal: Use semantic compression as input diffusion to read sessions larger than the context window [R]

提案使用语义压缩处理AI长上下文会话

一项提案建议使用语义压缩作为一种输入扩散技术,以处理比当前上下文窗口更长的AI会话。该方法将上下文视为渐进式渲染,从压缩的大纲开始,然后逐渐添加压缩程度较低、细节更多的切片。目标是保留在标准压缩或检索方法中丢失的非局部信息。使用Qwen2.5 7B等小型、未训练模型的初步测试显示了单个组件的潜力,但在端到端连贯性方面存在困难,并计划进行进一步微调以评估位置感知训练。 AI

影响 可能使AI模型在更长的交互中保持连贯性和回忆信息。

排序理由 一项关于处理长AI上下文的新技术的研究提案。[lever_c_demoted from research: ic=1 ai=1.0]

在 r/MachineLearning 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

提案使用语义压缩处理AI长上下文会话

报道来源 [1]

  1. r/MachineLearning TIER_1 English(EN) · /u/Bravo_Oscar_Zulu ·

    Proposal: Use semantic compression as input diffusion to read sessions larger than the context window [R]

    <!-- SC_OFF --><div class="md"><p>I've been trying to come up with a solution for keeping extremely long ai sessions coherent. Sometimes there is too much substance to risk compaction. With so much buzz around diffusion going on it got me thinking, what if we treat the context li…