English(EN) What if context compression is a diffusion noise function? Proposal + honest results from untrained-model experiments [R]

新的上下文压缩方法使用扩散噪声函数

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-26 13:16

一位独立研究者提出了一种新颖的方法来处理语言模型中极长的上下文，即将上下文压缩视为一个扩散噪声函数。该方法涉及对源文档进行多次传递，每次传递使用一个逐渐不那么压缩的视图来精炼集成状态。对未经训练的模型进行的初步实验表明，虽然各个组件显示出潜力，但信息在传递过程中的保留和重组仍然是一个瓶颈，这表明需要进一步的模型训练来验证。 AI

影响这种方法有可能使语言模型能够处理和理解比当前上下文窗口允许的更长的文档。

排序理由该集群描述了一种新颖的研究提案和一种新的自然语言处理方法的初步实验结果。[lever_c_demoted from research: ic=1 ai=1.0]

在 r/MachineLearning 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/MachineLearning TIER_1 English(EN) · /u/Bravo_Oscar_Zulu · 2026-06-26 13:16

What if context compression is a diffusion noise function? Proposal + honest results from untrained-model experiments [R]

<div class="md"><p>I'm proposing a way to handle massive context longer than a model's context window by treating semantic compression as the noise function of a diffusion-like process. Instead of denoising masked tokens into coherent text (like DiffusionGemma or N…

报道来源 [1]

What if context compression is a diffusion noise function? Proposal + honest results from untrained-model experiments [R]

相关实体

相关话题