实体
PAWS
PAWS
PulseAugur coverage of PAWS — every cluster mentioning PAWS across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
PAWS method improves reinforcement learning with segment-based advantage functions
Researchers have introduced PAWS, a novel method for preference-based reinforcement learning that addresses a critical training-inference mismatch. By utilizing segment-level advantage functions for policy updates, PAWS…
-
研究表明成对难度适应可提升冻结句子嵌入
研究人员调查了如何将冻结的句子嵌入适应输入复杂度,发现每句难度适应基本无效。他们使用 Qwen3-Embedding-0.6B 编码器进行的研究表明,复杂度更多是成对属性而非单个句子属性。然而,由交叉编码器难度信号门控的成对残差在 STS-B 和 QQP 等特定任务上确实显示出了一致的收益。