PulseAugur
实时 14:59:28
实体 Tree-Guided Identify-Then-Exploit

Tree-Guided Identify-Then-Exploit

PulseAugur coverage of Tree-Guided Identify-Then-Exploit — every cluster mentioning Tree-Guided Identify-Then-Exploit across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_65256 ·

    新框架统一了 Bandit 问题的目标

    研究人员引入了一个名为 Tree-Guided Identify-Then-Exploit (TG-ITE) 的新框架,以解决随机对战 Bandit 中的多个目标。这种统一的方法旨在同时优化最佳臂识别 (BAI) 并最小化弱 regret 和强 regret。TG-ITE 首先识别一个高置信度的现有臂,然后采用针对特定目标的定制开发策略,从而提高样本复杂度和联合优化能力。