实体 Donghwan Lee

Donghwan Lee

PulseAugur coverage of Donghwan Lee — every cluster mentioning Donghwan Lee across labs, papers, and developer communities, ranked by signal.

总计 · 30天

5

90 天内 5

发布 · 30天

0

90 天内 0

论文 · 30天

5

90 天内 5

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 5 条

RESEARCH · CL_128965 · Jul 7 · 04:00

Q学习理论通过新的误差分析和切换系统框架得到推进 · 跟踪2个来源

两篇新研究论文从不同的理论角度分析了Q学习，一种基础的强化学习算法。第一篇论文侧重于Q学习固有的高估偏差，将误差分解为正负分量，以推导出单独的有限时间收敛速率。第二篇论文将线性Q学习置于切换线性系统理论的框架内，使用联合谱半径来分析有限时间误差并提供收敛证明。
TOOL · CL_59102 · May 29 · 04:00

MATANet 通过上下文和层级感知提升海洋物种识别能力

研究人员开发了 MATANet，一个专为细粒度海洋物种识别设计的新型框架，尤其适用于挑战性的水下环境。该网络包含一个多上下文环境注意力模块，用于整合局部形态细节与更广泛的栖息地上下文；以及一个层级感知表示学习模块，利用分类结构来改进分类。MATANet 在 FathomNet2025 和 LifeCLEF2015-Fish 等数据集上展示了卓越的性能，并在 FathomNet 2025 挑战赛中荣获第一名。
TOOL · CL_51112 · May 26 · 04:00

新的扩散模型框架增强了基于姿态的人物图像生成

研究人员开发了一个名为“用于基于姿态生成人物图像的融合嵌入”（FPDM）的新框架，使用扩散模型来改进基于指定姿态的人物图像生成。该方法通过对比学习明确地将融合的源姿态嵌入与目标图像嵌入对齐，并使用学习到的融合嵌入作为生成的条件信号。FPDM集成了图像-姿态融合模块来学习这些对齐的嵌入，并使用源外观、目标姿态和融合嵌入来指导条件扩散模型。在基准数据集上的实验表明，FPDM在纹理保真度和跨姿态和源变化的一致性方面有所提高。
TOOL · CL_16258 · May 5 · 04:00

新的Q学习理论提供了更严格的收敛速率分析

研究人员开发了一个新颖的理论框架来分析Q学习，这是强化学习中的一个基本算法。这种新方法通过切换系统的视角来审视Q学习，推导出Q学习误差的直接随机表示。该分析通过直接切换族的联合谱半径表示收敛速率，提供了比以往方法更严格的界限。
RESEARCH · CL_06881 · Apr 28 · 04:00

一项新的研究探讨了强化学习中用于控制任务的贝尔曼残差最小化方法

本文介绍了将贝尔曼残差最小化应用于马尔可夫决策问题策略优化的基础性研究成果。虽然动态规划更为常见，但贝尔曼残差最小化在函数逼近方面具有稳定的收敛性等优势。该研究侧重于将此方法扩展到控制任务，而控制任务的探索程度不如策略评估。