PulseAugur
实时 15:07:30
实体 Zhongxiang Dai

Zhongxiang Dai

PulseAugur coverage of Zhongxiang Dai — every cluster mentioning Zhongxiang Dai across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_65697 ·

    新的T-POP方法通过实时用户反馈个性化LLM

    研究人员开发了T-POP,一种使用在线偏好反馈实时个性化大型语言模型的新方法。该方法通过从用户交互中学习奖励函数而不更新LLM的参数来解决冷启动问题。T-POP采用对决学习算法来有效地平衡用户偏好的探索和所学知识的利用,在数据效率和个性化速度方面均显著优于现有方法。