实体
Kartik Hegde
Kartik Hegde
PulseAugur coverage of Kartik Hegde — every cluster mentioning Kartik Hegde across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新的RLHF框架使音频字幕与人类偏好保持一致
研究人员开发了一个新的音频字幕框架,该框架利用人类反馈强化学习(RLHF)来更好地使生成的字幕与人类偏好保持一致。该方法采用在成对偏好数据上训练的奖励模型,允许其在不需要昂贵的真实标注的情况下微调现有的字幕系统。人类评估表明,与传统的监督方法相比,该方法生成的字幕更受青睐,尤其是在基线模型表现不佳的情况下,并且取得了与监督方法相当的性能。
-
新的LA-RAG框架增强了长音频问答能力
研究人员开发了LA-RAG,一个旨在提高长音频录音问答能力的新框架。该系统将连续音频转换为带时间戳的事件记录,存储在SQL数据库中,并结合意图感知检索和LLM生成来回答查询。LA-RAG同时提供用于低延迟响应的离线索引和用于短片段的查询条件式关联,在Home-IoT和Industrial-IoT基准测试中显示出显著的准确性提升。