实体
Hanjun Cho
Hanjun Cho
PulseAugur coverage of Hanjun Cho — every cluster mentioning Hanjun Cho across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新框架TaNOS提升AI表格数值推理能力
研究人员开发了TaNOS,一个旨在提高AI模型在处理复杂、领域特定表格时的数值推理能力的新框架。该框架使用表头匿名化、操作草图作为结构线索,以及自监督预训练来构建程序-问题对。这种方法有助于模型在不同领域更好地泛化,减少对表面捷径的依赖。当应用于一个8B指令调优模型时,TaNOS在FinQA数据集上取得了显著的准确性和鲁棒性提升,性能优于GPT-5和Gemini 2.5 Pro等专有模型。
-
新的RARE框架改进了冗余文档语料库的RAG评估
研究人员开发了RARE,一个新颖的框架,旨在更准确地评估检索增强生成(RAG)系统,特别是在高度相似和冗余文档的领域。传统基准测试常常无法捕捉到这些系统在金融、法律和专利分析等现实世界场景中因信息重叠而导致的性能下降。RARE通过将文档分解为原子事实以精确跟踪冗余,并采用CRRF增强的数据生成方法来提高基准测试的可靠性来解决这个问题。在专业语料库上的初步应用揭示了检索器性能中先前未被发现的显著鲁棒性差距。