PulseAugur
实时 09:40:20
实体 Eshaan Nair

Eshaan Nair

PulseAugur coverage of Eshaan Nair — every cluster mentioning Eshaan Nair across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_36995 ·

    研究表明,大型语言模型在学术和医疗领域会出现幻觉

    一项新近发布在arXiv上的研究调查了四种流行的大型语言模型——ChatGPT、Grok、Gemini和Copilot——在用于学术写作时产生幻觉的倾向。该研究引入了一个“幻觉指数”(HI),发现Grok和Copilot在引用生成方面表现更好,但在抽象提示方面遇到困难,而Gemini和ChatGPT则表现出更好的语气控制,但事实幻觉的风险更高。研究得出结论,幻觉行为受任务类型和提示条件的影响,而非仅仅由模型架构决定。另外,Gary M…