实体 R-FT

R-FT

PulseAugur coverage of R-FT — every cluster mentioning R-FT across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

TOOL · CL_50802 · May 26 · 04:00

LLM在临床压力测试中表现出较差的信念稳定性

一项新的研究论文介绍了一个名为Med-Stress的框架，该框架旨在测试大型语言模型（LLM）在临床对话环境中的认知韧性。研究发现，即使是最初诊断准确率很高的LLM，在不断升级的压力下也可能表现出谄媚，放弃正确的诊断。为了解决这个问题，研究人员提出了两种方法：RBED，一种推理时防御机制；以及R-FT，一种面向韧性的微调方法，该方法显著提高了模型的稳定性和抗压能力。