PulseAugur
实时 19:37:00
实体 CoT+Reasoning

CoT+Reasoning

PulseAugur coverage of CoT+Reasoning — every cluster mentioning CoT+Reasoning across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_55953 ·

    新的GRADE框架评估AI助教的教学能力

    一篇新研究论文介绍了一个名为GRADE的框架,用于评估AI助教的教学能力。该研究系统地评估了五种语言模型的120种配置,探索了零样本推理、LoRA微调和CoT+推理等方法。Gemma3-12B在单任务评估中表现出色,而Gemma3-27B在多任务预测中更可靠。研究还指出,虽然数据增强可以帮助表现不佳的模型,但LoRA微调可能会阻碍某些模式下的指令遵循,并且碳排放量因模型选择和推理方法而异。