实体
Mistral-7B-Instruct
Mistral-7B-Instruct
PulseAugur coverage of Mistral-7B-Instruct — every cluster mentioning Mistral-7B-Instruct across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
最近 · 第 1/1 页 · 共 2 条
-
LLM通过提示工程在代码提交分类中实现高准确率
研究人员探索了使用大型语言模型(LLM)对常规提交进行分类,而无需进行模型微调。他们评估了在Mistral-7B-Instruct、LLaMA-3-8B和DeepSeek-R1-32B模型上的零样本、少样本和思维链提示策略。研究发现,少样本提示产生了最高的准确率,DeepSeek-R1-32B模型表现最佳,这表明更大的模型在此任务上更有效。
-
LLM的可回答性由早期层的几何偏差发出信号
研究人员开发了一种新方法,可以在大型语言模型生成响应之前预测其是否能回答问题。该技术分析了模型内部表示的几何偏差,发现无法回答的数学查询显示出独特的模式。该信号在模型的早期层中最强,并且似乎是形式条件性的,在数学和代码提示上表现良好,但在事实性提示上则不然。