实体 Mistral-7B-Instruct

Mistral-7B-Instruct

PulseAugur coverage of Mistral-7B-Instruct — every cluster mentioning Mistral-7B-Instruct across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 2

发布 · 30天

90 天内 0

论文 · 30天

90 天内 2

层级分布 · 90 天

最近 · 第 1/1 页 · 共 2 条

TOOL · CL_18618 · May 6 · 04:00

LLM通过提示工程在代码提交分类中实现高准确率

研究人员探索了使用大型语言模型（LLM）对常规提交进行分类，而无需进行模型微调。他们评估了在Mistral-7B-Instruct、LLaMA-3-8B和DeepSeek-R1-32B模型上的零样本、少样本和思维链提示策略。研究发现，少样本提示产生了最高的准确率，DeepSeek-R1-32B模型表现最佳，这表明更大的模型在此任务上更有效。
RESEARCH · CL_18269 · May 4 · 22:24

LLM的可回答性由早期层的几何偏差发出信号

研究人员开发了一种新方法，可以在大型语言模型生成响应之前预测其是否能回答问题。该技术分析了模型内部表示的几何偏差，发现无法回答的数学查询显示出独特的模式。该信号在模型的早期层中最强，并且似乎是形式条件性的，在数学和代码提示上表现良好，但在事实性提示上则不然。

LLM通过提示工程在代码提交分类中实现高准确率

LLM的可回答性由早期层的几何偏差发出信号