r/LocalLLaMA subreddit上的一位用户正在询问本地LLM为最终响应生成的Token数量与其内部“思考”过程之间存在的差异。他们观察到,模型的思考过程(包括处理输入和生成中间文本)似乎比他们试图实现的最终分类列表输出了更多的Token。用户想知道这种似乎存在于大多数模型中的“思考”能力是否可以用于诸如对大型数据集进行分类之类的任务,而无需专门的模型或外部工具(如向量数据库)。 AI
影响 不适用
排序理由 用户对LLM行为的提问,并非新发布或重大事件。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →