实体
Llama3-8B
Llama3-8B
PulseAugur coverage of Llama3-8B — every cluster mentioning Llama3-8B across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
通过推理框架增强大型语言模型在癌症生存预测方面的能力
研究人员开发了一个名为OncoReason的新框架,以提高大型语言模型(LLMs)在预测癌症治疗结果方面的可解释性和准确性。这种多任务学习方法训练LLMs执行生存分类、时间回归,并为其预测生成自然语言解释。使用LLaMa3-8B和Med42-8B模型的实验表明,思维链提示(Chain-of-Thought prompting)和组相对策略优化(Group Relative Policy Optimization)显著提高了预测性能和可…
-
新方法过滤用于LLM微调的降级安全数据
研究人员开发了DataShield,一种用于识别和过滤用于微调大型语言模型(LLM)的良性数据集中的降级安全数据的新方法。该方法量化了每个数据样本对模型合规行为的贡献,从而能够隔离高风险子集。在Llama3和Qwen2.5等模型上的实验证明了DataShield在精确定位可能无意中降低LLM安全性(尤其是在开放式问答任务中)的数据方面的有效性。