研究人员推出了 CTIConnect,这是一个旨在评估检索增强大型语言模型 (LLM) 在网络威胁情报 (CTI) 任务中的新基准。该基准整合了各种 CTI 数据源,包括结构化数据库和非结构化报告,以创建真实的测试环境。对十个最先进的 LLM 进行的实验表明,在不同任务类型上的性能差异很大,这凸显了需要专门的检索策略,而不是通用的改进。 AI
影响 提供了一个标准化的评估框架,以推动在将 LLM 应用于网络安全威胁分析方面的进展。
排序理由 该集群包含一篇研究论文,介绍了一个用于评估 LLM 在特定领域的新基准。 [lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →