研究人员推出了CAN-QA,一个新颖的问答基准,旨在分析车辆内的控制器局域网(CAN)流量。该基准将入侵检测从分类任务重新构建为问答格式,从原始CAN日志生成了超过33,000个自然语言问答对。使用CAN-QA进行的初步评估显示,当前的大型语言模型在准确分析CAN流量所需的时间推理和复杂推理方面存在困难。 AI
影响 为LLM在汽车网络安全领域的评估建立了一个新的评估框架,突出了当前在时间推理和推断推理方面的局限性。
排序理由 这是一篇介绍用于评估LLM在特定领域表现的新基准数据集的研究论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →