New CAN-QA benchmark tests LLMs on in-vehicle network traffic reasoning

By PulseAugur Editorial · Summary by gemini-2.5-flash-lite from 2 sources

Researchers have introduced CAN-QA, a novel question-answering benchmark designed to analyze Controller Area Network (CAN) traffic within vehicles. This benchmark reformulates intrusion detection from a classification task into a QA format, generating over 33,000 natural-language question-answer pairs from raw CAN logs. Initial evaluations using CAN-QA reveal that current large language models struggle with temporal reasoning and complex inference required for accurate CAN traffic analysis. AI

Summary written by gemini-2.5-flash-lite from 2 sources. How we write summaries →

IMPACT Establishes a new evaluation framework for LLMs in automotive cybersecurity, highlighting current limitations in temporal and inferential reasoning.

RANK_REASON This is a research paper introducing a new benchmark dataset for evaluating LLMs on a specific domain.

Read on arXiv cs.LG →

paper
safety

COVERAGE [2]

arXiv cs.LG TIER_1 · Jing Chen, Abhijay Deevi, Onat Gungor, Tajana Rosing · 2026-04-29 04:00

CAN-QA: A Question-Answering Benchmark for Reasoning over In-Vehicle CAN Traffic

arXiv:2604.24935v1 Announce Type: cross Abstract: The Controller Area Network (CAN) is a safety-critical in-vehicle communication protocol that lacks built-in security mechanisms, making intrusion detection essential. Existing approaches predominantly formulate CAN intrusion dete…
arXiv cs.LG TIER_1 · Tajana Rosing · 2026-04-27 19:20

CAN-QA: A Question-Answering Benchmark for Reasoning over In-Vehicle CAN Traffic

The Controller Area Network (CAN) is a safety-critical in-vehicle communication protocol that lacks built-in security mechanisms, making intrusion detection essential. Existing approaches predominantly formulate CAN intrusion detection as a classification task, mapping complex tr…

COVERAGE [2]

CAN-QA: A Question-Answering Benchmark for Reasoning over In-Vehicle CAN Traffic

CAN-QA: A Question-Answering Benchmark for Reasoning over In-Vehicle CAN Traffic

RELATED ENTITIES

RELATED TOPICS