PulseAugur
实时 09:21:38
English(EN) MimeLens: Position-Agnostic Content-Type Detection for Binary Fragments

MimeLens 从任意片段识别二进制文件类型

研究人员开发了 MimeLens,一个旨在准确识别二进制数据片段内容类型的新系统,即使它们缺少头部或来自文件中的任意位置。与需要访问整个文件的先前方法不同,MimeLens 利用在随机采样的二进制块上预训练的类 BERT 编码器。这种方法在具有挑战性的数据集(包括流中网络数据包和随机磁盘块)上显著优于 Magikalibmagic 等现有工具,尽管它在 CPU 上具有更高的延迟成本。 AI

影响 通过对碎片化二进制数据进行内容类型检测,增强了安全和取证领域的数据分析能力。

排序理由 介绍二进制片段分类新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Michael J. Bommarito II ·

    MimeLens: Position-Agnostic Content-Type Detection for Binary Fragments

    arXiv:2606.04171v1 Announce Type: cross Abstract: File-type classification underlies many workflows like malware triage, forensic carving, packet inspection, and storage indexing. Learned systems such as Google's Magika assume whole-file access at a known offset, so they break on…