PulseAugur
实时 22:16:10
English(EN) NuExtract3 released: open-weight 4B VLM for Markdown, OCR and structured extraction (self-hostable) [P]

Numind发布NuExtract3,一款用于文档提取的4B开源VLM

Numind发布了NuExtract3,这是一款开源的4B视觉语言模型,专为从复杂文档中提取信息而设计。该模型基于Qwen3.5-4B构建,并采用Apache-2.0许可,能够将文档图像转换为Markdown,将结构化数据提取到JSON模板中,并处理各种视觉输入。它设计为可自托管,所需的VRAM要求极低,并提供多种权重格式以实现广泛兼容性。 AI

影响 为文档信息提取任务提供了一个可自托管的开源替代方案。

排序理由 非前沿实验室发布开源模型。

在 r/MachineLearning 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

Numind发布NuExtract3,一款用于文档提取的4B开源VLM

报道来源 [2]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/Gailenstorm ·

    NuExtract3 发布:支持 Markdown、OCR 和结构化提取的开源 4B VLM(可自托管)

    <table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1tn8utn/nuextract3_released_openweight_4b_vlm_for/"> <img alt="NuExtract3 released: open-weight 4B VLM for Markdown, OCR and structured extraction (self-hostable)" src="https://preview.redd.it/2kyyubbs9a3h1.jp…

  2. r/MachineLearning TIER_1 English(EN) · /u/Gailenstorm ·

    NuExtract3 发布:开源 4B VLM 支持 Markdown、OCR 和结构化提取(可自托管)[P]

    <table> <tr><td> <a href="https://www.reddit.com/r/MachineLearning/comments/1tkejqr/nuextract3_released_openweight_4b_vlm_for/"> <img alt="NuExtract3 released: open-weight 4B VLM for Markdown, OCR and structured extraction (self-hostable) [P]" src="https://preview.redd.it/pm2xboo…