PulseAugur
实时 19:42:53
实体 GPT-5.4 Nano

GPT-5.4 Nano

PulseAugur coverage of GPT-5.4 Nano — every cluster mentioning GPT-5.4 Nano across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
3
90 天内 3
发布 · 30天
0
90 天内 0
论文 · 30天
3
90 天内 3
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 3 条
  1. TOOL · CL_28337 ·

    新基准测试 LLM 的数学文本续写能力

    研究人员开发了一个新的自监督基准,用于评估语言模型在数学文本续写方面的能力。该基准使用可能性评分来评估模型的辅助预测字符串在多大程度上能够传递关于隐藏续写(例如显示方程的其余部分)的信息。对 GPT-5.5 和 Opus 4.7 等模型的测试表明,即使评分器经过微调以模拟快捷方式漏洞,它们也能区分模型家族和推理工作。研究结果表明,跨模型可能性评分是一种在进一步优化之前进行静态基准测试和探测快捷方式漏洞的可行方法。

  2. RESEARCH · CL_18272 ·

    PIIGuard shields webpages from LLM PII harvesting via adversarial fragments

    Researchers have developed PIIGuard, a novel webpage-level defense system designed to prevent large language models (LLMs) from harvesting personally identifiable information (PII). This system embeds hidden HTML fragme…

  3. RESEARCH · CL_00033 ·

    [GRPO Explained] DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models

    Researchers are developing new benchmarks and evaluation methods for large language models (LLMs) in mathematical reasoning and educational assessment. New datasets like ESTBook and Math-PT aim to go beyond simple accur…