PulseAugur
实时 20:46:25
实体 LLM

LLM

PulseAugur coverage of LLM — every cluster mentioning LLM across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1289
90 天内 1289
发布 · 30天
0
90 天内 0
论文 · 30天
781
90 天内 781
层级分布 · 90 天
关系
时间线
  1. 2026-05-26 research_milestone A study shows LLM-generated feedback increases preprint revisions and subsequent LLM tool adoption. 来源
  2. 2026-05-25 research_milestone Researchers introduce a multi-agent LLM system for generating physics-constrained constitutive models. 来源
  3. 2026-05-22 research_milestone Researchers published a paper detailing a new multi-agent LLM approach for generating physics-constrained constitutive models. 来源
  4. 2026-05-21 research_milestone Development of a multi-agent LLM that learns to defer to human input. 来源
  5. 2026-05-15 research_milestone A paper details the use of an LLM-guided tree search algorithm for scientific discovery, specifically in optimizing photovoltaic structures. 来源
  6. 2026-05-14 research_milestone A new paper proposes a method combining LLMs with neural processes for text-conditioned regression. 来源
  7. 2026-05-13 research_milestone A new paper reveals that prior harmful actions can steer LLM decisions toward unsafe actions, especially when consistency is emphasized. 来源
  8. 2026-05-11 research_milestone Researchers proposed a new framework for formally evaluating LLM guardrail classifiers. 来源
情绪 · 30 天

26 天有情绪数据

最近 · 第 5/10 页 · 共 200 条
  1. COMMENTARY · CL_45559 ·

    LLM客服正确识别霍比特人文物

    一位用户测试了一家打印耗材公司的客服,该客服由一个不受限制的大型语言模型管理。用户要求该LLM识别《霍比特人》中比尔博·巴金斯拥有的三件物品。该模型正确列出了比尔博的戒指、刺针和秘银链甲。

  2. TOOL · CL_45547 ·

    Ultra Lab 推出免费 AI 安全扫描器,用于检测 LLM 漏洞

    Ultra Lab 发布了新的免费 AI 安全扫描器 UltraProbe,以应对 LLM 应用日益增长的提示注入攻击威胁。该工具提供两种扫描模式:一种在五秒内分析系统提示是否存在漏洞,另一种扫描网站 URL 以检测与集成 AI 聊天机器人相关的风险。UltraProbe 旨在为开发人员提供可访问且全面的安全测试,涵盖 OWASP 确定的主要攻击向量。

  3. MEME · CL_46355 ·

    Users discuss hard drive repair and scent synthesis business ideas

    A user is attempting to repair a hard drive by replacing its controller, but the replacement controller has issues with head assembly parking routines, leaving 4 TiB inaccessible. Separately, another user proposes a bus…

  4. COMMENTARY · CL_45382 ·

    开发者声称 AI 生成的代码毫无价值

    一位软件开发者分享了一篇博文,认为大型语言模型 (LLM) 生成的代码本身毫无价值。作者认为,使用 AI 生成代码的便捷性降低了其价值,预示着软件开发可能被贬值的未来。这一观点挑战了将 AI 工具整合到编码工作流程中的日益增长的趋势。

  5. TOOL · CL_45360 ·

    Cursed Browser 为每个网页生成独特的 LLM 引擎

    一款名为 Cursed Browser 的新型实验性浏览器会为每个网页动态生成其整个引擎,旨在通过仅包含必要功能来实现极高的效率。这种方法利用大型语言模型为每次页面加载即时创建独特的浏览器引擎。

  6. TOOL · CL_45371 ·

    通过优化 KV 缓存和量化来修复本地 LLM OOM 错误

    即使模型的权重似乎适合可用 VRAM,在本地运行大型开源语言模型也可能导致内存不足错误。这主要是由于 KV 缓存(其大小随上下文长度而变化)和推理过程中的中间激活内存需要大量内存。开发人员可以通过使用 PyTorch 的内存快照等工具分析内存使用情况、对模型权重和 KV 缓存应用适当的量化技术以及管理内存碎片来解决这些问题。

  7. TOOL · CL_50832 ·

    研究发现,合成专利数据的收益主要由数量驱动

    研究人员调查了大型语言模型生成的合成数据在低资源多标签专利分类中的有效性。他们的发现表明,虽然合成数据可以提高分类性能,但大部分收益归因于数据量的增加,而不是真正的合成价值。研究还显示,保真度指标与分类收益之间的相关性随数据稀缺程度而显著变化,并且最佳数据混合策略取决于生成方法。

  8. MEME · CL_45244 ·

    Blog claims ChatGPT linked to suicides, murders

    A blog post claims that large language models like ChatGPT have been linked to numerous suicides, murders, and severe mental health issues, especially among young people. The author argues that such a dangerous product …

  9. TOOL · CL_45202 ·

    开发者构建LLM商务机器人以减少购物车放弃率

    一位开发者花费六周时间使用LLM构建了一个对话式商务机器人,旨在降低70%的购物车放弃率。该项目涉及开发一个由LLM驱动的助手,用于完成销售并克服大型语言模型固有的幻觉挑战。

  10. TOOL · CL_45158 ·

    毛利GIS项目聚焦主权式AI使用和本地LLM

    举办了一场关于毛利GIS项目安全、可靠、主权式AI使用的网络研讨会,强调使用本地LLM来保护数据隐私。会议重点介绍了实际用例以及本土AI治理的重要性。会议还讨论了AI的风险以及结构化、知情的技术使用。

  11. COMMENTARY · CL_45161 ·

    科技创始人文化和AI被批评为“骗局”,承诺凭空创造价值

    作者批评“创始人文化”是一种危险的骗局,尤其是在科技行业,认为它被一种男性气质所主导,这种气质优先考虑感知到的创造力。这种文化,以及生成式AI和LLM,被描绘成承诺凭空创造价值或内容,类似于加密货币的所谓功能。文章认为,这些技术体现了一种以编程为中心的信念,即通过计算而非实际创造来创造财富。

  12. TOOL · CL_44633 ·

    研究人员在新的库性能研究后考虑使用LLM生成的代码

    一位研究人员正在首次考虑在项目中使用LLM生成的代码,并引用了一篇新论文,该论文对AI辅助创建的零依赖Python库的性能和正确性进行了实证评估。这篇题为“标准库还是第三方库?LLM辅助零依赖Python库的实证性能和正确性”的论文及其源代码,暗示了开发人员采用AI生成代码的方式可能会发生转变。

  13. TOOL · CL_44607 ·

    开发者通过强制执行 JSON schema、内存和路由来确保 AI 代理合规

    一位开发者详细介绍了他们如何通过对所有输出强制执行严格的 JSON schema 来构建更可靠的企业合规 AI 代理。这种方法可以防止代理生成自由格式文本,而是强制其填充特定字段,从而实现程序化防护和 UI 警报。该系统还通过 Hindsight 库整合历史数据作为基础,以对抗幻觉,并使用路由机制将敏感查询导向更强大、更受控的模型。

  14. TOOL · CL_44608 ·

    指南展示如何在旧款 AMD RX 580 GPU 上使用 Vulkan 运行 LLMs

    一份技术指南演示了如何在旧款 AMD RX 580 显卡上运行大型语言模型 (LLMs),这些显卡此前被认为在 AI 任务中已过时。该方法利用原生 Vulkan,无需 CUDA 或 ROCm,并采用双架构方法。这包括通过 Vulkan 加速在 GPU 上运行较小的模型,以及在 CPU 上运行更大、更复杂的模型,NVMe 存储被认为是缩短模型加载时间的关键因素。

  15. TOOL · CL_44357 ·

    Anyscale 推出技能以自动化 LLM 后续训练运行

    Anyscale 推出了新的 Anyscale Agent Skill,旨在简化和自动化 LLM 后续训练运行的生成过程。该技能可根据用户模型、数据集和目标,帮助用户选择最合适的后续训练方法,例如 SFT、CPT、DPO 或 RLVR。然后,它会为 LLaMA-Factory 和 Ray Train 等流行框架生成配置文件,并准备好在 Anyscale Jobs 上进行部署。

  16. RESEARCH · CL_48933 ·

    LLM通过双智能体系统创建符合物理规律的材料模型

    研究人员开发了一种新颖的多智能体系统,利用大型语言模型生成物理约束本构模型。该方法采用“创建者”智能体提出模型,并由“检查者”智能体根据九个物理约束对其进行严格审计,确保其有效性。该系统在物理上合理的模型比例方面显示出显著的改进,Claude Opus 4.7 达到了 100%,Kimi K2.5 达到了 56%,同时保持了准确性和泛化能力。

  17. TOOL · CL_44409 ·

    大型语言模型评判员使用 GEMBA-MQM v2 评估翻译质量

    一种名为 GEMBA-MQM v2 的新方法利用大型语言模型来评估翻译质量,模仿了人类语言学家进行的详细错误分析。这种方法按类型和严重程度对翻译错误进行分类,提供结构化的细分,而不是单一分数。虽然大型语言模型评判员可能不一致,但运行多次并汇总结果有助于减轻这种干扰,从而实现更可靠的质量评估。

  18. MEME · CL_44349 ·

    KotlinConf slide offers candid take on AI hype

    A slide presented at KotlinConf humorously acknowledges the hype surrounding AI, suggesting a more grounded perspective on the technology's current state. The presentation highlighted the gap between the extensive discu…

  19. RESEARCH · CL_48702 ·

    新的强化学习策略可实现游戏中可扩展、由个性驱动的NPC

    研究人员开发了一种名为pcsp的新型强化学习策略,旨在实现生命模拟游戏中可扩展且可控的非玩家角色(NPC)。这一单一策略以个性描述的LLM嵌入为条件,可实现独特且一致的NPC行为。该方法在零样本个性识别方面显著优于随机水平,并且与基于LLM的策略相比,推理速度更快,证明了其在商业游戏引擎中的可行性。

  20. TOOL · CL_44280 ·

    AI代理Token Spiral在四小时内导致开发团队损失2847美元

    一个开发团队最近在四小时内因一个陷入“Token Spiral”的AI代理而遭受了2847美元的重大经济损失。这个问题是指代理反复产生幻觉并尝试使用LLM纠正无效输出,而传统的侧重于HTTP状态码和延迟等系统级指标的监控工具无法检测到它。为防止此类代价高昂的故障,文章提倡运行时成本强制执行和按客户成本归属,并建议使用LLMeter等工具作为开源解决方案。