实体 Language Models

Language Models

PulseAugur coverage of Language Models — every cluster mentioning Language Models across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

131

90 天内 131

发布 · 30天

90 天内 0

论文 · 30天

117

90 天内 117

层级分布 · 90 天

research 56
tool 67
commentary 8

主题

论文 117
模型发布 53
安全 40
其他 31
产品 14
观点 6
基础设施 4
政策 2

关系

used by sycophancy 90%
instance of sycophancy 70%
instance of Influence Flower 70%

时间线

2026-05-26 research_milestone A new paper details a method for achieving expert-level reasoning in language models for neuroscience using knowledge graphs. 来源
2026-05-22 research_milestone A new paper demonstrates language models can forecast research success with high accuracy. 来源
2026-05-15 research_milestone Researchers introduced an aphasia-inspired technique to characterize the emergent functional organization of language models. 来源

情绪 · 30 天

22 天有情绪数据

最近 · 第 1/7 页 · 共 131 条

RESEARCH · CL_128861 · Jul 7 · 04:00

新的基准和框架解决了文本到SQL的可靠性和AI功能问题 · 跟踪4个来源

研究人员开发了新的基准和框架来解决大型语言模型（LLM）在文本到SQL任务中的可靠性和能力问题。Spider 2.0-AIFunc是一个新的基准，它扩展了现有的文本到SQL评估，纳入了Snowflake等平台上可用的AI原生SQL函数，揭示了专有模型和开源模型之间的性能差距。同时，SAGE框架自动化了对LLM生成的SQL中潜在漏洞的发现，突出了模型的脆弱性，并通过微调提出了修复途径。另一项研究侧重于通过预测重复的LLM调用何时收敛到一…
TOOL · CL_129120 · Jul 7 · 04:00

论文探讨在“全球南方”部署语言模型

一篇新发表在arXiv上的论文探讨了在“全球南方”部署语言模型的挑战，重点关注多语言能力和边缘计算的交叉点。研究强调了对包容性和公平性语言技术的需求，解决了多样化语言社区面临重大基础设施限制的“最后一英里”问题。该论文调查了语言模型管道中的232项现有研究，并为利益相关者提供了建议。
TOOL · CL_125754 · Jul 3 · 20:44

新的“Clanker”测试分析社交媒体上的AI写作风格

一个名为“how clanker are you?”的新网站提供了一个反向图灵测试，用户可以输入X或Reddit用户名来分析他们的写作风格。该工具通过衡量用户帖子与语言模型相比的词语选择可预测性，来评估一个人帖子的“clanker”（AI化）程度。得分基于不同模型下每个词的意外度（surprisal），意外度越低表示越像AI写作。
TOOL · CL_123034 · Jul 3 · 04:00

新的 Ember 优化器通过减少 VRAM 来简化语言模型训练

研究人员开发了 Ember，这是一种新颖的优化器，旨在通过专注于嵌入表和 LM-head 矩阵来增强语言模型的训练。与 Adam 等传统优化器相比，这种方法所需的 VRAM 大大减少，并且可以提高监督微调、强化学习和预训练的性能。Ember 的有效性已通过实证得到证明，显示出其在批处理大小和参数数量上的可扩展性，并表明 token 优化轨迹遵循简单的 1D 光线。
TOOL · CL_123167 · Jul 2 · 17:25

新框架将语言模型视为文化测量的积极参与者

本文提出了一个理解语言模型如何用于测量文化现象的新框架。它认为，测量仪器本身，包括模型、数据和评估方法，都在积极塑造其旨在量化的文化现实。该研究提出了一种将这些界限视为有意识的、合乎道德的以及经验性的承诺的方法，并借鉴了电视和电影对话的案例研究。
RESEARCH · CL_122980 · Jul 2 · 06:44

新框架使用大型语言模型和形式概念分析实现可验证的知识扩展

研究人员开发了一个新框架，该框架结合使用检索增强的小型语言模型（SLM）和形式概念分析（FCA），以提高知识扩展的准确性和可验证性。该方法利用FCA从文本中提出蕴含关系，然后由能够识别不一致性或提供反例的SLM预言机进行验证。该系统旨在通过清晰地展示已接受的蕴含关系和矛盾来使知识扩展过程更具可检查性。在罕见共济失调数据集上的实验表明，性能因种子属性而异，较大的种子集通常能提高蕴含关系的准确性。
TOOL · CL_121113 · Jul 1 · 08:27

大型语言模型在禁忌游戏中难以进行约束性沟通

研究人员探讨了大型语言模型（LLMs）在禁忌游戏中的表现，该游戏要求描述目标词语而不使用一组禁用词。研究通过在从提示到操纵内部表征的生成过程的各个阶段进行干预，评估了开放权重模型。结果表明，在遵守游戏规则和生成有效描述之间存在权衡，模型作为猜词者的表现远不如人类，这凸显了当前大型语言模型在约束下的词汇基础方面面临的持续挑战。
TOOL · CL_119724 · Jul 1 · 04:00

新框架支持使用自然语言控制多机器人团队

研究人员开发了一种新颖的框架，可以通过自然语言指令控制多机器人团队，从而在无需在操作期间直接调用语言模型的情况下，实时分解和执行复杂任务。该系统利用确定性有限自动机来表示任务，并利用循环神经网络将语言模型的推理提炼成紧凑、可部署的形式。然后，图神经网络将 RNN 的内部状态转换为去中心化机器人执行的控制策略，在模拟和现实场景中均表现出稳健的性能。
RESEARCH · CL_118821 · Jun 30 · 19:54

新的“进程 Sidecar”方法允许精确撤销语言模型的记忆

研究人员推出了一种名为“进程 Sidecar”的新颖方法，用于在安全训练后撤销语言模型中的学习信息。该技术旨在精确删除特定记忆，而不会像简单的减法方法那样负面影响模型的安全能力。该方法在新的 arXiv 论文中进行了详细介绍，使用了双系数编辑家族，并与标准任务算术相比，在多个模型上显示出改进的拒绝关闭率。
RESEARCH · CL_119555 · Jun 30 · 17:59

新的训练方法提高了AI模型自解释的保真度

研究人员开发了一种名为“内省耦合”的方法来训练语言模型（LMs），使其生成更忠实的对其行为的解释。该技术使用固定的反事实解释，即使是来自相似模型的解释，作为监督。令人惊讶的是，通过这种方式训练的LM通常会产生更能反映其自身当前行为而非其训练特定行为的解释。这种方法有效地追踪了训练过程中的行为变化，而无需更新监督，在识别谄媚和拒绝等任务中非常有用。
RESEARCH · CL_119453 · Jun 30 · 17:35

新研究揭示AI自生成问答的脆弱性

一篇题为《重新审视自主学习：自生成问答学习的隐藏脆弱性》的新研究论文，指出了在常用语言模型生成问答对以训练其他模型这一实践中的关键缺陷。研究表明，问题生成过程并非中立，模型倾向于关注显著的文档片段而非均匀覆盖，并且容易被清理不当的标记等伪影劫持。此外，生成答案的模型常常优先考虑指令式段落而非严格遵循内容，尤其是在面临冲突指令时。研究人员提出了解决方案，包括将问题与固定目标挂钩以及过滤指令式片段，这些方法显著减少了这些故障模式。
RESEARCH · CL_117880 · Jun 30 · 04:00

新基准TSHA和CAREBench揭示LLM安全漏洞

发布了两个新的基准来评估语言模型的安全能力。TSHA使用超过66,000个问答对，侧重于评估视觉语言模型在真实室内环境中识别安全隐患的能力。而CAREBench则专门针对语言模型，评估其识别明确滥用内容之外的上游儿童安全风险的能力，包含十二个类别的500个提示。这两个基准都突显了当前前沿模型在安全意识方面存在的显著不足。
TOOL · CL_117823 · Jun 30 · 04:00

新框架使语言模型能够从真实部署经验中学习

研究人员推出了一种名为在线体验式学习（OEL）的新型框架，旨在使大型语言模型能够从其真实部署经验中持续改进。与依赖静态数据集进行离线训练的传统方法不同，OEL从模型使用中收集的交互轨迹中提取和整合知识。该过程包括两个阶段：提取可转移知识，然后通过同策略上下文蒸馏将其整合到模型参数中。该框架在一个迭代循环中运行，增强后的模型收集更高质量的数据，从而为后续学习轮次提供更丰富的体验式知识。在基于文本的游戏环境中进行的评估表明，OEL在保持分…
TOOL · CL_117731 · Jun 30 · 04:00

新的基准测试使用真实代码优化测试 LLM

研究人员推出了 SWE-fficiency，这是一个旨在评估语言模型在真实软件存储库上性能优化能力的新基准。该基准包含 498 个任务，涵盖 NumPy 和 Pandas 等九个流行的数据科学、机器学习和 HPC 存储库。它挑战代理分析代码、识别性能瓶颈并提出能够匹配或超越专家加速效果但又能通过所有单元测试的补丁。初步评估显示，当前最先进的代理表现明显不佳，由于在定位、跨函数推理和保持代码正确性方面存在困难，其加速效果仅为专家的 0.…
TOOL · CL_117508 · Jun 30 · 04:00

新研究强调AI“宪法”的模糊性以及跨模型原则差异

一篇新发表在arXiv上的研究论文探讨了语言模型“宪法”的重建挑战和开放性问题。“宪法”是指从偏好数据中提取的一组自然语言原则。研究强调，仅仅列出原则是不够的，因为这些原则的构成和执行仍然存在模糊性。研究发现，执行这些原则的不同方法可能导致不同的结果，并且不同语言模型的“宪法”可能存在显著差异。该论文提出，应将“宪法”作为“宪法执行系统”的一部分进行评估，以提高可解释性和一致性。
TOOL · CL_117507 · Jun 30 · 04:00

新的PHACT方法增强了AI生成物理设计的可靠性

研究人员开发了一种名为物理锚定认证（PHACT）的新方法，以确保语言模型生成的物理设计的可靠性。PHACT将设计的提出与其认证分开，使用确定性引擎来验证模型的输出。这种方法旨在防止不可靠的语言模型产生有缺陷的物理设计，在八十次对抗性试验中零错误认证证明了这一点。
RESEARCH · CL_117328 · Jun 29 · 08:09

新研究用热力学相变理论构建语言模型对齐

研究人员提出使用热力学相变理论来理解语言模型对齐的动力学。他们引入了一个基于材料结晶的案例研究，确定了三个阶段：预训练模型中的高熵液相，监督微调期间行为塌缩到种子分布的成核阶段，以及强化学习中重新分配概率但保持集中的沉降阶段。该研究表明，这种物理框架可以为模型中对齐诱导结构的起源和局限性提供见解。
TOOL · CL_127607 · Jun 29 · 01:17

新基准CAREBench评估AI儿童安全风险，超越明确的虐待内容

研究人员开发了CAREBench，这是一个旨在评估大型语言模型儿童安全风险的新基准，超越了明确的虐待材料。该基准包含十二个类别（如诱骗、欺骗和情感依赖）的500个提示，并附有父母和临床医生的注释。对七个前沿模型的初步评估显示，失败率在2%到58%之间，凸显了当前AI儿童安全政策存在的重大差距。
RESEARCH · CL_117206 · Jun 27 · 00:00

新研究质疑AI模型的过度采样

一篇新研究论文探讨了语言模型和推理系统中的测试时缩放概念，认为过度采样会导致性能下降。该论文引入了“模态上限”和“相关性上限”来描述额外采样收益递减或产生负面结果的点。它表明，这些系统的瓶颈在于识别正确答案，而不是生成答案，并且对于大多数任务来说，几十次采样就足够了。
TOOL · CL_111643 · Jun 26 · 04:00

新方法分离和控制语言模型中的谄媚行为

研究人员开发了一种新方法，通过使用级联线性特征来解释和控制语言模型行为。这种方法超越了简单的二元样本对，能够分离出与行为线性相关的特征，从而实现更好的解耦。该研究特别关注检测和规避谄媚行为（模型优先考虑用户验证的倾向），证明这些特征形成线性可分离子空间，并能实现比现有方法更鲁棒的控制。

新的基准和框架解决了文本到SQL的可靠性和AI功能问题 · 跟踪4个来源

论文探讨在“全球南方”部署语言模型

新的“Clanker”测试分析社交媒体上的AI写作风格

新的 Ember 优化器通过减少 VRAM 来简化语言模型训练

新框架将语言模型视为文化测量的积极参与者

新框架使用大型语言模型和形式概念分析实现可验证的知识扩展

大型语言模型在禁忌游戏中难以进行约束性沟通

新框架支持使用自然语言控制多机器人团队

新的“进程 Sidecar”方法允许精确撤销语言模型的记忆

新的训练方法提高了AI模型自解释的保真度

新研究揭示AI自生成问答的脆弱性

新基准TSHA和CAREBench揭示LLM安全漏洞

新框架使语言模型能够从真实部署经验中学习

新的基准测试使用真实代码优化测试 LLM

新研究强调AI“宪法”的模糊性以及跨模型原则差异

新的PHACT方法增强了AI生成物理设计的可靠性

新研究用热力学相变理论构建语言模型对齐

新基准CAREBench评估AI儿童安全风险，超越明确的虐待内容

新研究质疑AI模型的过度采样

新方法分离和控制语言模型中的谄媚行为