实体 EleutherAI

EleutherAI

PulseAugur coverage of EleutherAI — every cluster mentioning EleutherAI across labs, papers, and developer communities, ranked by signal.

总计 · 30天

8

90 天内 8

发布 · 30天

0

90 天内 0

论文 · 30天

5

90 天内 5

层级分布 · 90 天

significant 1
research 3
tool 4

主题

最近 · 第 1/1 页 · 共 8 条

TOOL · CL_79860 · Jun 9 · 04:00

LogNEO框架使用GPT-Neo进行实时日志异常检测

研究人员开发了LogNEO，一个使用EleutherAI的GPT-Neo模型检测系统日志中异常的新框架。该系统采用了一种新颖的强化学习方法，并结合了位置感知奖励机制和交叉熵正则化。LogNEO在标准基准测试中取得了高F1分数，在召回率方面优于先前最先进的方法，并且已在生产环境中得到验证，具有低延迟和高吞吐量。
TOOL · CL_31715 · May 14 · 13:39

使用Qwen2.5-0.5B评估LLM的成本低于1美元

这篇博文详细介绍了一种经济高效的评估大型语言模型的方法，证明了运行全面的基准测试的成本可以低于一美元。作者使用免费的Google Colab T4实例在三个不同的任务上测试了Qwen2.5-0.5B模型：GSM8K用于数学推理，HellaSwag用于常识，TruthfulQA-MC2用于真实性。实验重点是测量运行时间和成本，利用lm-evaluation-harness并进行特定调整以优化性能和降低费用，例如限制生成令牌的长度。
RESEARCH · CL_14791 · May 4 · 15:28

AI Safety Bootcamp Oxford 提供技术和通才方向

OAISI 将于 2026 年 6 月 28 日至 7 月 10 日在牛津举办第四届人工智能安全研究训练营 (ARBOx4)。该项目提供两个方向：技术研究方向侧重于机器学习安全技术，新设立的通才方向则面向人工智能安全领域的非研究岗位。ARBOx4 旨在为参与者提供实践技能和知识，以促进人工智能安全领域的发展，往届学员已在领先的组织和大学获得职位。
RESEARCH · CL_09277 · Apr 29 · 16:45

AI模型评估正成为昂贵的瓶颈，成本已超越训练费用

AI模型评估正变得成本高昂，近期基准测试的成本高达数万美元，并消耗数千个GPU小时。对于本质上更复杂且对设置变化敏感的基于代理的评估而言，这种高成本尤为突出。虽然存在通过子采样降低静态基准测试成本的方法，但这些技术对于基于代理的评估的动态和嘈杂特性效果不佳，从而造成了研发瓶颈。
RESEARCH · CL_00954 · Jul 30 · 22:00

EleutherAI发布开源工具用于解释AI模型特征

EleutherAI发布了一个开源库，用于自动解释稀疏自编码器中的特征，这是一种用于分解模型激活的方法。该工具利用Llama 3.1和Claude 3.5 Sonnet等大型语言模型为这些特征生成自然语言解释，与之前的手动方法相比，大大降低了成本和工作量。该库旨在使社区更容易研究这些可解释的特征。
SIGNIFICANT · CL_00112 · Jul 24 · 00:00

OpenAI推出欧盟人工智能蓝图2.0，签署欧盟行为准则

OpenAI发布了其欧盟经济蓝图2.0，旨在通过培训20,000家中小型企业并为青年安全研究提供资助，促进人工智能在欧洲的普及。该倡议突显了人工智能潜力超出欧盟当前使用水平的“能力过剩”现象，数据显示成员国之间存在显著差异。OpenAI还宣布有意签署欧盟通用人工智能行为准则，以符合欧盟人工智能法案的框架，并强调人工智能开发中的信任与安全。
RESEARCH · CL_00966 · May 23 · 00:00

Safetensors 库经安全审计，将成为机器学习模型的默认格式

由 Hugging Face 与 EleutherAI 和 Stability AI 合作开发的 safetensors 库已通过 Trail of Bits 的安全审计，确认其安全性。此次审计使这些组织能够朝着使 safetensors 成为保存和加载机器学习模型的默认格式迈进，取代 PyTorch 使用的不太安全的 pickle 格式。该库具有加载速度更快和延迟加载等优势，现在将在 transformers 库中默认安装。
RESEARCH · CL_00875 · May 15 · 00:00

RWKV 项目复兴 RNN，挑战 Transformer 在大语言模型中的主导地位

RWKV（Receptance Weighted Key Value）项目引入了一种新颖的架构，它复兴了循环神经网络（RNN），同时融入了通常在 Transformer 中发现的优势。这种方法旨在克服传统 Transformer 的扩展限制，尤其是在训练和推理方面，同时在推理基准测试中保持具有竞争力的性能。RWKV 项目的特点是其分布式、国际化且主要由志愿者驱动的社区，这与早期 EleutherAI 的努力有相似之处。