PulseAugur
实时 13:18:23
实体 Alkis Polyzotis

Alkis Polyzotis

PulseAugur coverage of Alkis Polyzotis — every cluster mentioning Alkis Polyzotis across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_23540 ·

    Databricks 使用 MemAlign 改进 AI 生成的 ML 代码评估

    Databricks 开发了 MemAlign,一个与 MLflow 集成的开源对齐框架,用于增强其 Genie Code 工具生成的机器学习代码的评估。初步的人类专家标注显示,LLM 裁判和人类专家之间存在显著差异,在 3 分制评分中平均误差高达 0.68。通过使用大约 50 个标注示例的 MemAlign,Databricks 在最不匹配的维度上成功将错误率降低了 74-89%,证明了该框架在缩小 AI 生成代码质量与专家标准之间…