PulseAugur
实时 09:09:33

LLMs 驱动结构化数据的自动化特征工程

研究人员开发了进化特征工程(EFE),一个利用大型语言模型(LLMs)自动发现结构化数据预处理转换的新框架。EFE将这些转换表示为Python程序,能够无缝集成到现有的机器学习管道中。该框架利用数据集上下文、汇总统计数据和下游性能反馈来优化候选程序。EFE在时间序列预测方面取得了成功,使用Chronos-2等模型将误差降低了3%或更多;在表格预测方面,它演化出了紧凑、可解释的特征程序,其性能与现有的基于LLM的方法相当或更优。 AI

影响 自动化复杂的数据预处理,可能提高各领域机器学习模型的准确性和可解释性。

排序理由 该集群描述了一篇关于使用LLMs进行特征工程的新颖框架的最新研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

LLMs 驱动结构化数据的自动化特征工程

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Ege Onur Taga, Yilin Zhuang, M. Emrullah Ildiz, Petros Mol, Abhimanyu Das, Karthik Duraisamy, Samet Oymak ·

    Evolutionary Feature Engineering for Structured Data

    arXiv:2607.01548v1 Announce Type: cross Abstract: Large language models are increasingly used as open-ended search operators in evolutionary optimization. We introduce Evolutionary Feature Engineering (EFE), a framework for using LLM-based evolution to discover preprocessing tran…