PulseAugur
实时 04:50:11
English(EN) TailedTS: Benchmark Dataset for Heavy-Tailed Time Series Prediction and Periodicity Quantification

新的TailedTS数据集以重尾数据挑战时间序列模型

研究人员推出了TailedTS,这是一个新的基准数据集,旨在评估时间序列预测模型在表现出重尾、零膨胀和非高斯分布的数据上的性能。TailedTS源自维基百科页面浏览量数据,包含约246.9亿个数据点,突显了少数页面获得了大部分浏览量,从而为模型鲁棒性创建了一个具有挑战性的测试平台。该数据集还通过非高斯损失函数促进了周期性量化和标准化预测基准的研究,并揭示了标准估计器在高流量数据上的表现不佳。 AI

影响 引入了一个新的数据集,以提高时间序列预测模型在面对极端波动性和非高斯分布时的鲁棒性。

排序理由 该集群描述了一个新的学术基准数据集的发布。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv stat.ML 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的TailedTS数据集以重尾数据挑战时间序列模型

报道来源 [1]

  1. arXiv stat.ML TIER_1 English(EN) · Xinyu Chen, HanQin Cai, Lijun Ding, Jinhua Zhao ·

    TailedTS: Benchmark Dataset for Heavy-Tailed Time Series Prediction and Periodicity Quantification

    arXiv:2605.16361v1 Announce Type: cross Abstract: We present TailedTS, a large-scale benchmark dataset derived from Wikipedia hourly page view observations throughout 2024, specifically designed to test time series forecasting models under heavy-tailed, zero-inflated, and non-Gau…