研究人员发现,语义缓存系统在离线评估与实际部署中的性能之间存在显著差距。PR-AUC等标准指标未能考虑固定阈值下的实际可用性,导致选择不当。提出了新的指标,精确缓存命中率(P-CHR)AUC和校准保留率(CRR),以更好地衡量缓存性能以及部署过程中发生的质量下降。研究结果表明,改进语义缓存主要是一个校准问题,而非仅仅是数据扩展问题。 AI
影响 强调了在LLM推理优化中需要更好的评估指标,可能带来更具成本效益的部署。
排序理由 该集群包含一篇发表在arXiv上的研究论文,详细介绍了评估语义缓存系统的新指标。
- alphaXiv
- arXiv
- Calibration Retention Rate (CRR)
- CatalyzeX Code Finder for Papers
- CORE Recommender
- DagsHub
- Gotit.pub
- Hugging Face
- Influence Flower
- PR-AUC
- Precision-Cache Hit Ratio (P-CHR) AUC
- ScienceCast
- Aditeya Baral
- all-MiniLM-L6-v2
- Memcached
- OpenAI
- pgvector
- PostgreSQL
- Redis
- Spring AI
AI 生成摘要 · Google Gemini · 来自 4 个来源。 我们如何撰写摘要 →