Lookspan,一款本地优先的 LLM 应用可观测性工具,发布了 0.4.0 版本,引入了用于评估 LLM 输出的数据集和实验功能。新版本允许用户定义测试集,批量运行应用,并使用 LLM 作为评判者来评分结果,为提示改进提供量化指标。该工具捕获 LLM 调用跟踪,包括提示和响应,并支持回放和差异比较这些跟踪以捕获回归,同时将数据保留在用户本地机器上。 AI
影响 通过提供本地、可量化的提示和模型变更评估能力,增强了 LLM 开发工作流程。
排序理由 这是 LLM 应用开发软件工具的新版本发布。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →