National Library of Israel
PulseAugur coverage of National Library of Israel — every cluster mentioning National Library of Israel across labs, papers, and developer communities, ranked by signal.
2 天有情绪数据
-
新的SIFT方法提高了LLM事实核查的准确性
研究人员开发了一种名为SIFT(声明条件式重评分)的新方法,以提高使用大型语言模型(LLM)的事实核查系统的准确性。这些系统经常错误地将声明标记为支持,即使提供的证据不能完全证明它们。SIFT通过针对完整声明重新评分提取的证据来解决这个问题,并与WSP(保证支持比例)配对,WSP是一种验证证据是否包含声明的NLI检查。在多个基准上的评估表明,SIFT显著恢复了准确性并提高了事实核查输出的可靠性。
-
Apple ML Research:标注需求因评估指标而异
Apple Machine Learning Research 发表了一篇论文,详细介绍了一种名为“Metric-Dependent Annotation Saturation”(依赖于指标的标注饱和度)的方法。该方法提出,从标签分布中捕获有意义信号所需的标注者数量取决于所使用的具体评估指标。例如,在自然语言推理(NLI)模型中,实现熵相关性收敛比实现分布匹配需要更多的标注者。研究还强调,软标签(代表细微的决策边界)比独热标签提供更好…
-
研究人员寻求用于不完美LLM文本的句法鲁棒NLI
一位r/MachineLearning的用户正在寻找对句法不完美具有鲁棒性的自然语言推断(NLI)方法的研究。他们指出,虽然NLI用于验证自回归LLM的声明,但来自扩散模型生成的句法噪声可能会使这种方法复杂化。用户特别询问了句法鲁棒NLI的最新技术。
-
LLM改进NLI数据集错误检测和模型微调
一个名为EVADE的新框架使用大型语言模型(LLM)为自然语言推断(NLI)数据集中的错误检测生成和验证解释。该方法旨在降低传统两轮人工标注方法的成本和精力。实验表明,LLM验证的错误移除比人工识别的错误移除更能有效地提高NLI模型的微调性能,这表明LLM可以提高数据集的质量和可扩展性。