SentenceTransformer
PulseAugur coverage of SentenceTransformer — every cluster mentioning SentenceTransformer across labs, papers, and developer communities, ranked by signal.
2 天有情绪数据
-
Fixing local LLM knowledge bases requires better retrieval, not new models
Setting up a local LLM knowledge base often yields poor results due to issues in the retrieval pipeline, not the model itself. Common problems include inadequate chunking that splits sentences or groups unrelated conten…
-
RAG 系统通过集成外部数据检索来增强 LLM
检索增强生成(RAG)系统是通过允许大型语言模型(LLM)访问和利用外部、最新的信息来增强 LLM 的关键技术。RAG 通过在生成响应之前检索相关数据来解决 LLM 的知识截止日期和上下文窗口限制等局限性。这种方法与微调不同,微调会修改模型的行为而不是其知识库。构建 RAG 系统涉及两个主要管道:用于准备和存储数据的摄取管道,以及为每个用户查询获取上下文的检索管道。
-
研究人员开发使用神经方法为命令式程序构建图
研究人员开发了一个管道,将命令式程序及其注解转换为类型化、属性化的图。该过程结合了抽象语法树解析与来自 SentenceTransformer 和 CodeBERT 等模型的语义嵌入。目标是识别程序之间的结构和语义相似性,以便重用验证工件。使用 C、Java 和 Dafny 进行的实验证明了跨不同语言和注解风格创建一致图表示的能力。