PulseAugur
实时 23:45:04
English(EN) Beyond Acoustic Emotion Recognition: Multimodal Pathos Analysis in Political Speech Using LLM-Based and Acoustic Emotion Models

基于LLM的分析在政治演讲情感方面超越声学模型

研究人员开发了一种多模态方法来分析政治演讲中的 pathos,其性能优于传统声学情感识别模型。该研究使用了 Gemini 2.5 Flash 和一个 LLM 主管集成,发现 Gemini 的效价得分与 TRUST-Pathos 得分高度相关。这种基于 LLM 的方法在捕捉语义定义的政治情感方面比单独的声学模型更有效,尽管声学特征仍然能提供关于唤醒水平的见解。 AI

影响 基于LLM的多模态分析比单独的声学方法提供了对政治演讲情感更细致的理解。

排序理由 该集群包含一篇学术论文,详细介绍了使用LLM和声学模型分析语音情感的新方法。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Juergen Dietrich ·

    超越声学情感识别:使用基于LLM和声学情感的多模态 pathos 分析政治演讲

    arXiv:2605.22732v1 Announce Type: cross Abstract: We investigate whether acoustic emotion recognition models can serve as proxies for the Pathos dimension in political speech analysis, as operationalised by the TRUST multi-agent large language model (LLM) pipeline. Using a Bundes…

  2. arXiv cs.AI TIER_1 English(EN) · Juergen Dietrich ·

    超越声学情感识别:使用基于LLM和声学情感的多模态 pathos 分析政治演讲

    We investigate whether acoustic emotion recognition models can serve as proxies for the Pathos dimension in political speech analysis, as operationalised by the TRUST multi-agent large language model (LLM) pipeline. Using a Bundestag plenary speech by Felix Banaszak (51 segments,…