Top2Vec
PulseAugur coverage of Top2Vec — every cluster mentioning Top2Vec across labs, papers, and developer communities, ranked by signal.
3 天有情绪数据
-
研究发现学者在研究方法收敛性方面存在性别差异
一项发表在arXiv上的研究分析了1990年至2022年间图书馆与信息科学领域的25,204篇论文,以调查合作学者在研究主题和方法收敛性方面的性别差异。研究使用Top2Vec方法进行主题识别,并使用CogFT模型进行方法分类,发现与男性学者相比,女性学者在研究方法和主题选择上表现出较低的收敛性。该研究旨在提供一种系统性的方法来理解学术出版中的性别差异,并为研究方法的多元化提供见解。
-
LIS研究方法随数据资源和职业阶段演变 · 追踪4个来源
一项对1990年至2022年图书馆与信息科学(LIS)研究方法的分析研究表明,数据资源是方法论演进的主要驱动力。该研究确定了四类关键的数据驱动方法实体:算法与模型、数据资源、软件与工具以及指标。另一项对1990年至2023年LIS研究的调查发现,尽管理论方法有所下降,但实验方法和文献计量方法已崭露头角,并且方法的多样性在研究人员的不同职业阶段差异显著。
-
新方法使用语言模型聚类预训练Tsetlin Machine以提高可解释性
研究人员开发了一个新颖的框架,通过整合来自BERT等预训练语言模型的知识来增强Tsetlin Machines (TMs) 的可解释性。该方法使用K-means或Top2Vec将文本样本分组为语义聚类,然后用于预训练TM。这种方法使TM能够学习可解释的语义关键词,在保持其固有的透明度的同时,实现了与BERT相当的性能。
-
LIS研究中性别在研究方法和主题探索上的差异 · 已追踪5个来源
研究人员使用Top2Vec进行主题识别,并使用CogFT进行方法分类,分析了1990-2022年间图书馆与信息科学(LIS)领域的25,204篇论文。研究发现,与男性学者相比,女性学者的研究方法和主题选择趋同性较低,凸显了合作研究中的性别差异。另一项研究检查了1990-2023年间的26,677篇LIS文章,揭示了尽管理论方法有所下降,但实验方法和文献计量方法却日益突出。该研究还表明,职业生涯中期的学者展现出最高的方法多样性,而职业生…
-
大型语言模型和主题建模增强对癌症患者经验的分析
一篇新的研究论文探讨了使用基于嵌入的主题建模和大型语言模型(LLMs)来分析癌症护理中的患者经验。该研究评估了BERTopic和Top2Vec在总结个人访谈方面的效果,发现BERTopic更有效。当与GPT-4等大型语言模型结合用于主题标记,并使用BioClinicalBERT等面向临床的嵌入模型时,该方法显示出更高的精确度和可解释性。研究结果表明,该流程可以通过提供患者叙述的见解来增强医疗保健工作流程。