Wikipedia · PulseAugur

研究发现，医疗领域大语言模型在跨语言事实核查方面存在显著差异

一篇新的arXiv论文强调，在回答医疗相关问题时，大语言模型（LLMs）在不同语言之间存在显著的事实准确性差异。研究人员从维基百科创建了一个多语言数据集，以分析跨语言覆盖范围和LLM响应的一致性。研究发现，即使在其他语言提示下，LLMs也倾向于更紧密地与英文维基百科内容保持一致。然而，在推理过程中提供来自非英文维基百科的上下文信息，可以提高与文化相关知识的事实一致性，这为在医疗领域构建更公平的多语言AI系统指明了方向。

COMMENTARY · CL_130278 · Jul 7 · 13:23

维基百科面临来自人工智能、MAGA和外国势力的生存威胁

维基百科正面临来自各种来源的重大威胁，包括MAGA等政治团体、外国政府以及人工智能的兴起。据《纽约时报》报道，这个被认为是互联网上最大的免费知识库正处于危险之中。据报道，一位经验丰富的前大使正在协助维基百科应对这些挑战并保护其完整性。

RESEARCH · CL_128513 · Jul 6 · 01:03

LLM 知识库研究发现直接访问比渐进式披露更有效

一篇新发表在 arXiv 上的研究调查了 LLM 维护的知识库的渐进式披露的效率。与最初的假设相反，一个有能力的工具使用代理并没有加载索引，而是直接从问题中推断出页面路径。研究发现，虽然渐进式披露的特定节省并未实现，但总体成本显著降低，质量与基线方法相当。节省的成本归因于更具针对性的访问，从而减少了引用的页面和工具调用次数。

COMMENTARY · CL_126012 · Jul 5 · 09:00

《纽约时报》探讨AI对营销、哲学工作和维基百科的影响

《纽约时报》正在探讨AI在各行业的广泛影响。一篇文章审视了如何利用泰勒·斯威夫特的婚礼进行营销，突显了名人和品牌战略在数字时代的交汇。另一篇文章讨论了哲学专业毕业生在就业市场上的复苏，尤其是在AI行业内，这表明对批判性思维和伦理推理能力的需求日益增长。最后，第三篇文章深入探讨了维基百科在AI兴起和埃隆·马斯克等人物影响下，为维护其完整性和相关性所做的斗争，将其描绘成一场关于在线信息未来的战斗。

COMMENTARY · CL_125520 · Jul 4 · 19:47

品牌利用Reddit和Wikipedia操纵AI搜索

公司正在利用Reddit和Wikipedia等公共平台来操纵AI搜索结果。这种被称为答案引擎优化（AEO）的做法，涉及注入品牌文本片段，然后AI工具会将这些片段纳入其响应中。研究人员认为这种方法很容易实现，并可能导致通过AI搜索推广垃圾邮件甚至恶意软件的现象增加。

COMMENTARY · CL_125011 · Jul 4 · 09:24

大型语言模型可能通过提供中立信息来源来减少社会极化

大型语言模型（LLMs）和其他人工智能技术的广泛采用可能导致社会极化程度的下降。与经常放大分裂内容的社交媒体平台不同，LLMs被视为更接近维基百科等中立信息来源。这种信息消费模式的转变有可能培养用户不那么极化的观点。

COMMENTARY · CL_124864 · Jul 4 · 07:00

AI 生成内容影响维基百科、英国 Facebook 页面和澳大利亚政治 · 跟踪 3 个来源

多个来源报道了 AI 生成内容在各个领域日益增长的存在和影响。维基百科正面临“参与度农场”的问题，即自动化工具操纵用户互动，引发了对平台真实性的质疑。此外，Facebook 页面被用来传播针对英国的仇恨性 AI 生成内容，引发了对虚假信息传播和社交媒体监管的调查。在澳大利亚，总理 Albanese 回应了一场 AI 梗图宣传活动，凸显了 AI 在政治话语中日益增长的作用。

COMMENTARY · CL_124054 · Jul 3 · 13:46

人工智能公司的数据抓取威胁着免费在线知识资源

用户担心人工智能公司正在抓取海量的集体在线信息，例如维基百科、Reddit和Stack Overflow等，来训练他们的模型。这些通过免费用户劳动产生的数据，可能很快就会被人工智能公司锁定在付费墙或基于代币的定价后面。人们担心像Stack Overflow这样的宝贵资源可能会因为这些货币化策略而被下线，导致可访问知识的损失。

TOOL · CL_123367 · Jul 3 · 04:00

WikiCLIP 以 LLM 嵌入提供高效的视觉实体识别

研究人员推出 WikiCLIP，一个新颖的对比学习框架，用于高效的开放域视觉实体识别。该方法利用大型语言模型嵌入，并通过视觉引导知识适配器增强，以在补丁级别对齐文本和视觉信息。WikiCLIP 在 OVEN 等基准测试中展示了显著的性能提升，在未见过的数据上实现了 16% 的增益，同时与现有生成模型相比，推理延迟大大降低。

MEME · CL_122714 · Jul 2 · 23:55

Google AI 搜索广告被指抄袭维基百科内容

一位 Mastodon 用户指出，Google 的 AI 搜索广告似乎抄袭了维基百科文章的内容。该广告通过链接分享，展示了 AI 在没有适当引用来源的情况下复制现有文本的能力。

COMMENTARY · CL_122028 · Jul 2 · 12:19

维基百科考虑访问控制，引发“封闭互联网”担忧

据报道，维基百科正在考虑实施访问控制，并可能对API使用收费，此举被一些人批评为限制信息访问。这一潜在转变被认为与对“封闭互联网”和信息网关控制的担忧相似。

COMMENTARY · CL_120813 · Jul 1 · 20:23

提出评估信息价值的框架，超越单纯的真实性

作者提出了一个框架，用于评估在广泛错误信息时代信息的价值。他们认为，有价值的信息不仅由真实性定义，还由其对个人的有用性和相关性定义。所提出的方法借鉴了伊壁鸠鲁的“多重解释原则”，涉及考虑多个假设，并根据其潜在的真实性、价值或有用性对其进行优先排序。信息的价值被构建为信息与观察者之间的关系属性，可以通过其对个人现实存在的影响以及他们做出有意义选择的能力来量化。

RESEARCH · CL_120627 · Jul 1 · 18:00

研究发现AI聊天机器人能令人信服地模仿公众人物

发表在PLOS One上的一项新研究显示，AI聊天机器人（特别是GPT-4 Turbo）能够令人信服地模仿公众人物，生成的回复被认为比真人更真实、更连贯。研究人员提示AI模仿了来自英国的112位公众人物，使用了他们维基百科传记的信息以及BBC节目“Question Time”的格式。参与者认为AI生成的回复优于真实辩手的回答，这凸显了AI驱动的虚假信息带来的重大风险，尤其是在政治背景下。

TOOL · CL_117582 · Jun 30 · 04:00

LLM投票集成增强了Mathswitch中的数学概念分类

研究人员开发了一种方法，使用大型语言模型（LLMs）的投票集成来过滤Mathswitch中的噪声数据。Mathswitch是一个开源项目，它从Wikidata和Wikipedia等各种来源聚合数学概念记录。该研究评估了LLM集成对Wikidata条目进行分类的能力，并比较了有无数据库标识符时的性能。对LLM裁判与MathWorld之间的分歧进行了分类，以指导改进Mathswitch中数据准确性和概念链接的策略。

TOOL · CL_117221 · Jun 30 · 03:39

新的 AI 架构 Synapedia 使用事件定义概念

一种名为 Synapedia 的新 AI 架构提出，不仅根据概念的属性来定义它们，还要根据它们关联的事件来定义。这一方法在研究论文中有所详述，认为现有的 AI 知识系统（如 WordNet 和 Wikidata）存在根本性缺陷，因为它们没有将事件视为一等定义公民。通过纳入诸如马车的“运输”或银行的“存款”等事件，Synapedia 旨在创建一个更完整、更无歧义的词汇表。该论文还包含一个使用维基百科和 LLM 来引导构建这种新字典的 P…

RESEARCH · CL_117297 · Jun 29 · 11:29

新方法将语法性别与语言模型中的语义偏差分离开来

研究人员开发了一种新方法，用于将语法性别与语境化语言嵌入中的语义偏差分离开来，特别解决了西班牙语等性别语言中的问题。该方法利用受控模板和自然维基百科语境来创建不含偏见的や物名词数据集。设计了一个包含质心、支持向量机（SVM）和线性判别分析（LDA）估计器的框架，以及新颖的加权策略，以评估这种分离的有效性。

TOOL · CL_117088 · Jun 29 · 09:03

研究发现：移动端维基百科浏览量可指示实时旅游活动

一项发表在arXiv上的新研究探讨了使用移动端维基百科页面浏览量作为实时旅游活动指标的潜力。研究人员发现，更有可能反映即时、现场信息需求的移动端浏览量，与当天酒店预订和景点游客出席情况呈正相关。这与桌面端页面浏览量不同，后者似乎捕捉的是更长远、分散的兴趣。研究表明，这种移动端维基百科流量为即时预测旅游趋势提供了一种透明且可复制的方法，尤其是在以休闲为重点的目的地。

COMMENTARY · CL_114599 · Jun 28 · 13:08

人工智能的进步引发了对现实扭曲和哲学影响的担忧

作者对人工智能的快速发展表示担忧，并将其与太空竞赛进行类比。他们强调了人工智能聊天机器人将虚构实体误认为现实、人工智能系统被不易察觉的图像修改所操纵，以及长期人机交互的心理影响（包括聊天机器人精神病和幻觉）等问题。文章还触及了诸如奇点、反出生主义、超人类主义和后人类主义等哲学概念，并指出人工智能正在基于反映这些不同信仰体系的数据进行训练。文章特别对SpaceX的“Starmind”卫星星座及其与XAI的合作表示担忧，认为这标志着朝着可…

COMMENTARY · CL_114001 · Jun 27 · 23:59

AI已超越维基百科成为百科信息首选来源

一篇社交媒体帖子指出，维基百科作为信息主要来源已变得过时。作者提到，人工智能现在是获取百科知识的首选途径，这表明人们获取和信任信息的方式正在发生转变。

TOOL · CL_110938 · Jun 25 · 18:08

开发者推出免费RAG API，供本地LLM访问医疗事实

一位开发者创建了一个免费的检索增强生成（RAG）API，该API使本地大型语言模型（LLM）能够访问维基百科上的医疗事实。该API可在hyfl.uk访问，目标是实现亚秒级响应时间，并使用约2GB的RAM。它已被证明能显著提高LLM的准确性，防止幻觉并提供正确的医疗信息，如一个示例所示，其中一个LLM在启用RAG后准确描述了Lhermitte征，而之前则给出了虚构的回答。