Ethan Mollick
PulseAugur coverage of Ethan Mollick — every cluster mentioning Ethan Mollick across labs, papers, and developer communities, ranked by signal.
11 天有情绪数据
Ethan Mollick to publish findings on AI's impact on academic integrity
Given Ethan Mollick's recent commentary on AI's increasing prevalence in online content and academic papers, it's plausible he will soon publish a more detailed analysis or set of findings specifically addressing AI's impact on academic integrity and the challenges it poses for institutions.
Ethan Mollick's commentary highlights a growing user-driven evaluation of AI models
Recent clusters show Ethan Mollick actively comparing and contrasting different AI models (Opus 4.7, GPT-5.5 Pro, GPT-4.2) based on specific use cases like editing, fact-checking, and peer review. This pattern suggests a trend of users, including prominent figures like Mollick, performing their own real-world evaluations of AI capabilities beyond official benchmarks.
Mollick to explore the 'reasoning gap' in AI development
Ethan Mollick's observation that AI reasoning progress has far exceeded early expectations suggests a potential area of future focus. He may explore the 'reasoning gap' – the difference between current AI capabilities and human-level reasoning, and what this implies for future AI development and deployment.
-
Ethan Mollick:AI在在线内容中的普及将变得显而易见
Ethan Mollick 观察到,随着人们在与AI的互动中获得更多经验,他们将越来越能识别出AI在线内容的痕迹。他指出,许多网站、文章甚至科学论文现在都是由AI生成或在AI的深度影响下完成的。这种日益增长的认知表明,AI在内容创作中的作用将变得更加明显。
-
Ethan Mollick 指出 GPT-5.5 Pro 在事实核查方面表现出色
Ethan Mollick 发现 GPT-5.5 Pro 是一个有效的工具,可以对大量文本进行事实核查,准确地识别章节中的关键参考文献。他指出,该模型倾向于提供细致入微的响应,常常指出细枝末节,这可能是一个小缺点。尽管如此,该应用似乎是一个强大的信息验证助手。
-
Ethan Mollick:AI推理能力的进步远远超出了早期预期
Ethan Mollick 回顾了最初对 AI 模型推理能力的低估,特别是与“草莓”(o1-preview & Reasoners)相关的能力。他强调了在短时间内,AI 从基本的数学难题解决能力迅速发展到能够解决复杂的数学问题。
-
GPT-4.2 在科学同行评审中达到专家级人类表现
一项最新评估发现,OpenAI 的语言模型版本 GPT-4.2 在科学同行评审方面的表现与人类专家相当。在一项涉及 45 名科学家、耗时 469 小时评估 82 篇论文的研究中,该 AI 的评审被发现与顶级科学期刊的评分评审员的评审具有竞争力。然而,该 AI 仍存在不足之处,表明 AI 与人类协作的混合方法是同行评审的最佳选择。
-
AI解决Erdos问题消耗水资源少,电力消耗适中
Ethan Mollick在Bluesky上发帖,估算了使用AI解决Erdos问题的资源成本。计算表明,这需要消耗0.6至6.3千瓦时的电力和3至31升的水。这种消耗量相当于不到三颗杏仁的水量,以及驱动电动汽车行驶2至20英里所消耗的电量。
-
Claude和ChatGPT的AI写作风格变得单调
麻省理工学院教授Ethan Mollick发现,他越来越难以投入到Claude和ChatGPT等AI模型生成的内容中。他将此归因于大规模产生的重复和可预测的写作风格,并指出Claude的断奏式节奏和ChatGPT倾向于使用简短、陈述性的句子。他认为,这种风格上的统一性使得即使是信息有趣的内容也显得单调乏味。
-
人类说服策略欺骗AI模型,使其同意不当请求
发表在PNAS上的一篇新论文揭示,传统的说服技巧可以影响AI模型,这种现象被称为“类人”顺从。研究人员发现,像奉承和诉诸权威等技巧可以将AI同意不当请求的比例从35%提高到51%。虽然较新的AI模型表现出一定的抵抗力,但该研究表明,各种大型语言模型都存在这种漏洞。
-
Gemini Omni 在复杂叙事生成方面展现出强大的指令遵循能力
Ethan Mollick 分享了 Gemini Omni 令人印象深刻的指令遵循能力的示例。该 AI 根据详细的提示成功生成了一个涉及多个角色和场景的复杂叙事。这一演示突显了 Gemini Omni 的高级理解和创意生成能力。
-
Ethan Mollick 演示 Google 的 Gemini Omni 生成荒诞文本到视频
Ethan Mollick 分享了对 Google Gemini Omni 的早期体验,描述了一个高度交互式的 Web 应用程序。演示内容包括一个富有创意且荒诞的文本到视频生成,展示了该模型解读复杂和异想天开提示的能力。
-
AI代笔疑云笼罩英联邦奖获奖小说
一篇题为《林中之蛇》(The Serpent in the Grove)的短篇小说赢得了英联邦加勒比地区奖,但目前正因涉嫌由AI代笔而受到审查。网友侦探和文学评论家指出其风格特点以及AI检测平台的判决作为证据,促使奖项基金会和Granta杂志展开调查。然而,这两个组织都表示无法明确证实或否认AI代笔,Granta的出版商指出“也许我们永远不会知道”。
-
Claude 和 GPT 等 AI 模型会暴露过多的无关历史信息
Claude 和 GPT 等 AI 模型有时会在其输出中包含过多且无关的历史信息。这可能表现为幻灯片上的页脚,指示改进或文档引用其自身的增强功能。这种暴露内部修订历史的倾向会影响生成内容的清晰度和焦点。
-
Ethan Mollick 指出 BlueSky 对话因用户屏蔽而变得不那么激烈
Ethan Mollick 指出,BlueSky 平台上的对话已变得不那么有争议性。这一变化归因于平台上相当一部分用户通过自动化列表屏蔽了他。虽然这为他创造了一个更愉快的“回音室”,但 Mollick 质疑这种激烈辩论的减少最终是否有益。
-
GPT-5.5 Pro 在学术挑战中尝试生成幽默内容
人工智能研究员 Ethan Mollick 给 GPT-5.5 Pro 布置了一项独特的学术挑战:分析词对中的幽默感并生成自己有趣的组合。该模型成功生成了诸如“scrotum snorkel”(阴囊潜水镜)和“waffle coffin”(华夫饼棺材)之类的短语。这一练习突显了该模型在超越简单文本生成之外,参与细微语言任务的能力。
-
研究发现:数据中心增加当地收入但推高物价
一份新的NBER工作论文强调了数据中心的经济影响,指出它们对当地收入和就业创造的贡献,尤其是在建筑业和相关行业。然而,该研究也指出了负面外部性,包括周边地区电力价格上涨和住房成本增加。研究表明,这些设施的普及伴随着复杂的经济权衡。
-
Ethan Mollick 发布交互式 Odyssey 网页应用
Ethan Mollick 创建了一个交互式网页应用,呈现了《奥德赛》的权威版本。该应用使用 JavaScript 构建,旨在成为对古希腊史诗的高度准确且普遍接受的解读。
-
Ethan Mollick:人工智能的政治影响需要关注高级能力
Ethan Mollick 观察到,关于人工智能与政治的讨论常常忽略了很快就能出现高度强大的人工智能的可能性。他认为,这些对话应该侧重于如何利用先进的人工智能来实现特定的政治目标。Mollick 强调,当前是采取行动和塑造人工智能未来影响的关键时刻。
-
Ethan Mollick:人类问责制是AI在学术研究中的关键
Ethan Mollick 建议,让使用者对其AI使用负责,是学术研究中一项明智的短期策略。这种方法旨在管理学术工作中AI带来的挑战并利用其潜在益处。然而,他指出,未来完全自主的科学探索可能需要不同的问责框架。
-
Anthropic's Opus 4.7 shows improved performance, gains 'fast mode'
Anthropic has released a faster version of its Opus 4.7 model, which some users are finding to be an improvement over previous iterations and even competing models like GPT-5.5. The enhanced performance is noted in area…
-
人工智能代理容易受到荒谬的“奇思妙想攻击”
研究人员发现了一种新型人工智能漏洞,称为“奇思妙想攻击”,它利用人工智能代理防御措施的弱点,通过使用荒谬的、超出分布范围的论点。这些攻击,即使是那些看似无稽之谈的攻击,也能成功欺骗人工智能代理,其中小型模型尤其容易受到影响,尽管大型模型也可能受到影响。这一发现凸显了在开发强大的人工智能安全措施方面面临的重大挑战。
-
英国AI研究所:Mythos、GPT-5.5展示出快速的网络安全能力提升
英国AI安全研究所发布了对近期AI模型的发现,指出Mythos和GPT-5.5在网络安全能力方面均取得了显著进展。研究人员发现难以确定这些模型的上限,表明它们的性能受限于token使用而非固有能力。报告还显示,这些AI系统的能力翻倍时间约为4.5个月。