前几天Wired发了一篇关于Anthropic最新研究的报道,读完之后我有点被震撼到。
Anthropic大家都不陌生了,创始人Dario Amodei之前是OpenAI的VP。
他们家一直走的是「安全优先」路线,论文质量在业界公认是顶级的。这次他们放出来的研究主题是混合推理,让AI同时用好几种不同的思考方式来解决问题。
我花了大概两个小时把原论文和相关报道看完,说实话,有些观点跟我之前对AI发展的判断不太一样。
1️⃣ AI不需要一种「最聪明」的思考方式,它需要的是会「挑」
这篇论文的核心观点来自Anthropic的研究团队。
他们认为,现在所有大模型本质上都在用同一种方式思考,就是所谓的链式推理(Chain of Thought),一步一步往前推。
但问题是,真实世界里的问题千奇百怪,有的问题适合一步一步算,有的问题适合靠直觉,有的问题适合类比推理。
Anthropic提出的方案是让AI自己判断,面对不同的问题,选择最合适的推理策略。就好比人一样,算数学题的时候你会一步步推导,但判断一个人是不是在骗你的时候,你靠的是直觉和经验,不会列个公式。
这个思路其实在认知科学里并不新鲜,心理学家Daniel Kahneman在《思考,快与慢》里早就提出过,人有两套思维系统,系统1是直觉快速但容易出错,系统2是慢速推理但更准确。
Anthropic做的事情,某种程度上就是在教AI学会在这两套系统之间切换。
2️⃣ 不是让模型更大,是让模型更「聪明地偷懒」
这个观点让我印象特别深。现在整个行业的叙事都是模型越大越好,参数越多越强。但Anthropic的研究暗示,与其把所有计算力都堆在一个方向上,不如让模型学会在简单问题上少算一点,把算力留给真正需要深度思考的部分。
说白了就是效率问题。
你不可能每个问题都用上全部算力,那样太浪费了。但现在的模型不管是回答「1+1等于几」还是「请分析地缘政治对半导体供应链的影响」,花的精力差不多,这本身就很不合理。
业界也有不同的声音。
有些研究者认为,与其做这种复杂的多策略切换,不如把基础模型做得足够大,让它自然涌现出各种能力。OpenAI那边似乎更偏向这个路线。
但我觉得Anthropic的思路有一个好处,就是可解释性更强。你知道AI在用哪种方式思考,出了问题也更容易排查。
3️⃣ 这可能是通向AGI的一条被忽视的路
现在大家讨论AGI,焦点基本都在Scaling Law上,就是更多数据、更多算力、更大模型。
但Anthropic这篇论文提供了一个不同的视角,也许通向AGI的关键不在于单体能力的无限提升,而在于能否灵活组合多种认知能力。
这个观点如果成立的话,对整个行业的意义还挺大的。
意味着一些算力没那么强的团队,也有可能通过巧妙的架构设计来追赶巨头。当然,这还只是研究阶段,离真正落地还有距离。
2026年的AI会怎么走?也许答案不在于谁买了最多的GPU,而在于谁最先想明白了AI应该怎么思考。
发布于 上海
