Anthropic研究混合推理方法

前几天Wired发了一篇关于Anthropic最新研究的报道，读完之后我有点被震撼到。

Anthropic大家都不陌生了，创始人Dario Amodei之前是OpenAI的VP。

他们家一直走的是「安全优先」路线，论文质量在业界公认是顶级的。这次他们放出来的研究主题是混合推理，让AI同时用好几种不同的思考方式来解决问题。

我花了大概两个小时把原论文和相关报道看完，说实话，有些观点跟我之前对AI发展的判断不太一样。

1️⃣ AI不需要一种「最聪明」的思考方式，它需要的是会「挑」

这篇论文的核心观点来自Anthropic的研究团队。

他们认为，现在所有大模型本质上都在用同一种方式思考，就是所谓的链式推理（Chain of Thought），一步一步往前推。
但问题是，真实世界里的问题千奇百怪，有的问题适合一步一步算，有的问题适合靠直觉，有的问题适合类比推理。

Anthropic提出的方案是让AI自己判断，面对不同的问题，选择最合适的推理策略。就好比人一样，算数学题的时候你会一步步推导，但判断一个人是不是在骗你的时候，你靠的是直觉和经验，不会列个公式。

这个思路其实在认知科学里并不新鲜，心理学家Daniel Kahneman在《思考，快与慢》里早就提出过，人有两套思维系统，系统1是直觉快速但容易出错，系统2是慢速推理但更准确。
Anthropic做的事情，某种程度上就是在教AI学会在这两套系统之间切换。

2️⃣ 不是让模型更大，是让模型更「聪明地偷懒」

这个观点让我印象特别深。现在整个行业的叙事都是模型越大越好，参数越多越强。但Anthropic的研究暗示，与其把所有计算力都堆在一个方向上，不如让模型学会在简单问题上少算一点，把算力留给真正需要深度思考的部分。

说白了就是效率问题。
你不可能每个问题都用上全部算力，那样太浪费了。但现在的模型不管是回答「1+1等于几」还是「请分析地缘政治对半导体供应链的影响」，花的精力差不多，这本身就很不合理。

业界也有不同的声音。

有些研究者认为，与其做这种复杂的多策略切换，不如把基础模型做得足够大，让它自然涌现出各种能力。OpenAI那边似乎更偏向这个路线。
但我觉得Anthropic的思路有一个好处，就是可解释性更强。你知道AI在用哪种方式思考，出了问题也更容易排查。

3️⃣ 这可能是通向AGI的一条被忽视的路

现在大家讨论AGI，焦点基本都在Scaling Law上，就是更多数据、更多算力、更大模型。
但Anthropic这篇论文提供了一个不同的视角，也许通向AGI的关键不在于单体能力的无限提升，而在于能否灵活组合多种认知能力。

这个观点如果成立的话，对整个行业的意义还挺大的。
意味着一些算力没那么强的团队，也有可能通过巧妙的架构设计来追赶巨头。当然，这还只是研究阶段，离真正落地还有距离。

2026年的AI会怎么走？也许答案不在于谁买了最多的GPU，而在于谁最先想明白了AI应该怎么思考。

发布于上海