26-03-26 15:17 微博认证:科技博主

最近All-In Podcast做了一期特别节目,请来了英伟达CEO黄仁勋做了一场将近两个半小时的深度对话。

All-In的四位主持人大家应该都不陌生了,Chamath、Jason Calacanis、David Sacks、David Friedberg,全是硅谷顶级投资人和创业者。

能让他们打断常规节目专门录一期的嘉宾,屈指可数。

这期的信息量非常大,从英伟达收购Groq聊到太空数据中心,从Agent爆发聊到AI行业的公关危机,几乎覆盖了当下AI领域所有最热的话题。

我花了不少时间反复看了几遍,有些观点确实让我重新审视了对整个行业走向的判断。

1️⃣ 英伟达已经不是一家GPU公司了

黄仁勋在访谈里反复强调了一个概念叫分离式推理(Disaggregated Inference)。

简单来说就是AI推理的处理流程太复杂了,不能再靠单一类型的芯片搞定,得把不同的计算任务拆开,分配给最合适的硬件去跑。

GPU跑一部分,CPU跑一部分,网络处理器跑一部分,现在收购了Groq之后,Groq的LPU也加入了这个组合。

他提到英伟达两年半前就发布了AI工厂操作系统Dynamo,名字来源于西门子发明的发电机,寓意是要做新一轮工业革命的底层引擎。

收购Groq并不是心血来潮,而是整个异构计算战略的一环。

他甚至给出了具体比例:数据中心里大约25%的空间应该分配给Groq LPU和GPU的组合。

英伟达的TAM(可触达市场)可能因此增长了三到五成。

这不是在卖芯片,而是在卖整个AI基础设施。

2️⃣ 推理计算两年涨了一万倍,而且还没开始真正爆发

这个数字听起来很夸张,但黄仁勋的推导逻辑其实很清楚。

从生成式AI到推理(Reasoning),计算量涨了大概100倍;从推理到Agent,又是100倍。

两步叠加就是一万倍,而且这个过程只花了两年。

更关键的是他说的一句话:人们愿意为信息付费,但人们更愿意为完成工作付费。

聊天机器人回答问题很好,但真正能帮你干活的Agent系统,商业价值完全不在一个量级。

Chamath在节目里也分享了一个例子,他的团队用自动研究工具(Auto Research)在30分钟内完成了一项本来需要读一个七年博士才能产出的研究,这个效率提升的冲击力可想而知。

3️⃣ 一个50万美元年薪的工程师,应该花掉至少25万美元的token

这大概是整期节目里最出圈的一个观点了。

黄仁勋做了一个思想实验:如果你给一个工程师50万美元的年薪,年底一看他只花了5000美元的token费用,那你作为管理者应该非常担忧。

他的原话大意是说,这就好比芯片设计师告诉你他打算用纸笔画电路图,不需要CAD工具一样离谱。

这背后的逻辑是,在Agent时代,知识工作者的生产力取决于他能调动多少AI算力。

不是你省token就是好员工,恰恰相反,token消耗量可能会成为衡量一个工程师是否真正高效工作的新指标。

黄仁勋还预测,未来每个工程师都会有一百个Agent在帮他干活。

4️⃣ 开源和闭源不是二选一,两条路都要走

关于开源模型和商业模型之争,黄仁勋的态度非常明确:这不是A还是B的问题,而是A加B。

对普通用户来说,ChatGPT、Claude、Gemini这些产品化的模型用起来最方便,没必要自己去折腾微调。

但对垂直行业来说,开源模型提供了不可替代的控制力和定制空间。

他还特别提到了OpenClaw这个开源Agent框架的重要性。

它不只是一个工具,更像是定义了一种新的计算范式,有内存管理、有任务调度、有IO子系统、有技能API,本质上就是AI时代的个人电脑操作系统。

这个判断如果成立,影响会非常深远。

5️⃣ AI行业正在经历一场公关危机,需要自救

黄仁勋直接点名说了Anthropic在沟通策略上的问题。

他肯定了Anthropic的技术实力和安全意识,但也指出,警示公众和吓唬公众之间有一条很重要的界限。

用他的话说,预测未来需要谦逊,没有证据的灾难性预言可能造成的伤害比人们以为的要大得多。

黄仁勋对AI产业的理解深度和广度,远远超出了大多数人对一个硬件公司CEO的预期。

他不只是在卖芯片,他在构建一整套AI时代的基础设施和生态体系。

几个趋势值得持续关注:Agent计算需求的指数级增长、开源AI操作系统的崛起,以及AI行业如何修复与公众之间日益紧张的信任关系。

发布于 上海