黄仁勋谈AI行业趋势

最近All-In Podcast做了一期特别节目，请来了英伟达CEO黄仁勋做了一场将近两个半小时的深度对话。

All-In的四位主持人大家应该都不陌生了，Chamath、Jason Calacanis、David Sacks、David Friedberg，全是硅谷顶级投资人和创业者。

能让他们打断常规节目专门录一期的嘉宾，屈指可数。

这期的信息量非常大，从英伟达收购Groq聊到太空数据中心，从Agent爆发聊到AI行业的公关危机，几乎覆盖了当下AI领域所有最热的话题。

我花了不少时间反复看了几遍，有些观点确实让我重新审视了对整个行业走向的判断。

1️⃣ 英伟达已经不是一家GPU公司了

黄仁勋在访谈里反复强调了一个概念叫分离式推理（Disaggregated Inference）。

简单来说就是AI推理的处理流程太复杂了，不能再靠单一类型的芯片搞定，得把不同的计算任务拆开，分配给最合适的硬件去跑。

GPU跑一部分，CPU跑一部分，网络处理器跑一部分，现在收购了Groq之后，Groq的LPU也加入了这个组合。

他提到英伟达两年半前就发布了AI工厂操作系统Dynamo，名字来源于西门子发明的发电机，寓意是要做新一轮工业革命的底层引擎。

收购Groq并不是心血来潮，而是整个异构计算战略的一环。

他甚至给出了具体比例：数据中心里大约25%的空间应该分配给Groq LPU和GPU的组合。

英伟达的TAM（可触达市场）可能因此增长了三到五成。

这不是在卖芯片，而是在卖整个AI基础设施。

2️⃣ 推理计算两年涨了一万倍，而且还没开始真正爆发

这个数字听起来很夸张，但黄仁勋的推导逻辑其实很清楚。

从生成式AI到推理（Reasoning），计算量涨了大概100倍；从推理到Agent，又是100倍。

两步叠加就是一万倍，而且这个过程只花了两年。

更关键的是他说的一句话：人们愿意为信息付费，但人们更愿意为完成工作付费。

聊天机器人回答问题很好，但真正能帮你干活的Agent系统，商业价值完全不在一个量级。

Chamath在节目里也分享了一个例子，他的团队用自动研究工具（Auto Research）在30分钟内完成了一项本来需要读一个七年博士才能产出的研究，这个效率提升的冲击力可想而知。

3️⃣ 一个50万美元年薪的工程师，应该花掉至少25万美元的token

这大概是整期节目里最出圈的一个观点了。

黄仁勋做了一个思想实验：如果你给一个工程师50万美元的年薪，年底一看他只花了5000美元的token费用，那你作为管理者应该非常担忧。

他的原话大意是说，这就好比芯片设计师告诉你他打算用纸笔画电路图，不需要CAD工具一样离谱。

这背后的逻辑是，在Agent时代，知识工作者的生产力取决于他能调动多少AI算力。

不是你省token就是好员工，恰恰相反，token消耗量可能会成为衡量一个工程师是否真正高效工作的新指标。

黄仁勋还预测，未来每个工程师都会有一百个Agent在帮他干活。

4️⃣ 开源和闭源不是二选一，两条路都要走

关于开源模型和商业模型之争，黄仁勋的态度非常明确：这不是A还是B的问题，而是A加B。

对普通用户来说，ChatGPT、Claude、Gemini这些产品化的模型用起来最方便，没必要自己去折腾微调。

但对垂直行业来说，开源模型提供了不可替代的控制力和定制空间。

他还特别提到了OpenClaw这个开源Agent框架的重要性。

它不只是一个工具，更像是定义了一种新的计算范式，有内存管理、有任务调度、有IO子系统、有技能API，本质上就是AI时代的个人电脑操作系统。

这个判断如果成立，影响会非常深远。

5️⃣ AI行业正在经历一场公关危机，需要自救

黄仁勋直接点名说了Anthropic在沟通策略上的问题。

他肯定了Anthropic的技术实力和安全意识，但也指出，警示公众和吓唬公众之间有一条很重要的界限。

用他的话说，预测未来需要谦逊，没有证据的灾难性预言可能造成的伤害比人们以为的要大得多。

黄仁勋对AI产业的理解深度和广度，远远超出了大多数人对一个硬件公司CEO的预期。

他不只是在卖芯片，他在构建一整套AI时代的基础设施和生态体系。

几个趋势值得持续关注：Agent计算需求的指数级增长、开源AI操作系统的崛起，以及AI行业如何修复与公众之间日益紧张的信任关系。

发布于上海