26-06-26 20:49 微博认证:逐鹿网(www.zhulu.com)创始人 长文原创作者 2024微博年度新知博主

火山引擎前几天开的年度大会,全场爆满,一座难求。

不只是客户要来商谈业务、同行要来打探「敌情」,整个AI行业的参与者,也都不愿错过字节旗下模型矩阵的「上新日」:

Coding和Agent能力都有长足进步的Seed 2.1,首次实现4K分辨率的Seedance 2.0,即将发布的新一代顶级视频模型Seedance 2.5,值得期待的图片模型Seedream 5.0 Pro,支持多模态生成的音频模型SeedAudio 1.0⋯⋯

硅基滚烫,群模闪耀。

IDC每半年都会发布一次中国MaaS市场的统计报告,从2024年开始,火山引擎的调用量就占到了接近半壁江山,排名稳在第一。

这不是重点,重点在于,随着各家大厂反应过来并相继入局,MaaS赛道的拥挤必然分摊火山引擎的独大优势,这是最基础的数学规律。

但情况恰好相反,在IDC发布的2025年全年报告里,火山引擎在中国MaaS市场的调用量竟然还在涨,从2024年的46.4%,攀升到了49.5%⋯⋯

要知道,这个49.5%还建立在两个不利条件之上:

第一,统计口径只限于云厂商对外部客户提供的公有云服务,并不包括自有业务,也就是字节系产品的Token消耗,不算在内,换句话说,豆包遥遥领先的用户规模,甚至被剔出去了;

第二,统计时限截止于2025年,我们都知道,改写视频大模型历史进程的Seedance 2.0,是在今年年初才发布的,这个消耗大户,也没有机会体现在IDC的报告里。

这就很让人感到窒息了。

我想说的是,字节把最重要的旗舰模型版本都放在了火山引擎的活动上发布,这说明以MaaS平台为「Token经济」的贸易港,成了一种共识。

「Token经济」这个概念并不新鲜,AI公司——尤其是最近一年以来——特别热衷于谈论它,虽然解释起来未必能为己用,但确实可以服务于「在电梯里做俯卧撑」的叙事,上升即繁荣。

不过「Token经济」之于云厂商,就更接近于底层的商业逻辑了,Token的意义,本质上是一套全新的计费单位,站在历史的周期来看,它一点儿都不陌生。

工业时代的Token,是「千瓦时」,高速传输的电力,为大规模生产行为赋予了高度的确定性,整个现代文明,都依赖用电量这个资源消耗的尺度,富足的城市,一定灯火通明。

数字时代的Token,是「字节」,从桌面带宽到移动流量,所有的信息交换,都被度量为KB、MB、GB等字节单位,由此滋生了覆盖全球的光纤和卫星,以及连接数十亿人口的通信运营商。

那么在可以预见的AI时代,Token又将撑起怎样的经济体系?

火山引擎披露了几个关键数据,大多数人会被日均180万亿次的Token调用量所惊讶,相比豆包大模型刚刚诞生的两年前增长了足有1500倍,但还有一个实际意义更加震动的数字,更值得关注:

在火山引擎的服务对象中,年均消耗1万亿Token的企业,超过了200家。

头部大户的高消耗,是不意外的,但扩大到200家则意味着,对于Token的用量需求,以及千万级的财务预算,必然下沉到了细分市场的非互联网赛道,比如传媒、金融、汽车等等,这才是火山引擎更大的机遇。

超过50个品牌的汽车、8成以上的系统重要性银行、9成以上的头部券商、所有的C9高校、Top 10手机公司里的9家⋯⋯有一个算一个,全在火山引擎上消费Token。

作为先后经历了桌面互联网和移动互联网两轮完整周期的老登,我们都还记得对于流量的敏感,无论是「图多杀猫」的警告,还是「30块5MB」的流量包,这种必然走过的历程,通向的终点一定是「脱敏」,就像现在不会有人还会出门在外就把蜂窝网络关掉,以免跑出不知情的账单。

眼下被玩成各种热梗的Token消耗段子,一定只是切换商业逻辑的过渡产物,而火山引擎为各个行业提供的动能转化,尤其是强调Token调用规模的计算方式,都是在指向那个明确的终局思维:

相比单纯评估Token消耗量, 更应关注Token消耗真正转化为可量化的业务成果,这就离不开新一代云计算基础设施。

这个画面,就很像十九世纪末期的电气化,各个工厂、车间、矿山全都优先配套电力能源,哪里能够稳定供电,哪里就能成为新的工业中心。

发布于 湖北