#微博大模型可真能省钱# 刚刷到个超实在的消息——微博AI团队的VibeThinker小模型,把“省钱”玩出了新高度!
3B参数的版本刚发布,数学竞赛AIME26直接考了94.3分,编程题LiveCodeBench v6也拿到80.2的Pass@1,这成绩放以前得砸多少钱堆大模型啊?现在用小参数就能打,训练成本省到哭,企业部署也不用再为“GPU贵到肉疼”发愁。
最绝的是它的“Spectrum-to-Signal Principle(SSP)”技术,说白了就是给小模型装了个“超级大脑”——用两阶段蒸馏+强化学习,把有限的参数榨出大模型的推理力。以前想搞AI,动不动就要租超算、买高端卡,现在小模型直接能跑,省下来的钱够再搞好几个项目!
更香的是,模型在HuggingFace和ModelScope上直接能下,开发者不用自己从头训,拿来就能用。这波操作,把“省钱”刻进了AI的DNA里,不是为了省而省,是真用低成本做出了高性能,这才是AI该有的样子:既好用,又不心疼钱!
发布于 山西
