26-07-04 21:15 微博认证:财经博主 超话主持人(实践管理超话)

DeepSeek V4 Flash + DSpark 推测解码框架开源

DeepSeek团队联合北大开源DSpark(Speculative Decoding)框架,配合DeepSeek-V4 Flash(1.6T/49B激活,1M上下文)使用,通过小模型草稿+大模型验证大幅降低长上下文推理延迟,已放出自托管示例。 ​

发布于 上海