DeepSeek V4 Flash + DSpark 推测解码框架开源
DeepSeek团队联合北大开源DSpark(Speculative Decoding)框架,配合DeepSeek-V4 Flash(1.6T/49B激活,1M上下文)使用,通过小模型草稿+大模型验证大幅降低长上下文推理延迟,已放出自托管示例。
发布于 上海
DeepSeek V4 Flash + DSpark 推测解码框架开源
DeepSeek团队联合北大开源DSpark(Speculative Decoding)框架,配合DeepSeek-V4 Flash(1.6T/49B激活,1M上下文)使用,通过小模型草稿+大模型验证大幅降低长上下文推理延迟,已放出自托管示例。