24-09-23 08:40 微博认证:科技博主

Kimi 背后的长文本大模型推理实践:以 KVCache 为中心的分离式推理架构
http://t.cn/A6EwPRgX
月之暗面高级研发工程师、开发者关系负责人唐飞虎发表了专题演讲“长文本大模型推理实践——以 KVCache 为中心的分离式推理架构”,分享介绍 Kimi 智能助手背后的推理加速方案,以及该方案在设计时所需要考虑的指标和在真实生产环境中部署的表现。

发布于 山东