GLM-5 技术报告正式发布!
GLM-5 发布后,我们将模型背后的技术探索与实践整理成文,现正式公开技术报告,供社区参考与交流。
GLM-5 在以下三个维度的技术改进:
1. 引入DSA:在有效降低训练和推理成本的同时,保障了长上下文处理的准确性。
2. 构建异步 RL 基础设施:通过解耦生成与训练环节,显著提升了后训练阶段的迭代效率。
3. 优化 Agent RL 算法:增强了模型在复杂、长周期交互任务中的学习与规划能力。
🏆 得益于上述技术创新,GLM-5 在编程、智能体的核心榜单中取得了开源 SOTA。
📄 报告全文:http://t.cn/AXt87HsG
💪感谢大家对GLM的关注,团队将持续努力,不断探索智能上限。
#智谱##GLM##AI##大模型#
发布于 山东
