字节突破长视频生成极限!AI 视频达 4 分 15 秒#AI创造营#
字节联合 UCLA 发布 Self-Forcing++ 技术,突破 AI 长视频生成瓶颈。该方法通过反向噪声初始化、扩展分布匹配蒸馏和滚动 KV 缓存训练优化架构,解决传统模型超 5 秒后画面崩坏问题。实验验证最长生成 4 分 15 秒高清视频,无人机航拍海岸线、草原象群等场景全程稳定无卡顿。在 VBench 评测中,该技术短时语义得分 80.37,长时视觉稳定性超基准模型 2.6 倍,动态表现提升 104.9%,文本对齐能力领先行业。
发布于 广东
