DeepSeek-V4 定档7月中旬上线:正式版将引入峰谷双重阶梯定价(高峰时段基准价翻倍),首次以价格杠杆调节算力供需。
Anthropic 发布 Claude Sonnet 5:定位"最具Agent能力的Sonnet",能力接近Opus 4.8但价格更低;Fable 5在全球恢复访问($10/50 per M Tokens)。
Anthropic 上线 Claude Science:将Agent能力延伸至科研自动化场景,支持连接60+科学数据库做假设生成与验证。
DeepReinforce AI 开源 Ornith 1.0:基于Gemma 4/Qwen 3.5后训练的RL驱动自改进代码模型族(9B~397B),SWE-bench Verified 75.6%,MIT许可。
RoboScience 发布 Visics 具身大模型(VLOA架构):前苹果AI负责人创立,以"物体轨迹"为具身Token,A轮累计融资10亿元。
小米 HarnessX 自进化 Agent Shell:让Agent外壳通过RL自动迭代进化,平均性能提升14.5%,小模型暴涨44%。
AReaL 2.0 开源:为自演进智能体提供在线强化学习基础设施,支持生产环境中持续学习。
发布于 江苏
