26-06-06 06:56 微博认证:运动博主

输入是 20 亿的 Token: 1. 7 个摄像头 x 36帧/s x 500 万像素 x 30s 的上下文记忆/5x5的像素 2. 未来几公里的导航信息 3. 100 Hz 的车辆动态数据,包括速度、IMU、里程计等 4. 48 Hz 的音频数据 输出是 2 个 Token: 下一秒的转向和加减速信号[二哈]

发布于 上海