26-06-30 02:15 微博认证:前微软Asp.Net最有价值专家 2025微博年度新知博主 科技博主

Meta 今天同时放出两个大动作:Brain2Qwerty v1 论文正式登上 Nature Neuroscience,v2 同日发布。v1 去年以预印本形式公开时,能从脑电信号里逐字母还原打字内容,字符错误率 32%。v2 跳过了字母这一层,直接做到句子级别的实时解码,平均单词准确率 61%,表现最好的被试达到 78%,超过一半的句子解码误差在一个词以内。

作为参照,此前非侵入式方法的单词准确率只有 8%。

这里说的“非侵入式”,就是不需要开颅手术、不需要往脑子里植入电极。被试戴的是 MEG(脑磁图)设备,通过头皮外的传感器捕捉大脑活动产生的微弱磁场。相比之下,Neuralink 那类侵入式脑机接口准确率能到 90% 以上,但代价是一台开颅手术。

v2 的训练数据来自 9 名志愿者,每人戴着 MEG 设备打字 10 小时,总共录了约 22,000 个句子。系统用端到端深度学习直接处理原始脑信号,再通过微调大语言模型来利用语义上下文,把嘈杂的神经数据“翻译”成连贯的语言。Meta 还提到他们用 AI Agent 来探索解码流程的优化方案,最终的训练配置由工程师人工选定。

一个有意思的发现:解码准确率随数据量呈对数线性提升。也就是说,单靠增加训练数据就有可能继续缩小和侵入式方法之间的差距。

Meta 开源了 v1 和 v2 的全部训练代码,合作方 BCBL(巴斯克认知、大脑与语言中心)则开放了 v1 的数据集。

离实用还有多远?

MEG 设备体积大、造价数百万美元、需要磁屏蔽房间,目前只能在实验室环境下运行。而且这次的被试都是健康人,能否在真正需要帮助的脑损伤患者身上复现效果,还没有验证。便携式 MEG 替代方案(基于光泵磁力计)正在研发中,但离消费级产品还有相当距离。

不过,把非侵入式脑机接口的句子解码能力从“几乎不能用”拉到“大致能沟通“,这一步本身的意义在于:它证明了不开刀也有可能做到接近开刀的效果,剩下的是工程问题而非原理问题。

对全球数百万因脑损伤而丧失沟通能力的人来说,一条不需要手术的路径,哪怕还很远,还是很值得期待。

官方介绍:http://t.cn/AXSFPGku http://t.cn/AXSFP5il

发布于 美国