脑机接口技术又向自然对话迈进了一步。

12

近年来,脑机接口技术飞速发展。在最新的试验中,一名瘫痪病人在植入了可以将神经信号转换为可听语言的大脑植入物后几乎可以立刻使别人听到他想说的话。

研究人员利用人工智能算法强化了脑机接口设备。这种算法可以在病人脑海中浮现出句子时就将其解码,然后用合成语音将其大声输出。在此之前,脑机接口技术只能在病人完整说出句子后再解码、发出声音;而现在的技术可以实时检测单词,并在三秒内将其转换成语音。

这项发现的结果发表在2025年3月31日的《自然-神经科学》(Nature Neuroscience)杂志上,标志着脑机接口技术向实际应用又迈出了一大步。

原先的语音生成脑机接口类似微信聊天:我写个句子,你写个句子,然后你还得花时间再写个句子——聊天不像自然对话那样流动。

能实现实时语音聊天的脑机接口当然是这类研究的下一个目标,因为这项技术允许用户传递符合自然语言特征的语音语调和说话重点。

参与这项研究的病人2005年因脑卒中而失去了语言能力。大约18年后,他接受了大脑手术,将一枚薄如纸片但携带253个电极的长方形植入物放置在大脑皮质表面。这个植入物可以同时记录数千个神经元的整体活动。

研究人员用这名病人的婚礼视频训练人工智能算法,让算法合成的声音具有这名病人的个人特征,听上去就像他受伤之前那样。

在这项最新的研究中,这名病人根据屏幕上显示的1024个单词和50个短语默念出100个句子。脑机接口设备从他默念句子前500毫秒开始每80毫秒捕捉一次他的神经信号,同时以每分钟47~90个单词的速度合成并输出语音(自然对话的输出速度大约是每分钟160个字)。

在这名病人此前接受的一项同类研究中,他使用的辅助通信技术设备需要20多秒才能输出一个句子。因此,这个最新的脑机接口研究结果标志着这项技术取得了显著进步。

不过,虽然脑机接口技术已经在检测记录、合成输出短句方面取得了长足进步,但与自然对话相比,这项技术的运作仍然存在“相当大的延迟”。

多项相关研究表明,当这样的延迟大于50毫秒时,输出结果就会让听到的人很是困惑。

这就是我们在脑机接口这项技术上的研究现状,但我们也完全可以畅想,未来,当我们的大脑植入物拥有更多传感器,信号收集、处理、输出的速度、精度同时大幅提升后,这项技术一定会朝着不断变好的方向发展。

资料来源 Nature