美国加州大学戴维斯分校团队开发出一种研究性脑机接口,有望帮助因神经系统疾病而失去说话能力的人重新“发声”。这项成果发表在最新一期《自然》杂志上,展示了该技术如何在人尝试说话时,立即将大脑活动转化为语音,从而创建出一种“数字声带”。
这项技术已在一名患有肌萎缩侧索硬化症(俗称“渐冻症”)的参与者身上测试成功。他通过植入式脑机接口,借助计算机与家人实时对话,不仅可以控制语调,还能唱出简单的旋律。
此前的语音脑机接口主要将神经活动翻译成文本,类似于发送短信,存在延迟并影响自然交流。而这种新型实时语音合成系统则更接近于语音通话,使用户能够更自然地参与对话。
新植入式脑机接口系统由4个微电极阵列组成,电极通过手术植入大脑中负责语音生成的区域。当参与者试图说话时,电极记录下神经元的活动,并将信号传输到外部计算机进行解码,最终重建语音输出。团队还开发了一种新算法,能将每一时刻的大脑活动精确转换为对应的语音,参与者可通过调整音高来表达不同的情感或意图,比如提问、发出感叹或强调某个词语。
新技术的速度非常快,从神经信号采集到语音合成仅需1/40秒——这个延迟时间几乎等同于人们正常说话时听到自己声音所需的时间。
参与者还能用该系统“唱”出简短的旋律,显示出语音合成的灵活性。听众对合成语音的理解率达到近60%,而在不使用该系统的情况下,他的语音仅能听懂约4%。
实现这一过程的关键在于先进的人工智能算法。通过对数百个神经元放电模式的分析,团队成功地将这些模式与参与者试图产生的语音同步。这使得算法能在没有语音输入的情况下,仅凭神经信号就准确重建他想要表达的声音。
这项研究标志着脑机接口技术在恢复自然语言能力方面迈出的重要一步,为因疾病或损伤而失语的人群带来了新的希望。未来,其有望应用于更多患者,推动神经假体领域迈向更加智能化和人性化。
[总编辑圈点]
这项研究不仅实现了大脑信号向语音的实时转换,更重要的是,它恢复了交流中的语调变化和节奏控制,使沟通更自然、更个性。相较于以前的输出方式,明显提升了交流效率与情感表达,极大增强了使用者在对话中的主动性和参与感。相信这项技术有潜力广泛应用于渐冻症、中风、脑干损伤等导致丧失语言能力的疾病治疗中。同时,随着算法优化和硬件小型化,还能拓展到更多神经康复领域,甚至推动人机交互迈向更智能化与人性化。(张梦然)