这项技术旨在让处于锁定状态、瘫痪且无法说话的人重新获得声音。研究人员认为,该项目的成功标志着脑机接口领域的重大进步。
主要事实:
- 通过结合大脑植入物和人工智能,研究人员能够以 92-100% 的准确率预测口语单词。
- 该团队将实验重点放在植入了临时大脑植入物的非瘫痪患者身上,根据他们的大脑活动解码他们大声说出的内容。
- 虽然该技术目前专注于单个单词,但未来的目标包括基于大脑活动预测完整句子和段落的能力。
资料来源:拉德堡德大学
拉德堡德大学和 UMC Utrecht 的研究人员成功地将大脑信号转化为可听语音。
通过植入物和人工智能的结合解码来自大脑的信号,他们能够预测人们想说的话,准确率达到 92% 到 100%。
他们的研究结果发表在 本月的《神经工程杂志》上。
拉德堡德大学唐德斯脑、认知和行为研究所和 UMC Utrecht 的研究员、主要作者 Julia Berezutskaya 表示,这项研究表明脑机接口领域取得了有希望的发展。Berezutskaya 和 UMC Utrecht 和 Radboud University 的同事使用癫痫患者的大脑植入物来推断人们在说什么。
恢复声音
Berezutskaya 表示:“最终,我们希望将这项技术提供给处于锁定状态、瘫痪且无法沟通的患者。”
“这些人失去了移动肌肉的能力,从而失去了说话的能力。通过开发脑机接口,我们可以分析大脑活动并再次赋予它们声音。”
在新论文中的实验中,研究人员要求植入临时大脑植入物的非瘫痪患者大声说出一些单词,同时测量他们的大脑活动。
Berezutskaya:“然后,我们能够在大脑活动和言语之间建立直接映射。我们还使用先进的人工智能模型将大脑活动直接转化为可听语音。
“这意味着我们不仅能够猜测人们在说什么,而且还可以立即将这些单词转化为易于理解的声音。此外,重建的语音在语气和说话方式上甚至听起来都像原始说话者。”
世界各地的研究人员正在研究识别大脑模式中的单词和句子的方法。
研究人员能够用相对较小的数据集重建可理解的语音,表明他们的模型可以用有限的数据揭示大脑活动和语音之间的复杂映射。
至关重要的是,他们还与志愿者进行了听力测试,以评估合成词的可识别性。
这些测试的积极结果表明,该技术不仅成功地正确识别单词,而且还能够像真实的声音一样以可听且可理解的方式传达这些单词。
局限性
“目前,仍然存在许多限制,”别列祖茨卡娅警告说。“在这些实验中,我们要求参与者大声说出十二个单词,这些就是我们试图检测的单词。
“一般来说,预测单个单词比预测整个句子要简单。未来,人工智能研究中使用的大型语言模型可能会带来好处。
“我们的目标是仅根据人们的大脑活动来预测人们想要说的话的完整句子和段落。为了实现这一目标,我们需要更多的实验、更先进的植入、更大的数据集和先进的人工智能模型。
“所有这些过程仍需要数年时间,但看起来我们正朝着正确的方向前进。”