Contents 目录 Part 4: Neuralink’s ChallengePart 5: The Wizard EraPart 6: The Great Merger第三部分:脑机接口让我们穿越到公元前 5 万年,然后在那里绑架一个人,并把他带回到 2017 年。 他叫做 Bok。Bok,我们非常感谢你和你的族人们发明了语言。 为了表达我们的感激,我们想向你好好展示一下,我们在你们的发明的基础上所创造的各种好东西。 好的,我们首先带 Bok 去坐飞机,然后去坐潜艇,接着到迪拜的哈利法塔的最顶层看看。我们给他展示望远镜、电视机和 iPhone。然后我们让他自己在网上随便逛逛。 好了,刚才过得很开心吧。Bok,你觉得怎样? 是的,我们看得出来你很惊讶。最后,我们向他展示了我们互相交流的方式。 Bok 应该会很震惊地发现,虽然人类在学会用语言交流之后掌握了很多神奇的能力,但是在真正互相交流的时候,我们的交流方式跟他那个时代的人相比没什么区别。当两个现代人在一起对话的时候,他们使用的其实是一项 5 万年前的技术。 还有另外一件事可能也会让 Bok 感到难以置信,在这样一个由各种高级机器运作的世界里,创造这些机器的人们竟然还在用跟 Bok 一样的身体走来走去。怎么会这样呢? 这就是脑机接口这个新领域如此可望不可即的原因。脑机接口是神经工程学下的一个分支,后者是生物技术下的一个分支。我们已经借助技术的力量多次征服了这个世界,但是当涉及到我们的大脑——我们最核心的工具时,技术世界总是畏缩不前。 所以我们还在用 Bok 发明的技术进行沟通,所以我还在用比我的思维慢 20 倍的速度把这句话打出来,所以各种跟大脑相关的疾病仍然会让许多人行动不便甚至失去生命。 但是在大脑灵光一现发明语言的 5 万年后,这种情况终于要改变了。大脑的下一个伟大前沿,也许正是它自己。 脑机接口可以有很多不同的种类,用于提供各种多种功能。但是每个研究脑机接口的人都在努力解决下面的两个问题: 1)如何从大脑中输出正确的信息?2)如何将正确的信息输入到大脑? 第一个问题是关于如何捕捉大脑的输出——也就是记录神经元说的东西。 第二个问题则是关于如何将信息输入到大脑的自然信息流,或以其他方式改变这个自然信息流——也就是如何刺激神经元。 这两件事情一直在你的大脑自然地发生。你在看这句话时,你的眼睛正在做出一系列特定的水平动作。这是大脑神经元将信息输出到一台机器(你的双眼),机器接收命令并作出响应。当你的双眼以正确的方式移动时,屏幕发射的光子会进入你的视网膜,刺激皮质枕叶中的神经元,让这些文字的图像进入你的思维。然后这幅图像会刺激大脑另一部分的神经元,让你能够处理图像中包含的信息,并吸收句子的意思。 输入及输出信息是大脑神经元的工作。脑机接口产业想做的就是介入到这个过程当中。 乍看之下,这项任务似乎也没有那么困难?反正大脑只是一个果冻球,对吧?至于皮质——我们主要进行记录和刺激的大脑部位——它也只是一块餐巾,而且它还位于大脑外层,研究起来非常方便。皮质里面有大约 200 亿个活跃的神经元——200 亿个黏糊糊的晶体管,如果我们能学会它们的工作原理,我们就可以在前所未有的高度上掌控我们的生命、我们的健康、我们的世界。我们不能弄明白这个吗?虽然神经元是很小,但毕竟我们连如何分裂原子都知道了。神经元的直径大约是原子的 10 万倍——如果原子是一颗弹珠的大小,那么神经元的直径将超过一公里——所以我们应该能应付这种尺度的东西,对吧? 那么这里的问题到底是什么? 首先,上面的想法是有一定道理的,由于上述事实的存在,这个产业确实有可能实现重大的进步。我们可以做到这些。 但是只要你了解到大脑的真正工作原理,你就会认识到这也许是人类有史以来最艰巨的一项挑战。 所以在讨论脑机接口本身之前,我们需要走近看看那些尝试建造脑机接口的人正在克服的问题。我发现把事情说清楚的最好方法,就是将大脑放大整整 1000 倍,然后看看它里面的情况。 还记得我们之前的「皮质餐巾」比喻吗? 如果我们把它放大 1000 倍,那么这块原本每条边长约 48 厘米/ 19 英寸的皮质餐巾,现在有六个曼哈顿小街区(或两个大街区)的那么大。你要花 25 分钟左右才能绕着它走一圈。而整个大脑则刚好可以塞在一个四个街区大的正方形里面,跟麦迪逊广场花园的大小差不多(仅仅是长和宽。这个比例下,大脑的高度是麦迪逊广场花园的两倍)。 现在我们把这块餐巾在城市里摊开来,我相信住在这里的几十万人是不会介意的。 我选择扩大 1000 倍是有几个原因的。首先是我们都可以很方便地在脑中转换比例。大脑中的一毫米现在是一米。而对于尺度更小的神经元世界,现在的一微米变成了更容易理解的一毫米。其次,这样可以很方便地将皮质扩大到了人体的尺寸——它原本两毫米的厚度现在成了两米,差不多就是一个高个子的身高。 现在我们可以走到第二十九街,这是我们的巨型皮质餐巾的边缘,这样我们就可以清楚看到这两米厚的皮质里面发生的情况。为了演示方便,我们从这块巨型皮质中截取一立方米来研究,这样我们就可以知道真实皮质中的一立方毫米里面的情况。 我们在这一立方米里面看到的东西将会是一团糟。所以我们先把里面的东西全部清空,然后再把它们逐一放进去。 我们先把神经元细胞体放进去——它们是这个方块内所有神经元的身体。 神经元细胞体有着不同的大小,但是根据我请教过的一位神经学家的说法,位于皮质的神经元细胞体的直径通常约为 10 或 15 微米。也就是说如果你把 7 个或 10 个这样的细胞体排成一行,这条线的长度大概跟头发的直径差不多。在我们的放大尺度下,细胞体的直径为 1 到 1.5 厘米,相当于一颗弹珠的大小。 整个皮质的体积大约为 50 万立方毫米,在这个空间里大约有 200 亿个神经元细胞体。这意味着每立方毫米的皮质平均含有约 4 万个神经元。所以在我们这个一立方米的盒子里面有 4 万颗弹珠。如果我们将这个盒子分成 4 万个立方空间,那么每个空间的边长大概为 3 厘米,也就是说我们每个细胞体弹珠都在自己的 3 厘米立方体的中心,而周围各个方向的细胞体与它大约相隔 3 厘米。 还跟得上我的思路吗?你可以想象出这个装有 4 万颗漂浮弹珠的立方体吗? 这是一张在真实皮质中的神经元细胞体的显微镜图像,细胞体周围的其他物质已经通过特殊技术排除了: 好吧,到这里为止还不算太疯狂。但是细胞体只是神经元的一小部分结构。每颗弹珠大小的细胞体会伸出许多扭曲分岔的树突,在我们放大比例的大脑中,它们可以向各个不同方向伸展出三、四米,而从细胞体另一端伸出来的轴突则可以超过 100 米长(当它延伸到相邻的皮质区域时),或者甚至可以达到 1 公里(当它向下延伸到脊髓和身体时)。这里的每根轴突的厚度只有 1 毫米左右,它们在皮质里面就像是一团密密麻麻的带电意大利面。 这团意大利面里面发生着很多事情。每个神经元都拥有高达 1000 个(有时甚至可以达到 1 万个)通向其他神经元的突触连接。皮质中拥有大约 200 亿个神经元,也就是说这里有超过 20 万亿个独立的神经连接(整个大脑中则拥有高达一千兆个连接)。而在我们的一立方米中就将有超过 2000 万个突触。 然而更复杂的是,我们的立方体不仅含有这 4 万颗弹珠伸出来的无数根意大利面,还有很多来自皮质其他部位的意大利面会穿过这个立方体。这就意味着,如果我们要在这个立方空间中记录信号或者刺激神经元,我们肯定会遇到很多麻烦,因为在这团乱七八糟的意大利面之中,我们很难找出那些意大利面是属于我们的细胞体弹珠的(而且还没有算上混杂在其中的大量浦肯野细胞(Purkinje cell)。) 当然,我们还要考虑神经可塑性的问题。每个神经元的电压都是不断变化的,这个变化频率可以达到每秒数百次。而且我们立方体里面的数千万个突触连接会经常改变大小,消失,然后重新出现。 但是这还不算完。 事实上大脑里面还有一种叫做胶质细胞(glial cell)的东西,这种细胞有许多不同的变种,分别负责不同的功能,比如清扫释放到突触内的化学物质,用髓鞘包裹轴突,以及作为大脑的免疫系统。下面是一些常见的神经胶质细胞种类: 皮质里面有多少胶质细胞呢?它们跟神经元的数量差不多。[1]所以我们还要在立方体里加上 4 万个这类奇形怪状的东西。 最后还有血管。每立方毫米的皮质里面的毛细血管加起来的总长度可以达到一米,如果放在我们一立方米的模型,这里面就有总共一公里长的血管。在这样大小的空间内,这些血管看起来是这样的:
所以我们的立方盒子里面密密麻麻地塞满了各种黏糊糊的带电物质——现在我们回到现实,这个盒子里面的所有东西其实都塞在一立方毫米当中。 脑机接口工程师们要做的就是在这一立方毫米里面捕捉神经元细胞体发出的信号,或者刺激某些特定的细胞体发出工程师需要的信号。好吧,祝你们好运。 即使在我们放大了 1000 倍的大脑,要做到上面的任务也是非常困难的,而且我们的放大版大脑还是一块已经摊平了的餐巾,但现实并非如此——在正常情况下,这块餐巾是包裹在「麦迪逊广场花园」表面的,而且上面布满了各种深入的皱褶(在我们的尺度下,这些皱褶的深度达到 5 到 30 米)。事实上,只有三分之一的皮质是位于大脑表面的——其他大部分都被埋藏在皱褶之中。 再者,工程师们也不是在实验室里有用不完的大脑可以摆弄。另外大脑外面还有像俄罗斯套娃一样的分层结构,其中的头骨在放大 1000 倍之后就有大约 7 米厚。而且大多数人都不太愿意自己的头盖骨被长时间掀起来——最好完全不要被掀起来——所以你必须用尽可能非侵入性的方式来处理那些微型的弹珠。 上面所说的前提是你需要跟皮质打交道——但是许多先进的脑机接口概念是需要深入到皮质下面的结构的。如果你站在我们的「麦迪逊广场花园大脑」上面的话,这些结构将被埋藏在你脚下的 50-100 米之内。 这个放大游戏让我们进一步认识到了大脑的巨大规模。想想在我们的一立方米里有多少事情在发生,而且要记得这只是大脑皮层的 50 万分之一。如果我们将整块巨型皮质切割成一块块这样的立方体,然后把它们拍成一列,这条队伍的长度可以达到 500 公里——已经超过了从纽约到波士顿的距离。如果你徒步走过这段路程(就算快步走也要花 100 小时),无论你在路上的哪一处停下脚步,你面前的立方体里面都有同样复杂的情况。所有这一切,现在都在你的大脑中发生。 第三部分A:你是不是该庆幸这不是你需要解决的问题没错! 回到第三部分:脑机接口那么科学家和工程师们是如何着手处理这个情况的? 他们只能充分利用现有的工具——那些用来记录或者刺激神经元的工具(我们现在先把重点放在记录方面)。接下来我们来看看具体有什么工具可供选择: 脑机接口工具从目前的研究水平来看,我们在评估某种记录工具的优劣时需要考虑三个方面的标准: 1)规模——可以记录多少神经元 2)分辨率——这个工具接收到的信息的细致程度。这里所说的分辨度可以分成两种:空间上的分辨率(能否细致记录单个神经元的触发情况)和时间上的分辨率(能否确定你所记录的活动的确切发生时间)。 3)侵入性——是否需要手术?如果需要,手术的影响范围有多大? 我们的长远目标是要满足上述所有的标准。但就目前而言,我们始终还是需要在其中一个(或两个)标准上作出让步。在不同的工具之间切换并非整体上的进步或退步,它们只是对不同标准的妥协而已。 下面我们来了解一下目前正在应用的脑机接口工具: 功能性磁共振成像(Functional Magnetic Resonance Imaging,fMRI)规模:大(能够显示整个大脑的信息) 分辨率:空间分辨率为中低,时间分辨率为极低 侵入性:非侵入性 虽然 fMRI 不是传统的脑机接口工具,但它是一种典型的记录工具——它能告诉你大脑内部的情况。 fMRI 使用的磁共振成像技术(MRI)发明于 1970 年代,这是从 X 光 CT 扫描发展而来的技术。MRI 采用磁场(以及电磁波等其他信号)取代 X 光来生成身体和大脑的图像,比如这样: 下面是一组完整的脑截面图,你可以看到整个脑部的结构。脑截面图 链接 这是一项非常神奇的技术。 fMRI 可以利用类似的技术来追踪血液流动的变化。为什么要这样做?因为大脑区域变得更活跃时会消耗更多能量,也就需要更多氧气——所以流向该区域的血液会增加,为它提供所需要的氧气。fMRI 的扫描结果可能是这样的: 当然,大脑里面一直都有血液流过——这幅图像展示的是血流增加的区域(红色/橙色/黄色)和血流减小的(蓝色)。因为 fMRI 能够扫描整个大脑,所以最终生成的结果是三维的。 fMRI 有许多医学方面的应用,比如帮助医生了解病人在中风后大脑的各个部位是否正常;另外也让神经科学家能够全面掌握大脑各个区域对应的功能。这种扫描技术的另外一个好处是,它还能提供大脑在特定时间的完整状态信息,而且这种方式十分安全,完全没有侵入性。 fMRI 的主要缺点在于分辨率,它扫描生成的图像确实会有一个分辨率,正如电脑屏幕上会有像素一样,只不过它的像素是三维立体的——也就是所谓的「体素」(voxel)。 随着技术的提升,fMRI 的体素变得越来越小,所以它的空间分辨率也因此提升了。现在最小的 fMRI 体素可以达到一立方毫米,而大脑的体积约为 120 万立方毫米,所以高分辨率的 fMRI 扫描能把大脑划分成大约一百万个小方块。但问题是,在神经元的尺度下,这样的小方块还是显得太大了(它在放大之后就跟我们上面的立方米方块一样大了),每一个体素里面都会包含成千上万个神经元。所以 fMRI 充其量只能展示每组 4 万个神经元的平均血流量。 然而更严重的问题在于时间分辨率。fMRI 所追踪的血流量并不精确,而且会有大约一秒钟的延迟——这在神经元的世界中可以说是永恒了。 脑电图(Electroencephalography,EEG)规模:大 分辨率:空间性分辨率极低,时间分辨率中高 侵入性:非侵入性 脑电图已经拥有接近一个世纪的历史,这种技术就是在脑袋上贴一堆电极,你肯定知道它是怎样的: 在一个生活在 2050 年的人的眼中,脑电图肯定是一项原始得可笑的技术,但是就目前而言,这是唯一一种完全非侵入性的脑机接口工具。脑电图可以记录下大脑中不同区域的电流活动,然后生成这样的结果: 脑电图可以用于发现癫痫之类的疾病,追踪睡眠规律,或者确定麻醉剂效果等。 跟 fMRI 不一样的是,脑电图具有很高的时间分辨率,它能够在大脑发出电信号的同时捕捉到它们——只是颅骨会对时间精确度造成影响(因为骨头的导电性不佳)。 脑电图的主要缺点是空间分辨率。准确来说,它没有空间分辨率。每个电极只能记录下一个大致的平均值——数百万甚至数十亿神经元发出的总电流(而且由于颅骨的存在,这只是一个模糊的近似值)。 假设大脑是一个棒球场,其中的神经元是观众,现在我们需要的信息是观众们所说的话。在这种情况下,脑电图就像是放在场馆外面的一组麦克风,正对着场馆的外墙。你可以通过这些麦克风听到观众在什么时候欢呼,可能还可以猜得出他们在为什么欢呼。你能够从一些迹象中听出来现在是中场休息,或者听得出这是不是一场比分接近的比赛。你可能听得出有什么意外状况发生,但你能知道的也就这么多了。 皮质电图(Electrocorticography,ECoG)规模:大 分辨率:空间分辨率低,时间分辨率高 侵入性:部分侵入性 皮质电图的原理跟脑电图类似,同样都会采用电极——只是这种技术会将电极放在颅骨下面,也就是大脑表面。 虽然有点可怕,但很有效,至少比脑电图的效果好多了。没有了颅骨的干扰,皮质电图能够获取更高空间分辨率(1 厘米左右)和时间分辨率(5 毫秒)的信息。皮质电图的电极可以放在硬脑膜的上面或者下面: 回到我们刚才的棒球场比喻,皮质电图的麦克风是放在场馆里面的,离观众更近了一点。所以跟脑电图从场馆外接收的声音相比,皮质电图的麦克风可以捕捉到更清晰的声音,而且能更好地辨别不同坐席区中发出的声音。但这种提升是有代价的——它需要进行侵入性的手术。不过这种手术的侵入性也不算高,一位神经外科医生告诉我,「你可以用相对非侵入性的方式在硬脑膜下面塞东西,虽然还是要在脑壳上开个洞,但相对来说,它的侵入性不算高。」 局部场电位(Local Field Potential,LFP)规模:小 分辨率:空间分辨率中低,时间分辨率高 侵入性:高侵入性 从现在开始,我们就要从表面电极转到微电极——外科医生插进大脑里面的小针。 脑外科医生本·拉波波尔向我介绍了他父亲(一名神经科医生)以前制作微电极的方法:
到了现在,虽然有些微电极还是手工制作的,但是新的技术会借鉴来自集成电路产业的硅晶片和制造技术。 局部场电位的工作原理很简单:将这种带电极的极细探针插入皮质一、二毫米深的地方,它能收集到电极覆盖范围内所有神经元发出的平均电荷数。 局部场电位可以提供像 fMRI 那样不错的空间分辨率,以及类似于皮质电图的即时时间分辨率。所以就分辨率而言,它可以说是上述工具当中最好的。 可惜,它在另外两个标准方面的表现都很糟糕。 不像 fMRI、脑电图和皮质电图,采用微电极的局部场电位没有规模可言,它只能告诉你电极周围的一小块区域在发生什么,而且它的侵入性要高出许多——它的电极确实会进入大脑内部。 如果放在我们的棒球场比喻中,局部场电位就像是一个挂在某片坐席区上方的麦克风,它能够清晰地接收这片区域发出的声音,甚至还能偶尔听到单个观众说的话——但是大多数情况下只能感受到观众们大致的氛围。 局部场电位领域的一项最新发展是多电极阵列(multielectrode array),它的原理和局部场电位一样,只是它会同时在皮质的某个区域同时插上 100 个微电极。下面是一个多电极阵列的实物: 在这个 4 毫米 x 4 毫米的小方块上有 100 个细小的硅电极。你可以在下面这幅图片看到这些电极有多细——它们的最尖端只有几微米: 单细胞记录(Single-Unit Recording)规模:极小 分辨率:极高 侵入性:高侵入性 如果要记录更大范围的局部场电位,你可以采用尖端更圆滑的电极,从而增大电极的接触面积,以及降低电极的电阻,这是为了接收来自多个部位的微弱信号。最终的效果是让电极收集到局部区域内的神经元的整体活动。 单细胞记录也是采用微电极,但是这种电极的尖端会变得异常细小,因此它的电阻也会大大提高。这种方式可以屏蔽掉大多数的噪音,但也会导致电极几乎探测不到任何东西——除非在它特别靠近一个神经元的时候(也许距离 50 微米),神经元发出的信号强度足以穿过电极的电阻。由于这种方式可以探测到单个神经元的独特信号,而且没有背景噪音的干扰,所以现在我们就可以监视单个神经元的个体活动。这种方式的记录规模最小,分辨率最高。 对了,你可以在这里听到神经元是怎么激活的(你听到的是一个神经元发出的电子化学信号被转化为音频的效果。) 另外还有一种电极可以更近距离地探测神经元,它们采用的是一种叫做膜片钳(patch clamp)的技术,这种电极的顶端会被移除,剩下一根细小的玻璃吸管(glass pipette)[2],它可以将神经元细胞膜的一部分吸进玻璃管内,从而实现更精确的测量: 跟我们前面讨论过的方法相比,膜片钳技术还有一个好处,由于它会实际接触到神经元,所以除了记录以外,它还能刺激神经元,比如通过输入电流或者控制电压来进行一些特定的测试(其他方法也能刺激神经元,但不能针对刺激单个神经元)。 最后一种电极会真正刺穿细胞膜,并完全进入神经元内部,这种方法叫做尖锐电极记录(sharp electrode recording)。如果电极顶端足够尖锐就不会破坏神经元细胞——因为细胞膜会在电极周围闭合。这种方式可以轻易刺激神经元,或者记录神经元内外的电压差。但是这种技术对神经元的干预时间不长——因为被刺穿的神经元无法长时间存活。 在我们的棒球场比喻中,单细胞记录就像是别在一名观众衣领上的单向麦克风。膜片钳或尖锐电极记录就像是贴在一名观众喉咙上的麦克风,能够确切接收到观众的声带振动。这种方法能够很好地了解这名观众对比赛的看法,但你无法确定这个人的声音和反应能否反应比赛现场的情况。 这些基本上就是我们现在拥有的技术,至少就常用领域而言。对我们来说,这些工具已经先进得令人难以置信,但是在未来人类的眼中,它们就像是石器时代的技术一样。他们将难以相信,我们要在高分辨率和大规模之间作出取舍,而且还真的得打开一个人的脑袋才能实现高质量的信息读取或写入。 但尽管有着种种局限,这些工具还是让我们认识到了大脑的世界,并促进了一些不错的早期脑机接口技术的诞生。以下是我们目前已经取得的成果: 已经实现的脑机接口技术1969 年,研究员埃伯哈德·费兹(Eberhard Fetz)将猴子大脑中的一个神经元连接到了放在它面前的一个仪表盘。当神经元被触发的时候,仪表盘的指针会转动。如果猴子可以通过某种思考方式触发该神经元,并让仪表盘的指针转动,它就能得到一颗香蕉味的丸子作为奖励。渐渐地,猴子变得越来越擅长这个游戏,因为它想吃到更多丸子。这只猴子学会了控制神经元的触发,并在偶然之下成为了第一个真正的脑机接口被试对象。 相关的技术在接下来的几十年进展缓慢,但到了 90 年代中期,事情开始有了起色,并从此进入了一个稳步加速发展的阶段。 由于我们对大脑的认识和已有的电极硬件都非常原始,所以相关的研究主要集中在制作一些简单的接口,用于我们最了解大脑部位,比如运动皮质和视觉皮质。 此外,鉴于目前我们只可能在身患残疾的人身上进行人体实验,因为他们希望通过脑机接口修复身体的损伤(而且这也是目前市场的需求所在),所以到目前为止,相关的研究基本都集中在帮助残疾人恢复受损机能之上。 未来的主流脑机产业将会改变整个世界,并让全人类都拥有超能力,但是它们目前还处于起步阶段——我们应该以正在进行的相关研究作为线索,看看未来几十年乃至上百年后的世界将会发生什么翻天覆地的变化。 比如,看看这个: 这是阿兰·图灵(Alan Turing)在 1950 年建造的一台叫做「Pilot ACE」的计算机,这在当时可说是非常前沿的。 现在再看看这个: 在你阅读下文举出的例子时,我希望你能够联系到这个类比:
想象一下这个空格应该填上什么,我们会在文章后面回来探讨这个问题。 无论如何,从我阅读到的资料和相关领域人士的分享来看,目前正在大力研发的脑机接口主要有以下三个类型: 早期脑机接口类型一:将运动皮质作为遥控器如果你已经忘记了我在 9000 字前说过的东西,运动皮质就是这个东西: 大脑的各个部位都让我们难以理解,运动皮质已经是其中最容易理解的一个部位。最重要的是,这个区域拥有非常好的对应关系,也就是说,运动皮质的特定区域负责控制身体的特定部位。(还记得上面那个吓人的小矮人吗?) 另外很重要的一点是,运动皮质是大脑负责输出的主要区域之一。一个人做出的任何动作基本上都是由运动皮质直接操控的(至少是做出实际动作这一部分)。所以我们并不需要学习如何把运动皮质作为遥控器使用,因为大脑已经将运动皮质用作它的遥控器了。 现在试着把你的手举起来,然后放下。看到没?你的手就像个无人机玩具一样,你的大脑刚刚就是拿起了运动皮质遥控器,用它来让控制你的手举起又放下。 运动皮质脑机接口的目标是接入大脑的运动皮质,然后监听这个「遥控器」发出的命令,并将其发送到某种机器,后者可以像你的手一样对这个命令作出回应。运动皮质和手之间是通过神经传递信息的,而脑机接口则是运动皮质和计算机之间传递信息的介质,就是这么简单。 这类接口的主要应用是帮助个人(通常是高位截瘫或截肢患者)通过意念控制屏幕上的光标。 这种方式需要把一块含有 100 个电极的多电极阵列植入患者的运动皮质。瘫痪病人的运动皮质通常都是完好无损的——问题主要出在担任皮质和身体中间人的脊髓之上。所以在植入多电极阵列后,研究人员会要求患者尝试朝不同方向移动手臂。虽然他们的手臂事实上无法移动,但是他们的运动皮质仍然会照常发出移动手臂的信号。 当一个人移动自己的手臂时,他的运动皮质会触发一系列的活动,但是单个神经元通常只负责一种动作。所以某个神经元可能会在主人向右移动手臂时被触发,但当手臂移向其他方向时,这个神经元可能会没有那么活跃。如果只有这个神经元的信息,计算机可以知道这个人是否想向右移动手臂,除此以外就无从得知了。不过如果使用多电极阵列的话,阵列上的 100 个电极可以分别监听不同的神经元。[3]在进行试验的时候,研究人员会要求实验对象尝试向右移动手臂,这时可能在这 100 个电极中有 38 个监测到神经元的触发。当实验对象向左移动手臂时,可能有 41 个电极监测到神经元的触发。在测试过一系列不同的动作、方向和速度之后,计算机会从电极读取数据,然后大致整理出哪些神经元触发组合对应哪种动作意图,并在直角坐标系中标记出来。 接下来他们可以将这些数据与电脑屏幕对应起来,这时实验对象就能通过他们的意念尝试「移动」屏幕上的光标,实现真正控制光标的效果。这种方法是切实可行的——在运动皮质脑机接口的先驱 BrainGate的努力之下,下面的这位实验对象能够仅凭自己的意念来玩游戏: https://www.youtube.com/watch?v=TJJPbpHoPWoAnd if 100 neurons can tell you where they want to move a cursor, why couldn’t they tell you when they want to pick up a mug of coffee and take a sip? That’s what this quadriplegic woman did: 如果 100 个神经元可以确定光标在屏幕上移动的位置,那它们能不能发出拿起一杯咖啡并喝一口的指令呢?下面这位四肢瘫痪的女士就是这么做的: https://youtu.be/QRt8QCx3BCo另一位四肢瘫痪的女士能够在飞行模拟器中驾驶一架 F-35 战斗机,最近还有一只猴子能够用意念控制轮椅四处走动。 既然这种方法可以读取手臂的动作,身体的其他部位也可以读取吗?巴西的脑机接口先驱米格尔·尼古莱利斯(Miguel Nicolelis)和他的团队打造出了一副完整的外骨骼,让一位瘫痪少年为巴西世界杯开出第一脚球。
在这些发展当中孕育着未来技术突破的种子,比如脑间交流。 尼古莱利斯建立了这样一个实验,他在巴西和美国分别将一只老鼠关在笼子里面,然后通过互联网将两只老鼠的运动皮质连接起来。巴西鼠的笼子里面有两个拉杆,它已经知道按下哪个拉杆可以得到奖励,美国鼠的笼子里面也有两个拉杆,但是后者不知道自己的哪个拉杆可以带来奖励——不过它可以接收到巴西鼠发出的信号。在实验中,如果美国鼠选择了正确的拉杆,也就是巴西鼠按下的那个,两只老鼠都会得到奖励;如果它选错了,两只老鼠都不会得到奖励。令人惊讶的是,久而久之,这两只老鼠会越来越擅长玩这个游戏,并开始合作,就像是一个统一的神经系统一样——尽管它们都不知道对方的存在。在没有任何外部信息的情况下,美国鼠的成功率只有 50%,而得到了来自巴西鼠大脑的信号之后,它的成功率提升至 64%。(这里是该实验的视频。) 类似的实验也在真人身上进行过,只是实验的形式比较初步。这个实验的内容是让分别身处两幢楼里的两个人合作玩一个电子游戏。一个人可以看到游戏的画面,另一个人拿着控制手柄。两个人的头上都带着一个简单的脑电图装置,可以看到游戏画面的玩家负责想着用手按下手柄上的「射击」按钮,但不会真正动手。由于他们各自的大脑设备在互相通信,拿着手柄的玩家能感受到自己手指上的颤动,然后按下射击按钮。 早期脑机接口类型二:人工耳朵和眼睛恢复聋人的听觉和盲人的视觉是比较可行的一个脑机接口领域,主要有以下几个方面的原因。 首先,跟运动皮质一样,体觉皮质也是我们比较了解的大脑部位,因为体觉皮质跟身体各个部位也有比较好的对应关系。 其次,在许多早期应用中,我们不用真正接触大脑本身——只需要处理耳朵和眼睛连接到大脑的部位,因为它们通常是听觉或视觉受损出现的地方。 运动皮质相关的脑机接口主要是通过记录神经元来获取大脑的信息,而人工感官走的是另一个方向——通过刺激神经元来向大脑发送信息。 近几十年来,听觉修复领域出现了一项突破性的进展——耳蜗植入。
耳蜗假体是一台微型计算机,其中一端是一个麦克风(贴在耳朵上),另一端是一条电线,后者连接着一组被安装在耳蜗内的电极。 以上图为例,声音会被麦克风(耳朵上的那个小钩)采集,然后进入棕色的元件,后者会对声音进行初步处理,过滤掉次要频率的声音。接下来棕色元件会以电感应的方式,通过皮肤将信息传输至计算机的另一个元件,后者会将信息转化为电子脉冲并发送到耳蜗。耳蜗里的电极会根据频率对这些脉冲信号进行过滤,然后刺激听觉神经——就像是正常耳蜗的功能一样。这是耳蜗假体在外面看上去的样子: 换句话说,这就是一个人造耳朵,它能像正常耳朵一样实现声音-脉冲-听觉神经的处理过程。 被植入耳蜗假体的人听到的声音大概是这样的。 效果似乎不太好,为什么会这样?因为如果要达到真正耳朵听到的声音的丰富程度,你需要使用 3500 个电极,但大多数耳蜗假体只有 16 个电极左右[5],所以它们能听到的声音确实会粗糙一些。 不过由于我们还处于「Pilot ACE」的时代,所以粗糙也是理所当然的。 尽管如此,但是现在的耳蜗假体已经能让聋人听到他人的讲话以及进行对话,这已经是个突破性的进展了。[6] 现在,很多先天失聪婴儿的父母会在孩子大约一岁的时候给他们植入耳蜗假体。就像下面这个婴儿,他第一次听到声音时的反应太可爱了。 https://youtu.be/HTzTt1VnHRM类似的革命性进展也在失明修复领域出现,比如视网膜假体。 失明通常是视网膜病变导致的结果。在这种情况下,视网膜假体能以类似于耳蜗假体修复听觉的方式修复视觉(不过没有那么直接)。它能实现正常眼睛的功能,将信息以电子脉冲的形式传递给神经。 视网膜假体是比耳蜗假体更复杂的一种脑机接口。2011 年,第一款得到美国食品药物管理局(FDA)批准的视网膜假体面世——Second Sight生产的「Argus II」。这个视网膜假体的外观是这样的: 它的工作原理是这样的: https://youtu.be/Bi_HpbFKnSw这款视网膜假体带有 60 个传感器,而真正的视网膜拥有大约 100 万个神经元,所以还是粗糙了点。不过它已经可以看到物体模糊的边缘、形状和明暗变化,这总比什么都看不见要好。这里有一个好消息是你不需要 100 万个传感器才能得到相当的视力——模拟实验表明,带有 600 到 1000 个电极的视网膜假体已经足以提供阅读和人脸辨别的视力。 早期脑机接口类型三:深度大脑刺激深度大脑刺激的历史可以追溯至 1980 年代,虽然这也是一种比较粗糙的工具,但是它也改变了很多人的生活。 另外,它还是一种不需要与外界沟通的脑机接口——它是通过刺激大脑内部来达到治疗或改善身体机能的效果。 深度大脑刺激会采用一到两根电线,上面通常会连着四个不同位置的电极,然后将它们插入到脑中,一般会延伸到边缘系统的某个位置。电极的另一端被连接到一台被植入在上胸部的调节器。下面是这种装置的示意图: 这些植入在脑中的电极可以在有需要的时候对相关神经进行刺激,这个装置可以发挥许多重要的作用,比如:
这种技术还有一些实验性的用途(尚未经过 FDA 批准),比如用于舒缓偏头痛和幻肢痛等慢性疼痛;治疗焦虑症、抑郁症或者创伤后应激障碍;甚至可以结合身体其他部位的肌肉刺激,帮助恢复和复健由于中风或神经疾病导致的神经损伤。 以上就是早期脑机接口产业目前的发展现状,这同时也是埃隆·马斯克进入这个产业的节点。对于他和 Neuralink 来说,现在的脑机接口产业正处于 A 点。本文之前的全部内容让我们从过去走到了现在,接下来我们将要进入未来——我们要了解 B 点是什么,而我们又将如何到达那里。
[1]:作者注:科学界曾经认为,大脑中胶质细胞的数量可以达到神经元数量的 10 倍,但是[最近的研究](Know Your Neurons: What Is the Ratio of Glia to Neurons in the Brain?)表明它们的数量其实没有那么多。 [2]:作者注:真的非常细小——它的直径只有人类头发的 1/100。[这个视频](https://www.youtube.com/watch?v=2vI4fCsVdXc)介绍了玻璃吸管的制作过程。 [3]:作者注:研究员安德鲁·施瓦兹(Andrew Schwartz)将使用的电极数量比喻成民意调查,他表示「你调查的神经元越多,最后的结果就越准确。」 [4]:作者注:[这里](Everything You Should Know About Sound)是 Wait But Why 之前详细解释听觉原理的文章。 [5]:作者注:通过利用一些声音工程学的技术,耳蜗假体的研发人员已经可以做到将 16 个电极提升至 23 个电极的效果,如果将两只耳朵的假体叠加起来的话,可以达到 121 个电极的效果。 [6]:作者注:这里是一篇非常有趣的耳蜗假体[体验报告](My Bionic Quest for Boléro)。 (责任编辑:泉水) |