北大院长解读马斯克「读脑术」的来龙去脉
neuralink progress update, summer 2020视频截图
图源:neuralink凯发游戏官网
撰文 | 周程(北京大学哲学系教授、医学人文学院院长)
责编 | 李珊珊
北京时间8月29日凌晨,特斯拉ceo马斯克在美国旧金山展示了一套脑机接口新设备——一枚只有硬币大小,拥有 1024 个信道,可置于颅骨内侧,读取脑神经活动信息,实时无线传输脑电波数据的芯片;一台可以避开血管,在颅骨上开一小孔,将芯片快速、精准地植入预定位置的外科手术机器人。马斯克还列举了脑机接口技术有可能解决的疾病——听觉或视觉障碍、失忆、抑郁、癫痫、中风等。他认为,使用脑机接口技术,不仅可以召集特斯拉,玩虚拟游戏,还可以存储或替换记忆,甚至直接通过大脑交流就可以实现“心灵感应”,至于将人的意识数字化,高保真地上传给电脑,在“云”中实现“永生”也并非天方夜谭。
图源:unplash
马斯克对脑机接口技术的憧憬,吸引了媒体界的广泛关注。不过,这项脑机接口技术的发展前景被不少媒体严重夸大了,仿佛借助该项技术人脑与电脑互联,脑力指挥机器、完整上传意识指日可待。稍微考察一下读脑技术的发展历程,就会发现,在可预见的未来,这些都没有可能化为现实。
如何读取你的脑?
通过脑机接口读脑这件事,尽管听上去十分复杂,但其基本原理相当简单。
读脑的关键在于推测出与大脑的某种活动对应的心灵活动或行为表现。因此,读脑需要首先绘制出一副大脑活动与心灵活动或行为表现的对应关系图。这张关系图就像一个映射,左边是我们大脑的各种活动状态,右边是我们心灵的各种活动状态或行为的各种表现形式。有了这张关系图,只要探测出一个人的大脑活动状态,我们就可以顺着映射找到该个体所处的心灵活动状态或当时的外在行为表现。
但问题在于,如何才能获得这种关系图?
我们可以让个体处于某种心灵状态或行为表现之中,然后把此时的大脑活动与基准状态下的大脑活动进行对比,如果大脑的某个或某几个区域异常活跃,那么我们就推定这个或这些区域的活动与该心灵活动或行为表现相关。
画张关系图,这听上去很简单,然而,原理简单并不意味着读脑技术的发展就会一帆风顺。因为科学中存在很多“原则上”可行但实际上很难操作的情形。
例如,如何测定大脑的活动?测定大脑活动的理想方法应该是在一个或多个时间截面上从多个维度精确测定大脑中每个神经元的活动状态,而这在今天的技术条件下是难以实现的,因为目前实现这一目标的唯一可能的办法就是把大脑打开,而这显然是不符合生命伦理规范的。不仅如此,即便我们真的这么做了,由于大脑中的神经元数量惊人,我们获得的数据必然是海量的,而这样海量的数据在今天的技术条件下是很难得到妥善分析和处理的。
于是,人们只能通过一些间接指标来考察大脑的活动状态,例如脑电波强度、脑血流量和血氧饱和水平等。这便形成了读脑技术的几大门派。
用这些间接指标描述大脑的活动状态虽然有效,但不够完整。而且,在不能与神经元亲密接触的情况下测出的数据,也不够准确。所以,读脑技术虽然进步迅速,但要真正成气候尚需时日。
读脑术的进化
图源:unplash
如果按照脑成像的结果来区分,读脑技术可以划分为脑结构成像技术和脑功能成像技术两大类,前者关注的是大脑不同区域的空间关系,如哪些区域与哪些区域毗邻等,而后者关注的是不同区域间的功能关系,如哪些区域共同实现某一大脑功能等。如果按照电极的植入位置,譬如颅骨内、颅骨上、头皮上来区分,读脑技术又可以划分为侵入式、半侵入式和非侵入式三大类,植入颅骨内或放在颅骨上的属于有创技术,其受试者一般为病人;放在头皮上的属于无创技术,其受试者多为健康人群。
在各种读脑技术中,脑电图、正电子放射断层扫描和功能性磁共振成像最为常见。接下来,就简单谈谈这些技术的发展。
1、从大脑解剖到脑成像。
人体构造
人们对脑的研究自古不断,研究手段也随着科技的进步逐渐升级,有据可查的可以一直追溯到文艺复兴时期对大脑的解剖学研究。维萨留斯1543年出版的著作《人体构造》中就有不少大脑插图。不过,脑科学研究的革命性变革发生在1861年。这一年,法国神经学家保罗·布洛卡(paul broca)发现一名失语病人在左侧额叶某处存在脑损伤,而这意味着大脑不同区域和大脑不同功能之间很可能存在某种对应关系。今天,这种对应关系对于我们来说似乎是常识,但在当时却并非如此,因为在那之前,不少神经学家对特定脑区与特性功能之间的关联持高度怀疑态度。
到了1873年,意大利科学家卡米洛·高尔基(camillo golgi)首创铬酸盐-硝酸银染色法,这是发明最早的神经元染色法。19世纪末,西班牙的圣地亚哥·拉蒙·卡哈尔(santiago ramóny cajal)改进了高尔基的染色法,从而获得了更加清晰精美的大脑染色样本。运用这种染色方法,卡哈尔观察了婴儿的大脑样本。他发现神经元之间并未连结成一体,而是相互之间存在一定的缝隙,今天我们知道这种缝隙就是突触。卡哈尔的另一个重大贡献在于他运用其所发明的染色方法,仅凭一台显微镜就为神经元进行了分类,而且这一分类在今天依然被神经科学家们奉若经典。
19世纪末,人们对大脑的观测与理解不断深入。例如,1875年,英国的理查德·凯顿(richard caton)首次记录了兔脑神经的电活动。1890年,人们就已经知道血流量与血氧量的改变与神经元的活动强度存在紧密关系。1918年,美国神经外科医生沃尔特·丹迪(walter dandy)在刚问世的x射线成像技术的基础上发明了脑室造影术。1927年,葡萄牙神经科学家埃加斯·莫尼斯(egas moniz)又发明了脑血管成像技术,使得颅内病变诊断更加准确。
2、脑电图
图源:motion-eu.org
1929年德国人汉斯·贝加(hans berger)借助置于头皮上的电极首次成功地测量到脑部的电活动,奠定了脑电图技术发展的首座里程碑。此后贝加的实验结论被多人成功重复,于是该技术获得了科学界的认同。
脑电图的工作原理是通过置于头皮上的电极来记录大脑内部的电活动,这种电活动可通过示波器显示出来。从人体表面无创探测到的生物电的电压非常小,通常在100uv内。如此低的电压原本不足以达到显示所需的电压输入要求,所幸电子三极管自20世纪初问世后获得了快速发展,从而为微弱信号的放大奠定了技术基础。紧接着晶体管又于20世纪中叶问世,从而为有效消除市电对生物电信号的干扰创造了条件。今天,脑电图技术已经可以将电信号放大几千倍,这在其诞生之初是难以想象的。
我们在脑电图中可以观察到形状不同的波或节律,这些波或节律与人的心灵活动密切相关。当人的心灵活动增强时,脑电图节律就会增高,反之就会减慢。通过总结这些规律,研究者便可确定不同心灵状态下大脑的脑电图特征,进而可通过某人的脑电图特征反推出其当前的心灵状态或行为表现。
脑电图的最大优点在于其探测的是脑内电信号,因此时间分辨率极高,可以达到毫秒级甚至亚毫秒级。基于此,脑电图常常被用来对受试者的大脑活动进行实时监测。脑电图最大的缺陷在于其空间分辨率比较低。一方面,置于头皮上的电极探测的是电极下方的脑区内上百万个神经元的协同放电,而非某个神经元单独的放电活动;另一方面,大脑活动产生的电场很容易受到来自多方的干扰,这些干扰不止来自环境,还可能来自大脑组织本身。因此,脑电图的使用范围和信号采集的准确性受到了很大的局限。为提高空间分辨率和减少干扰,有必要将脑电图装置的电极置入颅骨上甚至颅骨内。可以说,马斯克的侵入式脑机接口设备就是沿着这一技术轨道发展起来的。
3、正电子放射断层扫描。
pet. 图源:wiki
脑电图在解析脑内动态活动方面的良好表现,驱使研究者尝试运用各种其他方法将脑内认知过程可视化。1973年,英国电器工程师高弗雷·豪斯菲尔德(godfrey hounsfield)以阿兰·柯马克(alan cormark)提出的理论为基础,发明了x射线计算机断层成像技术,亦即ct技术,实现了无创探测人脑内部结构。不过,ct技术只能告诉我们大脑的内部结构是什么,它不能告诉我们当大脑处于某一意识状态时,大脑的哪些区域以怎样的顺序参与了该意识状态的形成。也就是说,ct只能显示大脑的形,并不能揭示大脑的神。
解决这一问题的捷径之一是把被放射性核素标记过的物质作为示踪剂引入脑成像。由于受试者持续暴露在核素的辐射之中,健康会受到影响,所以用于人体研究的核素的半衰期要求非常短。问题是,半衰期这么短的核素基本上不可能存在于自然界中,以致于研究者们在很长一段时间内都无法获得符合条件的核素。1957年,医用回旋加速器问世,使人工生产临床研究所需的放射性核素成为可能。尽管西摩·凯提(seymour kety)等人随即就开始尝试把核素引入脑成像,但时过20年,放射性核素才得以与ct技术结合,正电子发射断层扫描技术,亦即pet技术才宣告诞生。
pet的原理是通过检测正电子来获得有关大脑活动的信息。具体来说,研究者首先用发射正电子的核素(¹¹c,¹⁵o,¹⁸f,¹³n等)标记化合物,主要是葡萄糖和水,然后将其注入人体。这些带有放射性的化合物会迅速集聚到大脑的血管中,当大脑皮层的某个区域处于兴奋状态时,这些被标记过的葡萄糖和水就会移向该区域。此时,只需在体外监测正电子湮灭时发射的γ射线就可以获得大脑不同区域兴奋水平的功能性图像。有了这一图像,人们就可以反推出受试者当下的心灵状态或行为表现。
pet的灵敏度非常高,可形成脑功能的三维图像,其空间分辨率在3-4毫米内,定位相当精确。由于使用正电子标记的化合物作为示踪剂,所以pet可以显示人在完成特定任务时大脑的动态活动情况。
不过,pet技术也存在一些弊端。首先,跟脑电图不同,pet是通过测量不同脑区的葡萄糖和水的含量来间接测量脑活动,因此其时间分辨率远远低于脑电图。其次,考虑到放射性核素长期滞留在人体内会对受试者产生伤害,pet通常采用的放射性核素半衰期多在几分钟以内,这就导致pet无法用于长期读脑。再次,pet成像时间较长,很难实时记录认知活动的演进过程。最后,pet使用的放射性同位素是人工生产的,造价比较高,因此其成套设备一度被认为是当今世界上最昂贵的生物医学影像机。
4、功能性磁共振成像。
哈佛新闻截图(fmri)
对于读脑来说,无创、无放射性的活体脑功能检测技术显然更为理想,功能性磁共振成像,亦即fmri的出现回应了这种期待。
1946年,物质的核磁共振现象被发现。20世纪70年代,核磁共振与ct技术结合产生了核磁共振成像。因为ct对于人体低密度组织,如大脑的成像效果并不理想,它的优势是对人体高密度组织,如骨骼的成像,而核磁共振成像恰好弥补了这一短板,它可以提供较为清晰的人体低密度组织图像。不过,通用的核磁共振成像依然是结构成像,而非功能成像,即它只能够告诉我们大脑中有什么以及不同部位之间构成了怎样的空间关系,而不能告诉我们当大脑执行某一功能时,哪些脑区参与了这一功能的实现。直到1990年,基于核磁共振成像技术,美国贝尔实验室的日本科学家小川诚二等人根据脑功能活动区氧和血红蛋白含量的增加导致磁共振信号增强的原理,得到了关于人脑的功能性磁共振图像,进而发明了今天获得广泛应用的功能性磁共振成像技术。fmri一经问世就很快成了脑研究领域中发展最迅速的一种脑功能检测技术。
fmri的工作机理依据的是血氧水平依赖效应。具体来说,血液中的血红蛋白以两种形式存在,即脱氧血红蛋白和氧合血红蛋白。其中,脱氧血红蛋白是顺磁性物质,氧合血红蛋白是逆磁性物质。顺磁性物质会引发磁场的不均匀性,进而使磁共振成像的特征量t2延长。当个体执行某一认知任务时,相关脑区就会兴奋,以致这些区域的血流量会相应增加,血流量的增加导致这些区域的t2值得到延长,而这种延长对应到fmri图像上就是强信号。反过来,如果当某一脑区不参与个体的某一认知任务,那么该脑区的血流量就会相对较低,反映到fmri成像上就是弱信号。于是,通过fmri我们可以看到,当个体处于某种心灵状态时,哪些区域活动增强,哪些区域活动不变甚至减弱,进而可推断出哪些脑区的何种活动与该心灵状态或行为表现相关。
与脑电图和正电子发射断层扫描相比,fmri在时间和空间分辨率上的表现比较均衡。与正电子发射断层扫描一样,fmri能够较为精确地捕捉到大脑活动的变化发生在哪里。然而,fmri实现这一功能的速度更快,这有助于分析发生速度极快的心理过程,如阅读单词和人脸识别等。由于fmri不使用放射性物质,所以它比正电子发射断层扫描的风险低,成本也比较低。不过,fmri也存在自身的短板。fmri是通过探测血流量的变化来间接探测脑活动水平的变化,由于血流量的变化明显滞后于脑活动变化,所以fmri在时间分辨率上不及脑电图。此外,fmri要求受试者整个身体都处于扫描仪内且不能随意移动,这种不便在很大程度上限制了其被推广为常规读脑设备的可能。
读脑术的局限
当然,不论使用何种读脑技术,目前的读脑研究都只能揭示个体的大脑活动状态与其某种心灵状态或行为表现相关,但相关性不等于因果性,而且个体表现不等于群体表现。人与人之间存在着巨大的个体差异性,这种差异性在基因层面上已经获得证实,而其在大脑层面上的存在也是可以想见的。人的大脑具有高度的可塑性,也就是说,我们所处的环境极大地影响着大脑神经元的连结结构和连结强度。这种可塑性当然是进化的结果,因为不同的环境中存在着不同的生存问题,而不同的神经元网络在解决不同生存问题上的表现是存在着差异的。这种个体差异性不可避免地给读脑研究带来了挑战。除了这些生理差异,受试者的情绪、记忆负荷等心理因素以及精神状态、疲劳和注意力集中水平等也会影响读脑的准确性。
读脑的关键在于得到一张心灵状态或行为表现与大脑活动状态之间的关系图,个体差异性的存在意味着我们所获得的上述关系图可能仅仅适用于某个人群、某个家族,甚至仅仅适用于某个人。那么,我们究竟需要构建多少张这样的关系图呢?或者说,我们究竟有没有办法构建出一张具有普适性的关系图呢?显然,这些都还有待于深入研究。
与非侵入式读脑技术相比,使用侵入式读脑技术获得的有关神经元的活动数据更为精确。但是,将脑机接口植入人脑,尤其是颅骨内,需要打开颅骨,而光是颅骨和头皮之间就有十多层组织,头骨和大脑之间还有三层薄膜,如何穿透这些组织而不引起出血等损伤?而且,人体免疫系统会自动识别侵入物,并立即派出免疫细胞把它包围起来形成愈伤组织,该如何骗取免疫细胞的信任,让芯片能够正常存留在脑中持续发挥作用呢?还有,脑神经元数量巨大,不往脑内植入大量的电极,根本无法实施精确监测。此外,将复杂的神经元活动还原成简单的脑电波数据,也存在方法论难题。重要的是,即使读脑技术趋于完善,那也只能解决脑内信息的读取问题,而只有通过某种输入实现对神经活动的有效干预,才有可能治疗脑部损伤、视觉障碍等疾患。
由此看来,马斯克的脑机接口新设备仍只停留在通过测定有限的脑电波数据来推测大脑的复杂意识活动的初级阶段,换言之,它现在还只会捕风捉影,只能采集部分神经元发出的电磁信号,而且只能由脑到机单向传输神经活动信息,距离将人的意识数字化,高保真地上传给电脑,以及由机到脑对人脑的记忆进行改写,按照意愿对神经活动进行干预还有相当漫长的路要走。
马斯克是非常善于制造话题的商人,他此次发布的脑机接口技术并没有实质性地超越脑科学界的既有研究,就像他的bfk火箭技术并没有超越nasa的既有技术一样。然而只要把控好这类高科技话题,不时地推陈出新,他就能吸引更多战略投资,持续推高公司股价,进一步支持公司科研。但是全世界像马斯克这样既能够制造话题“割韭菜”,又能真正推动一些前沿研究的商人并不多。
前沿脑科学研究耗资巨大,商业化程度也相对较低,特别是短时间内实现大跃进的可能性有限,但脑机接口技术伦理值得提前深入研究——虽然这项技术短期内不可能实现大跃进,但是一旦取得重大突破,绝对有潜力重塑人类历史的进程。
制版编辑 | 栗子