我们在神经科学上犯了什么错误?
/1935年,一位雄心勃勃的神经学教授埃加斯·莫尼兹(Egas Moniz)坐在一个关于神经病学的研讨会上额叶他被神经科学家卡莱尔·f·雅各布森(Carlyle F. Jacobsen)对他与同事约翰·富尔顿(John Fulton)进行的一些实验的描述迷住了。雅各布森和富尔顿损坏了一只叫贝基的黑猩猩的额叶之后,他们观察到一个相当大的行为转变.贝基以前很固执,不稳定,很难训练,但手术后她变得平静,镇定,顺从。
莫尼兹在阅读了一些关于额叶肿瘤及其如何影响人格的论文后,已经开始思考额叶手术对人类的潜在治疗价值。他认为一些精神障碍是由额叶回路的静态异常引起的。通过切除一部分额叶,他假设他也可以切除有问题的神经元和通路,在这个过程中减轻患者的症状。虽然莫尼兹一直在考虑这种可能性,但雅各布森对贝基变化的描述给了莫尼兹一个动力,让他在人类身上尝试类似的方法。在看到雅各布森的报告三个月后,他就这样做了,后来被称为额叶切除术的外科手术诞生了。
莫尼兹的手术最初是在病人的头骨上钻两个洞,然后在额叶皮层下注射纯酒精,希望能破坏精神障碍所在的区域。然而,莫尼兹很快就转向了另一种消融工具——他称之为白质刀(leucoome,在希腊语中是“白质刀”的意思)的钢环——并开始称这种手术为前额叶白质切开术。尽管按照今天的标准,他评估手术效果的方法还不够——例如,他通常只在手术后几天对患者进行监测——但莫尼兹报告说,大多数接受手术的患者都康复或改善了。很快,前额叶白质切开术在世界上许多国家都得到了应用。
这次手术引起了神经学家沃尔特·弗里曼和神经外科医生詹姆斯·沃茨的兴趣。他们再次修改了手术程序,这一次需要使用一个大刮刀从侧面进入头骨。进入头盖骨后,刮刀被上下摆动希望能切断丘脑而且前额叶皮层(基于这样一种假设,即这些联系对情绪反应至关重要,在功能不正常时可能引发疾病)。他们还将该手术重新命名为“额叶白质切开术”,因为白质切开术意味着只去除白质,而他们的方法并非如此。
几年后(1946年),弗里曼对手术进行了最后一次修改。他主张使用眼窝作为额叶的入口(再次切断丘脑和额叶区域之间的联系)。作为消融的工具,他选择了一个冰锥。冰锥从眼窝插入,在周围摆动进行切割,然后取出。这个过程可以在10分钟内完成;这种新的“经眶额叶切除术”的发展带来了额叶切除术的真正全盛时期。
经眶额叶切开术的引入使该手术的受欢迎程度显著提高——可能是由于该手术的简单和方便。从1949年到1952年,美国每年大约有5000例额叶切除术(20世纪70年代完成的额叶切除术的总数)大概在4万到5万之间).瓦茨强烈反对将额叶切除术转变为一种可以在办公室快速完成的手术——而且是由精神科医生而不是外科医生完成的,这导致他和弗里曼断绝了合作关系。
然而,弗里曼并没有气馁;他成为了经眶额叶切除术的热心推动者。他在美国各地旅行,在精神病院停留,对任何似乎符合条件的病人进行手术,并培训工作人员在他离开后进行手术。弗里曼本人被认为进行或指导了大约3500例额叶切除术;他的病人包括一些未成年人和一个四岁的小孩(手术后3周死亡)。
然而,最终,经眶额叶切除术的流行度开始下降。有人会认为,这是因为人们认识到这个过程是多么野蛮(以及这个方法建立在一些脆弱的科学基础上)。然而,放弃这项行动的真正原因更加务实。额叶切除术的衰落始于对手术有效性的一些质疑,尤其是在治疗精神分裂症等特定疾病时。人们还认识到,某些类型的认知,如动机、自发性和抽象思维,都不可挽回地受到了这个过程的影响。额叶切除术的最后一颗钉子是氯丙嗪等精神药物的开发,它第一次为临床医生提供了治疗难以治疗的精神障碍病例的药理学选择。
现在,我们很容易将额叶切除术视为残忍的做法,并嘲笑这种手术为什么应该起作用的科学解释似乎很脆弱。然而,把科学史上的这些问题放在它们所处的时代背景下看待是很重要的。在一个有效的精神药物尚不存在的年代,心理外科干预被视为“未来的浪潮”。它们为治疗通常无法治愈并可能使人衰弱的疾病提供了希望。虽然对我们现在来说,额叶切除术的方法似乎太无选择性了(这意味着如此严重的脑损伤不太可能只影响一种精神功能),但减少额叶活动可能减少精神激动的想法实际上是基于当时可用的科学文献。
尽管如此,很明显,试图通过造成严重的脑损伤来治疗精神疾病的决定在多个层面上体现了逻辑上的失败。当我们今天讨论神经科学时,我们经常假设我们这种令人震惊的错误的日子已经结束了。虽然自额叶切除术以来,我们确实取得了进步(特别是在保护患者免受这种未经测试和危险治疗的保护措施方面),但在神经科学历史上,我们并没有从这段肮脏的时间中走得太远。今天,关于大脑的未知之处仍然比已知之处要多,因此可以预期,我们在如何思考大脑功能、神经科学的实验方法等方面继续犯重大错误。
其中一些错误可能仅仅是由于人类理解困难问题的自然方法。例如,当我们遇到一个复杂的问题时,我们通常首先试图通过设计一些简单的描述方法来简化它。一旦达到了基本的理解,我们就会在基础知识的基础上进一步发展,从而形成更全面的理解——这种理解更有可能更接近事实。然而,在试图解释像神经科学这样复杂的事情时,对这个主题过于简单的概念化会产生无数错误的假设。在科学领域,这些类型的错误可能会导致一个领域偏离正轨多年,然后才能找到正确的方向。
其他错误涉及研究方法。由于神经科学在过去半个世纪里的快速技术进步,我们有了一些真正令人惊叹的神经科学研究工具,这些工具在100年前只能在科幻小说中出现。然而,对这些工具的兴奋,在某些情况下,导致研究人员在我们完全准备好之前就开始广泛使用它们。这导致我们使用的方法还不能回答我们假设它们可以回答的问题,并为我们提供了有时我们无法准确解释的结果。在接受我们得到的答案是合理的,并假设我们对结果的解释是有效的时候,我们可能会犯错误,在一段时间内使假设的发展混淆。
从20世纪到21世纪,神经科学的进步令人难以置信,我们在理解方面的成功远远超过了我们长期以来的失败。然而,任何科学领域都充斥着错误,神经科学也不例外。在这篇文章中,我将讨论几个错误和误解如何继续影响神经科学领域的进展的例子。
________________神经递质
如今,神经元使用信号分子,比如神经递质人与人之间的交流是即使非科学家也广为人知的科学知识之一。因此,这种理解只有不到100年的历史,这可能有点令人惊讶。是在1921年德国科学家Otto Loewi首先证明当受到刺激时迷走神经释放一种化学物质,可以影响附近细胞的活动。几年后,亨利·戴尔将这种物质分离出来并确定为乙酰胆碱(在这一点上,一种物质已经被确定,只是不是神经递质)。然而,直到20世纪中期,人们才开始神经递质在整个大脑中被使用的观点被广泛接受.其他神经递质的发现神经肽散落在20世纪后半叶。
当然,每当一种新的神经递质(或神经肽等其他信号分子)被发现时,科学家们想要回答的第一个问题之一就是“它在大脑中扮演什么角色?”回答这个问题的方法通常涉及到某种程度的简化,因为研究人员似乎在寻找一个可以用来描述神经递质的压倒一切的功能。因此,神经递质发现的第一个真正有趣的功能往往成为一种定义它的方法。
渐渐地,这种神经递质所发现的功能变得如此多样化,以至于将一种主要作用附加到它身上不再是合理的,研究人员被迫通过纳入新的发现来修改他们对神经递质功能的最初解释。有时,人们后来发现,与神经递质相关的原始功能甚至与这种化学物质在大脑中实际负责的任务不太匹配。然而,神经递质有一个主要功能的想法很难说服人们忘记。这就成了一个问题,因为不准确的概念化可能会导致多年的研究来寻找证据来支持神经递质的特定作用,而这种假设的作用可能会被误解——或者完全错误。
神经肽催产素为这种现象提供了一个很好的例子。催产素的历史始于上文提到的亨利·戴尔。1906年,戴尔发现了牛垂体提取物可加速子宫收缩当给各种哺乳动物包括猫,狗,兔子和老鼠。这个发现很快促使人们探索使用类似的提取物来帮助人类分娩;研究发现,它们对促进进展缓慢的分娩尤其有帮助。它对分娩的影响可能是催产素得名的原因,这个名字来自希腊语,意思是“快速分娩”。
直到研究人员能够在实验室中合成催产素,临床上才开始广泛使用催产素。但在20世纪50年代,催产素出现了成为最常用的引产剂在世界各地(以Pitocin和Syntocinon的商品名出售)。然而,尽管催产素扮演着如此重要的角色在很大比例的怀孕中如今,在过去几十年里,绝大多数关于催产素的研究和相关新闻都涉及到这种激素的不同功能:爱、信任和社会联系。
这一研究思路可以追溯到20世纪70年代,当时研究人员了解到催产素在整个大脑中到达目标,这表明它可能在行为中发挥作用。不久之后,研究人员发现注射催产素可以促使未交配的雌性大鼠表现出母性行为就像筑巢一样。然后研究人员开始探索催产素在各种社会互动中的可能作用从性行为到攻击性行为。在20世纪90年代初,一些关于催产素对形成社会关系的潜在贡献的发现出现在一个不常见的物种中,作为研究对象:草原田鼠。
草原田鼠是一种小型北美啮齿动物,看起来有点像地鼠和老鼠的杂交。它们是一种普通的动物,除了它们的社会生活有一个不同寻常的特征:它们与异性田鼠形成了主要的一夫一妻制的长期关系。这在哺乳动物中并不常见,因为估计只有介于两者之间只有不到3%到5%的哺乳动物表现出一夫一妻制的迹象.
一夫一妻制的啮齿动物为在实验室研究一夫一妻制提供了一个有趣的机会。研究人员发现,雌性草原田鼠开始表现出对雄性田鼠的偏好——这种偏好可以导致长期的依恋关系在同一个笼子里待了24小时后作为男性。有人还指出,管理催产素使女性更有可能产生这种偏好对雄性田鼠,进行催产素治疗拮抗剂降低了这种可能性.因此,人们认识到催产素在草原田鼠异性社会关系的形成中起着至关重要的作用——这一发现将有助于掀起一股研究催产素在社会关系和其他亲社会行为中的作用的热潮。
当研究人员从草原田鼠等啮齿类动物入手,试图了解催产素在人类中可能发挥的作用时,表明催产素可以促进人们积极情绪和行为的研究结果开始积累起来。比如催产素的使用,会增加信任吗.高水平的人催产素被观察到表现出更强的同理心.催产素被发现可以让人们更慷慨为了促进长期关系中的忠诚一项研究甚至发现,抚摸狗与催产素水平升高有关无论是人类还是狗.由于大量研究结果表明催产素对社交有积极作用,这种激素获得了一系列新的绰号,包括催产素爱的荷尔蒙,信任激素,甚至拥抱激素.
这些新发现的催产素社会角色让研究人员兴奋不已,他们急切地——也许是冲动地——开始探索催产素缺陷在精神疾病中的作用,以及使用催产素纠正这些缺陷的可能性。在这方面获得过多关注的一种疾病是自闭症谱系障碍,简称自闭症。催产素不足似乎是自闭症的一个合理解释,因为社交障碍是这种疾病的一个定义特征,而催产素似乎能促进健康的社交行为。然而,当研究人员开始深入研究血液中催产素水平与自闭症之间的关系时,他们没有发现什么似乎是直接的关系.研究人员没有被吓倒,而是探索了鼻内注射催产素的方法,即将这种神经肽喷洒到鼻腔,以缓解自闭症患者的症状。最初,有鼻内注射的迹象催产素可能对改善自闭症症状有效(详情见下文)。
然而,很快,一些人开始质疑,是否围绕着“信任激素”的所有兴奋导致研究人员在实验设计方面做出了仓促的决定,因为所有使用鼻内催产素给药的研究都使用了一种没有——而且仍然没有——完全验证的方法。研究人员转向鼻内给药,因为催产素会进入血液似乎没有穿过血脑屏障可观的:可观的数量;然而,有迹象表明神经肽确实通过鼻内途径进入大脑.然而,问题是,根据研究,即使通过鼻内给药,也只有很少的催产素能到达大脑有人估计只有给药剂量的0.005%.即使使用非常高的剂量,通过鼻内传递到达大脑的量似乎无法与必须使用的催产素相比直接进入动物的大脑(脑室内)以影响其行为。
但许多研究都表明了这种影响,那么到底发生了什么呢?一种可能性是,这种效果不是由于催产素对中枢神经系统的影响,而是由于催产素进入血液,并与大脑中大量的催产素受体相互作用周围神经系统;如果是真的,这就意味着外生催产素并没有像研究人员假设的那样对大脑产生影响。另一个更令人担忧的可能性是,许多发表的关于鼻内催产素效果的研究都存在方法论问题,比如数据分析的统计方法存在问题。
的确,对一些重要论文的统计方法的批评在这个领域已经公开了。最近的一项研究也发现鼻内催产素的研究通常样本量小;小型研究的重要发现更有可能是统计畸变,不能代表真实的影响。这也是可能的整个研究领域都受到发表偏倚的影响即倾向于发表观察到显著结果的研究报告,而忽视发表未能看到任何显著影响的研究报告。这似乎是一件不可避免的坏事,因为期刊读者更有可能对新发现感兴趣,而不是对没有结果的实验感兴趣。然而,忽视不重要的发现可能会导致夸大观察到的效果的重要性,因为现有的文献似乎表明没有相互矛盾的证据(即使这样的证据可能隐藏在世界各地研究人员的文件抽屉里)。
这些潜在的问题被不一致的研究结果和失败的复制或重复的研究所强调,这些研究报告了鼻内催产素的显著作用。例如,最具影响力的一项关于鼻内催产素的研究发现催产素增加信任,已经复制失败好几次了。在许多情况下,在最初的报告表明有显著效果后,又出现了无效研究结果。例如,上面提到的早期自闭症研究的结果与多个随机对照试验相矛盾在这里而且在这里)进行的研究,结果显示缺乏显著的治疗效果。
毫不奇怪,多年来,人们对催产素作为一种促进积极情绪和行为的神经肽的简单理解也变得更加复杂,因为人们了解到催产素的作用可能并不总是那么乐观。例如,在一项研究中,研究人员观察到鼻内催产素与增加的嫉妒和幸灾乐祸有关.另一个研究发现催产素会增加民族中心主义或认为自己的种族或文化高于他人的倾向。在最近的一项研究中,鼻内注射催产素会增加攻击性行为.为了使情况更加复杂,使用了催产素对男性和女性的作用可能不一样甚至可能是在不同的个体和不同的环境背景下完全不同.
为了解释这些不一致的发现,研究人员对催产素在社会行为中的作用提出了新的解释。例如,一种假设认为催产素参与促进反应对于任何重要的社交线索——无论是积极的(例如微笑)还是消极的(例如攻击);这有时被称为“社会显著性”假说。尽管最近人们努力调和催产素研究中看似矛盾的发现,然而,关于催产素的作用仍然没有达成共识,而催产素参与积极社会行为的假设继续指导着该领域的大多数研究。
因此,多年来,催产素的研究一直集中在神经肽的作用上,这种作用往好里说是耸人听闻的,往坏里说是严重缺陷的。催产素只是这一现象的最新例子。20世纪90年代,多巴胺赢得了“快乐神经递质”的美誉。不久之后,5 -羟色胺被称为“情绪神经递质”。这些命名是基于与这些神经递质相关的最引人注目的发现:多巴胺参与处理奖励刺激,血清素是抑郁症治疗的目标。
然而,现在我们对这些物质了解得更多了,很明显,这些功能的简短定义太简单了。多巴胺和血清素不仅分别涉及奖励和情绪,而且这两种神经递质在奖励和情绪中的作用似乎非常复杂,人们对它们的了解很少。例如,大多数研究人员不再认为多巴胺信号原因快乐,但它涉及到其他复杂的难忘的经历,比如重要刺激的识别在环境中——它们是否积极(即奖励)或消极.同样,血清素水平本身并不能决定情绪现在是常识了在科学界(也正在进入公众的认知)。因此,这些简短、容易记住的标题具有误导性,甚至在某种程度上毫无用处。
在将一种功能分配给一种神经递质或神经肽时,我们忽略了一些重要的事实,比如这些神经化学物质通常具有多种功能受体它们所针对的子类型,有时会产生截然不同的效果。我们忽视了大脑的不同区域对每种神经化学物质有不同水平的受体,并且可能优先被一种受体亚型所占据,这导致了具有不同功能专门化的不同大脑区域的不同活动模式。再加上受体激活的所有下游效应(这可能会因受体亚型、发现的大脑区域等而显著不同),你就有了一个极其复杂的画面。试图用一个函数来概括它是荒谬的。
这些简化的方法不仅阻碍了对大脑的更全面的理解,还导致浪费了无数的研究时间和研究资金,以寻求对想法的确认,而这些想法最终可能不得不被更详细的东西所取代。无论如何,科学中的这种简化似乎是有目的的。我们的大脑倾向于用这些直截了当的方式来解释事情——可能是因为没有一些可理解的框架作为出发点,理解像大脑这样复杂的事情似乎是一项艰巨的任务。然而,如果我们要利用这种方法,我们至少应该更多地意识到我们这样做的倾向。通过认识到,当涉及到大脑时,我们所讲述的故事几乎总是比我们倾向于相信的要复杂得多,也许我们可以避免犯过去所犯的过度简化的错误。
精神治疗药物和它们所矫正的缺陷
在20世纪50年代之前,精神疾病的治疗方法与今天的非常不同。如上所述,未经改良的神经外科手术,如经眶额叶切开术,被认为是治疗从恐慌症到精神分裂症等各种疾病的可行方法。但是,额叶切除术只是当时使用的许多具有潜在危险的干预措施之一,这些措施对改善大多数患者的心理健康几乎没有什么作用。药物治疗也没有更精细,而且通常涉及使用药物,这些药物只是充当强镇定剂,使患者的行为更易于控制。
然而,在20世纪50年代,当一波新的药物成为精神治疗的一部分时,情况开始发生巨大变化。第一批治疗精神分裂症的抗精神病药,第一批抗抑郁药,第一批治疗焦虑和失眠的苯二氮平类药物都是在这十年里发现的。一些把20世纪50年代称为“黄金十年”精神药理学,以及随后几十年的“精神药理学革命”,因为在这段时间里,精神药物的发现和开发将取得指数级的进展;很快,药物治疗将成为治疗精神疾病的首选方法。
在20世纪下半叶,新的精神药物的成功让人有些惊讶,因为人们对这些药物用于治疗的疾病仍然知之甚少。因此,药物通常是通过试错过程才被发现有效的,也就是说,我们尽可能多地测试物质,最终可能会找到一种治疗这种疾病的药物。由于人们对这些疾病的生物学原因知之甚少,如果发现一种具有已知机制的药物对治疗一种机制未知的疾病有效,通常会导致一种假设,即这种疾病一定是由于药物影响的系统中断造成的。
抗抑郁药就是这种现象的一个主要例子。在20世纪50年代之前,对抑郁症的生物学理解基本上是不存在的。当时关于抑郁症的主流观点是精神分析——抑郁症是由一个人性格中交战方面的内部冲突引起的,而这些冲突通常被认为是由一个人早年经历的麻烦或创伤经历的内化所造成的。唯一的非精神分析治疗方法包括人们知之甚少且通常不成功的程序,如电休克疗法在某些情况下是否有效而巴比妥酸盐或安非他明等药物似乎并没有针对抑郁症的任何特定药物,而是分别引起广泛的镇静或刺激。
第一批抗抑郁药是偶然发现的。异丙肼是第一批专门用于治疗抑郁症的药物之一,另一种药物是丙咪嗪,它与异丙肼几乎同时被发现并首次用于临床。异丙肼的故事就是一个很好的例子。在20世纪50年代早期,研究人员正在研究一种名为联氨的化学物质,并研究其衍生物的抗结核病特性(结核病在当时是一种祸害,测试任何化学物质治疗这种疾病的潜力都是常规)。有趣的是,如果德国人在第二次世界大战期间没有使用肼作为火箭燃料,联氨衍生物可能永远不会被测试在战争结束时,大量剩余的这种物质被发现,然后出售以低价卖给制药公司。
1952年,在纽约斯塔顿岛的海景医院,一种名为异丙肼的肼衍生物在结核病患者身上进行了测试。尽管这种药物在治疗结核病方面似乎并不优于其他抗结核药物,但在这些初步试验中注意到一个奇怪的副作用:服用异丙肼的患者表现出更强的精力和明显的情绪改善。一位研究人员报告说病人们“在大厅里跳舞,尽管他们的肺里有洞。”虽然最初很大程度上被忽视为异丙肼治疗的“副作用”,但最终研究人员开始对药物本身的情绪改善作用感兴趣;在20世纪90年代结束之前,这种药物被用于治疗抑郁症患者。
大约在第一批抗抑郁药物被发现的同时,一种新技术叫做荧光分光光度法正在被开发。这项技术使研究人员能够检测神经递质水平的变化类,(如多巴胺,血清素,去甲肾上腺素)后给动物服用药物(如异丙肼)。荧光光谱法允许研究人员确定异丙肼和丙咪嗪对单胺有影响。具体来说,服用这些抗抑郁药与血清素和去甲肾上腺素水平的增加有关。
这一发现导致了抑郁症的第一个生物学假说这表明抑郁症是由血清素和/或去甲肾上腺素水平不足引起的。起初,这个假设主要集中在去甲肾上腺素上,被称为“去甲肾上腺素”。去甲抑郁症假说。”然而,后来——部分由于针对血清素系统开发的抗抑郁药物的假定有效性——重点将更多地放在血清素在抑郁症中的作用上,“抑郁症的血清素假说”将成为最广泛接受的抑郁症观点。
血清素假说不仅得到了科学界的认可,而且在很大程度上也得到了到抗抑郁药物广告中频繁提及的血清素能机制——被广大公众所接受。它将指导多年的药物开发和研究。然而,当血清素假说达到全盛时期时,研究人员也发现它似乎并不能说明疾病的全部情况病因抑郁症。
血清素假说出现了一些问题。一种是抗抑郁药物需要数周才能产生治疗效果,但它们的效果却很明显对血清素水平的影响似乎在几小时内就发生了后管理。这表明,除了提高血清素水平,至少还有一些机制与药物的治疗效果有关。其他质疑这一假说的研究也开始越来越多。例如,实验并未发现消耗人体血清素会导致抑郁症状.
现在有一长串的实验发现对血清素和去甲肾上腺素能假说提出了质疑(事实上,这一领域的研究被进一步混淆了有证据表明,抗抑郁药物甚至可能并不那么有效).显然,单胺水平的变化是大多数抗抑郁药的影响,但血清素或去甲肾上腺素水平与抑郁症之间似乎没有直接关系。至少,该机制必须有另一个组成部分。
例如,有人提出血清素水平的增加与神经发生的促进有关(新神经元的诞生)在海马体中,海马体是调节应激反应的重要大脑区域。但最近研究人员也开始明显偏离血清素假说,提出抑郁症的基础完全不同。例如,最近的一个假说关注的是谷氨酸系统的作用抑郁症的发生。
抑郁症的血清素假说只是精神疾病生物学原因的众多假说之一,这些假说是基于这样一种假设制定的,即治疗这种疾病的药物的主要机制必须是纠正导致这种疾病的主要功能障碍。同样的逻辑被用于设计精神分裂症的多巴胺假说.和低唤醒假说注意缺陷多动障碍。这两种假说一度分别是对精神分裂症和多动症最常被吹捧的解释,但现在普遍认为过于简单了(至少在它们最初的表述中是如此)。
构建这种假设的逻辑有些重复:药物A增加了B,治疗了C障碍,因此C障碍是由B的缺乏引起的。它忽视了认识到B可能只是影响下游靶点D的一个因素,因此药物的效果可能通过多种方式实现,而B只是其中之一。它没有认识到神经系统的复杂性,以及可能涉及精神疾病发病的众多因素。这些因素不仅包括神经递质,还包括激素、基因、基因表达、环境的各个方面,以及其他大量可能的影响因素。精神病学的复杂性可能意味着,像抑郁症这样的疾病有几乎不可想象的多种发展途径,而我们对所涉及的主要途径的理解可能仍处于非常初级的水平。
因此,当我们将如此复杂的问题简化为主要依赖于一种神经递质的水平时,我们就犯了本文第一节所讨论的类似类型的错误,但可能会产生更大的影响。因为将精神疾病简化为“一种神经递质”所导致的错误不仅影响神经科学的进展,而且影响这些疾病患者的精神和身体健康。医生给这些病人开了精神药物,以为他们的疾病很简单,只要调整一些“化学失衡”就能治好;也许这并不奇怪精神科药物对数量惊人的病人无效.许多患者继续服用这类药物——有时收效甚微——尽管会产生严重的副作用。因此,在这一领域,更有必要摆脱基于已知机制的简单答案,而冒险进入更令人生畏和未知的水域。
我们对功能性神经成像的信心
就像创建大脑活动图像的方法一样正电子发射断层摄影术(PET)和功能性磁共振成像(功能磁共振成像)是在20世纪下半叶发展起来的,它们可以理解地在神经科学家中引起了极大的兴奋。这些方法让神经科学实现了曾经被认为是不可能的事情——能够(接近)实时地看到大脑中正在发生的事情。通过使用功能磁共振成像(fMRI)等技术监测脑血流量,人们可以知道当某人在执行某些动作(例如完成一项记忆任务,思考爱人,观看奖励或厌恶刺激的图片等)时,大脑的哪些区域接受了最多的血液,并扩展到哪些区域神经最活跃。
这种神经成像的方法,最终使研究人员得出关于结构和功能之间难以捉摸的联系的结论,被称为功能性神经成像。在过去的几十年里,功能神经成像方法已经成为神经科学中最受欢迎的研究工具之一。fMRI在发展后不久就超越PET成为功能神经成像的首选工具(由于多种因素,包括更好的空间分辨率和侵入性更小的方法),它已经成为首选的调查方法在超过4万篇发表的研究中从20世纪90年代开始。
功能性神经成像技术——尤其是功能磁共振成像技术——有可能解开大脑的无数秘密,这不仅引起了研究人员的兴趣,也引起了大众媒体的兴趣。媒体很快意识到,fMRI研究的结果可以简化,结合一些彩色的脑部扫描图片,并作为理解大脑哪些部分负责某些行为或行为模式的巨大飞跃的代表向公众出售。这些研究的简单化导致了令人难以置信的说法,即复杂的行为和情感模式就像宗教或嫉妒主要来自大脑的一个区域。
幸运的是,由于许多神经科学家一直在大声疾言,这种过度简化是如何传播关于大脑的谎言,并歪曲了功能性神经成像的能力,这种轰动主义的浪潮已经平息了一些。然而,反对过度简化功能磁共振成像结果的争论,往往是反对过度简化本身的争论。假设这种方法没有缺陷,但解释有缺陷。然而,越来越多的研究人员断言,不仅神经成像实验报告的结果容易被误解,而且它们往往是不准确的。
功能性神经成像的一个主要问题是如何处理这些实验数据。例如,在功能磁共振成像中,该设备通过将大脑图像分割成数千个称为体素的三维小立方体来创建大脑的表示。各体素能代表超过一百万个神经元的活动吗.然后,研究人员必须分析这些数据,以确定哪些体素表明血液流动水平较高,这些结果用于确定大脑的哪些区域最活跃。然而,大部分大脑在任何时候都是活跃的,因此研究人员必须在另一项任务中比较每个体素的活动与该体素的活动,以确定在他们感兴趣的任务中,特定体素的血流量是否更高。
由于数据量巨大,在确定在特定体素中观察到的血流是否代表高于基线的活动时出现了一个问题。每一个功能磁共振成像图像可以包含4万到50万的体素根据机器的设置,每个实验涉及许多图像(有时数千张),每张图像相隔几秒钟。这就产生了一种统计上的复杂性,称为多重比较问题,它本质上是说,如果你执行大量测试,你更有可能偶然发现一个重要的结果,而不是只执行一次测试。
例如,如果你抛硬币10次,你得到反面9次的可能性很小。但是,如果你将5万枚硬币投掷10次,你就更有可能看到这个结果至少在其中一枚硬币里.这个抛硬币的结果,在实验术语中,我们称之为假阳性。如果你使用的是一枚普通的硬币,那么投掷10次有9次反面并不能告诉你这枚硬币的内在性质——这只是一个偶然发生的统计偏差。当研究人员在fMRI研究中进行数百万次(活动体素和基线体素之间)比较时,同样的事情更有可能发生。单凭机缘巧合,其中一些可能会显示出显著的活动水平。
这个问题被举例说明了一组研究人员进行的实验2009年,他们对一条死大西洋鲑鱼(是的,就是那条鱼)进行了功能磁共振成像扫描。科学家们将鲑鱼放入功能核磁共振扫描仪中,并向它们展示了一系列描绘人们在不同社交场合的照片。他们甚至问鲑鱼——同样是一条死鱼——照片中的人正在经历什么情绪。当研究人员在没有修正多重比较问题的情况下分析他们的数据时,他们观察到一个奇迹:死鱼似乎显示出大脑活动,表明它正在“思考”照片中描绘的情绪。当然,事实并非如此;相反,由于多重比较问题而出现的假阳性,使鱼的大脑中似乎有真实的活动,但显然没有。
鲑鱼实验表明,在分析功能磁共振成像数据时,多重比较问题是多么令人担忧。然而,这个问题现在是一个众所周知的问题,大多数研究人员在统计分析他们的神经成像数据时都以某种方式纠正了它。然而,即使在今天,也不是所有的人都这样做2012年对241项fMRI研究的回顾发现,其中41%的作者没有报告做过任何调整为了解释多重比较问题。然而,即使有意识地试图避免多重比较问题,仍然存在一个问题,即它们在产生可靠结果方面有多有效。
例如,一种处理多重比较问题的方法这在功能磁共振成像研究人员中很流行聚类.在这种方法中,只有当连续体素集群一起活跃时,才有足够的理由认为大脑的某个区域比基线更活跃。这里的部分理由是,如果一个结果是合法的,它更有可能涉及活动体素的聚集,因此通过关注集群而不是单个体素,可以降低假阳性的可能性。
集群的问题在于,它似乎并不总是工作得那么好。例如,今年发表的一项研究分析了功能磁共振成像数据使用三种最流行的功能磁共振成像软件包对近500名受试者进行了研究,发现一种常见的聚类方法仍然会导致高达70%的假阳性率。因此,即使研究人员煞费苦心地解释多重比较问题,结果往往似乎也无法让人相信观察到的影响是真实的,而不仅仅是大脑活动随机波动的结果。
这并不是说fMRI数据不可信,也不是说fMRI不应该被用来探索大脑活动。相反,这表明需要更加小心,以确保fMRI数据得到正确的管理,以避免得出错误的结论。然而,不幸的是,fMRI的困难并不是开始和结束于多重比较问题。许多fMRI研究也存在样本量小的问题.这使得检测真正的效应更加困难,当观察到某些效应时,也意味着它更有可能是假阳性。此外,这意味着当观察到一个真实的效应时,效应的大小更有可能被夸大。一些研究人员也认为神经成像研究存在发表偏倚这进一步夸大了任何重大发现的重要性,因为相互矛盾的证据可能无法公开。
总而言之,这表明在进行和解释功能磁共振成像实验结果时需要更加谨慎。功能磁共振成像是一项了不起的技术,它为帮助我们更好地了解神经系统提供了巨大的希望。然而,功能性神经成像是一个相对年轻的领域,我们仍在学习如何正确使用功能磁共振成像等技术。因此,就像任何新技术或最近开发的领域一样,随着我们逐渐了解如何获取数据和解释结果的最佳实践,我们将会有一个学习曲线。因此,当我们继续学习这些东西的时候,我们应该在评估功能性神经成像实验的结果时使用相当大的克制和批判性的眼光。
*********************************
在过去的几个世纪里,神经科学的进步改变了我们对人类意义的理解。在这段时间里,我们了解到人类的状况与我们头盖骨中悬浮在脑脊液中的这一微妙的组织密不可分。我们发现大多数影响我们行为的痛苦都源于那个组织,然后我们开始想办法操纵大脑活动——通过服用各种天然和人造物质——来治疗这些痛苦。我们开发了观察大脑活动的能力,在理解大脑功能方面取得了进步,而人类曾经被认为是无法做到的。神经科学领域有许多研究工具仍在不断完善,但它们有望在未来50年取得更大的突破。
在此过程中所犯的错误是可以预料到的。随着一门学科的发展,权威知识的积累并不是沿着一条直线发展的。相反,它包括一个准确的洞察力,然后在黑暗中摸索一段时间,然后做出另一个真实的推论。神经科学也不例外。尽管我们倾向于高度评价我们目前在该领域的知识水平,但在任何时候,它仍然充满了错误。我们的目标并不是要达到那种意义上的完美,而只是要认识到不可能做到这一点。通过认识到我们所知道的永远不会像我们自认为知道的那么多,通过经常评估哪些理解方法会把我们引入歧途,我们更有可能得到接近真理的结论。
参考文献(除上述链接文本外):
《神经科学的起源》。纽约州纽约:牛津大学出版社;1994.
Valenstein ES。伟大而绝望的治疗:精神外科和其他精神疾病根治术的兴起与衰落。纽约州纽约:基本图书公司;1986.
如果你喜欢这篇文章,请查看: