近年来,人们越来越关注静息态功能磁共振(resting-state functional magnetic resonance imaging, R-fMRI)领域研究的可重复性问题。由于多样的数据处理及分析方法和过小的样本量,静息态功能磁共振领域的研究一直受到可重复性差的困扰。然而,对于如何定量确定静息态功能磁共振研究结果的可重复性以及这种可重复性在多大程度上受到多重比较矫正(极为重要的数据处理步骤之一)方法和样本量的影响,学界所知甚少。
最近,中国科学院行为科学重点实验室严超赣研究组使用一种全新的方法定量分析了静息态功能磁共振研究中最常用的5种指标的可重复性,并且细致探讨了不同的多重比较矫正方法以及样本量对可重复性的影响。
该研究表明,一种严格的多重比较方法,即经过无阈限的团块增强处理(Threshold-free cluster enhancement, TFCE)的置换检验(Permutation test)能够最好地平衡假阳性率(Family error rate, FWER)和可重复性。
图1. 不同多重比较矫正方法的假阳性率和可重复性
该研究综合考察了可重复性的两个方面:重测信度(Test-retest reliability)和独立数据集可重复性(replicability)。总体来说,静息态功能磁共振研究结果的重测信度较好(ALFF指标能达到0.68),但是独立数据集可重复性不令人满意(ALFF指标仅有0.25)。同时,被试内设计的可重复性好于被试间设计研究的可重复性。小样本研究的可重复性,统计检验力以及结果真实性都很差,但是随着样本量的增加,研究的可重复性、统计检验力以及结果的真实性都有较大提升。
图2. 不同指标的独立数据集可重复性以及样本量的影响
该研究指出了一个较为优化的多重比较矫正方法的选择方案,给出了目前静息态功能磁共振研究可重复性的一个较为清晰的图景,并指出了样本量大小在提升可重复性的努力中扮演的关键角色。
该研究得到了国家重点研发计划(2017YFC1309902)、国家自然科学基金(81671774、81630031)和中国科学院百人计划项目基金的支持。
该成果已经在线发表于Human Brain Mapping:
Chen X, Lu B, Yan CG* (2017) Reproducibility of R-fMRI metrics on the impact of different strategies for multiple comparison correction and sample sizes. Human Brain Mapping. In press.