基于数据驱动的无偏脑体积评估方法
发布时间:2018-10-19 17:28:36 来源: 北京赛博尔医药科技有限公司
1 研究背景
了解大脑在老化过程中的变化情况对掌握由年龄引起的神经退行性疾病机制十分有帮助。许多磁共振成像研究发现随着年龄的增长,脑灰质体积(gray matter volume,GMV)会萎缩,而脑脊液(cerebrospinal fluid,CSF)体积则会增加。对于脑白质体积(white matter volume,WMV)的改变,则尚无定论。
早期针对与年龄相关的GMV的研究均使用预先定义好的感兴趣区(ROI,通常是几毫米直径的球体),通过对ROI内GMV的分析,得出最终的结论。然而,由于随着年龄的变化亦或是使用的脑图谱不同,预先定义的ROI也可能会随着改变,因此上述方法往往会导致错误的结果。同时,基于ROI的GMV分析还存在多重比较校正的问题。
为了解决上述问题,Bagarinao博士等人使用数据驱动的分割方法,结合独立成分分析(independent component analysis,ICA)及结构共变网络分析,对由年龄引起的灰质体积改变做了深入的研究。
2 研究方法
通过近两年的收集,共有445名志愿者被纳入实验。在对这445名志愿者进行了一系列的生理、心理、精神方面的健康状况评估后,共293名志愿者(89名男性/204名女性,年龄范围在21-86岁)被确认为最终的研究对象。志愿者的详细信息及临床特征见表1。
表1. 志愿者信息
SD:标准差;MMSE:简易精神状态量表;ACE-R:Addenbrooke认知检查-修正版(痴呆的筛查有重要作用,尤其适用于高文化程度患者)
对所有被确认的最终志愿者,采集他们的3D T1结构像,体素大小1.0x1.0x1.0mm3。扫描时间为5分49秒。
对结构像的处理,使用基于Matlab的SPM12工具包。首先,将个体的结构像进行分割,分为灰质(GM)、白质(WM)、脑脊液(CSF)和其他成分;其次,对分割后的GM和WM使用DARTEL方法进行非线性的配准,同时创建组内模板。该模板随后和标准的MNI脑模板进行配准,得到相应的配准形变场信息;最后,结合DARTEL得到的配准信息,将个体分割出的成分配准到MNI空间中去。同时还需要对标准化后的个体结构像进行调制,以确保脑区的总体积保持不变。处理完的结构像进一步被重采样为体素大小2x2x2 mm3的数据,并使用半高宽为8mm的高斯平滑核进行平滑处理,以进一步减小配准导致的误差(北京赛博尔提供相应的数据处理培训,详见文末,欢迎咨询)。
对于分割后,标准化了的GM、WM和CSF,设置阈值为0.2得到相应成分的成分图,并以此来估算相应成分的总体积。颅内脑组织总体积(total intracranial volume,TIV),可由上述三种成分的总和计算得到。对于各个成分体积和年龄的关系,Bagarinao博士等人构建了相应的模型,使用赤池信息量准则(Akaike’s information criterion,AIC),选择合适的模型进行具体分析。
ICA分析使用FSL软件包中的MELODIC工具。将所有志愿者的GM图像连接成一个4D的数据(3D GM图像和1D的志愿者数目)作为MELODIC的输入。ICA会将该输入分解为若干3D的空间图,每一个图代表一个独立成分(IC),同时含有该图的权重。
提取出的ICs被用作后续每个志愿者GM图像的回归因子:
IGM=β1IC1+ β2IC2+… + βKICK + εI(1)
上述公式中,β为相应IC在GM图像包含的全部ICs中所占的比重,εI为残差图像,K为提取出的ICs数量。这里β值可以广义的理解为给定IC下,大脑相应脑区的加权总GMV。通过对β的正确估计,可以将数据降维至K乘以β量级。
为了研究GM改变和年龄的关系,建立β和年龄(α)、性别(γ)、GMV(τ)的线性模型:βi = bi,0 + bi,1 α + bi,2 γ + bi,3τ + εi(2)
同样,为了考虑非线性关系,建立连续分段线性(continuous piecewise linear,CPL)模型:βi = bi,0 + bi,1 α +bi,2α*+bi,3γ + bi,4τ+ εi(3)
这里α*=(α– αBP)x是一个变量,表示在给定的断点αBP处,α的不连续性。如果,α≤ αBP时,x= 0; α> αBP时,x = 1。对于每个β,使用AIC选取合适的模型匹配。
通过将年龄表示为一系列β值的组合来对年龄进行预测:
α =a0+ a1β1+ a2β2 + … + aKβK + εα(4)
其中,ai和bi代表回归系数,ε代表残差项。通过使用上述模型,对给定的GM图像进行脑龄估计。具体方式是将志愿者分为两组,一组作为训练集(共147位,平均年龄53.0岁),另一组作为测试集(共146位,平均年龄53.7岁)。随后使用LASSO(least absolute shrinkage and selection operator)估计模型中与β相关的训练数据集中的回归系数。在10折交叉验证后,选取最优的参数。确定参数后的模型用于测试数据集。
结构共变网络分析用来测试GM的改变是否在空间上相互关联。在功能网络中,功能连接被定义为不同脑区间时间序列的相关系数。在基于DTI的结构网络中,结构连接被定义为不同脑区间实际的白质纤维束连接。同样的,在结构共变网络的分析中,估计的是GMV或者皮层厚度等指标在不同脑区间的相关性。在本研究中,使用β值作为指标,研究不同脑区间β的相关性。为了消除年龄的影响,将总GMV、年龄、性别等变量从β值中回归掉。剩下的残差用来计算连接矩阵,其中节点(nodes)由计算出的独立成分表示,边(edges)由残差间的皮尔逊相关系数表示(结果经过FDR q<0.05校正)。
通过滑窗方法来检测与年龄相关的网络改变。具体实现方法为将所有志愿者按照年龄排序,然后分若干小组进行分析。小组1年龄范围涵盖志愿者1到103,然后滑动10个步长,则小组2年龄范围涵盖志愿者11到113,以此类推,共计分组20个。对每个小组,连接矩阵同样通过β的残差计算得到。之后使用GRETNA软件计算网络的属性(聚类系数、最短路径、局部或全局效率等)同年龄间的关系。
3 研究结果
整体体积同年龄间的关系:随着年龄的增长,整体GMV明显下降。而WMV的体积同年龄呈二次关系。且在45.87岁这个点上,WMV达到峰值。最后CSF的体积同年龄呈现线性正相关的趋势,随着年龄的增长,CSF的体积也在增加。
基于ICA与年龄相关的GM图像分割:通过ICA方法,共从293幅标准化后的GM图像中提取出192个ICs。图1是通过BrainNet Viewer展示的这192个ICs映射在标准模板上的效果,同一颜色表示同一个独立成分。从图中可以看到,虽然目前的标准图谱都是左右对称的,但是根据ICA所得到的分割结果并不对称。
图1. 通过ICA方法分割出的与年龄相关的大脑不同区域。注:在小脑的分割结果没有显示在图中。
通过前述方程式(1),计算得到β值。进一步评估β值和年龄间的关系发现,在所有192个ICs中,共有174个ICs的β值同年龄存在强的相关关系(FDR q<0.05)。160个