• 文件
  • 知识库

大数据,小偏差:协调扩散MRI结构连接组以减轻数据整合中的站点相关偏差

原标题:Big Data, Small Bias: Harmonizing Diffusion MRI-Based Structural Connectomes to Mitigate Site-Related Bias in Data Integration

Rui Sherry ShenD. ParkerA. A. ChenBenjamin E. YerysBirkan TunçTimothy P.L. RobertsRussell T. ShinoharaRagini Verma

bioRxiv (2024)

|

5

关键词

ASD
结构网络
协调
多站点数据集
统计能力
临床关联
机器学习
脑龄预测
性别差异
连接性分析

摘要

基于扩散MRI的结构连接组越来越多地用于研究与各种疾病相关的大脑连接性变化。然而,单个研究中的样本量较小,加上疾病相关表现的高度异质性,强调了跨多个研究汇集数据集的必要性,以识别与这些疾病相关的连贯且可推广的连接模式。然而,结合数据集会由于扫描仪硬件或采集协议的差异引入与地点相关的差异。这些差异突显了统计数据协调的必要性,以减轻地点相关效应对结构连接组的影响,同时保留与参与者人口统计和疾病相关的生物信息。虽然存在几种用于协调正态分布神经影像测量的范式,但本文代表了首次努力建立专门为结构连接组量身定制的协调框架。我们对各种统计协调方法进行了深入研究,调整它们以适应结构连接组的独特分布特征和基于图的属性。通过严格的评估,我们证明了具有对数链接的广义线性模型(gamma-GLM)在建模结构连接组方面优于其他方法,能够有效消除基于边缘和下游图分析中的地点相关偏差,同时保留生物变异性。两个实际应用进一步突出了我们的协调框架在解决多地点结构连接组分析挑战中的实用性。具体而言,使用gamma-GLM进行协调提高了基于连接组的机器学习预测器对新数据集的普遍适用性,并增加了检测群体差异的统计能力。我们的工作为协调多地点结构连接组提供了基本指南,为在团队科学和大数据时代通过协作研究实现更稳健的发现铺平了道路。

AI理解论文

图片加载中
预览
图片加载中
预览
图片加载中
预览
图片加载中
预览
图片加载中
预览
图片加载中
预览
图片加载中
预览

该文档主要探讨了多站点结构脑网络数据的协调,以提高临床研究的统计能力和可靠性。研究指出,单一站点的数据通常样本量有限,难以揭示复杂的脑网络特征。因此,整合来自多个来源的数据是必要的,但这也引入了站点相关的偏差,可能掩盖生物学上的差异。为此,本文开发并评估了一种专门用于结构网络的协调框架,旨在消除这些偏差并揭示真实的生物学变异性。

研究背景与动机:结构脑网络研究面临样本量小和个体异质性高的问题,这常导致研究结果不一致或结论不明确。为解决这些问题,科学界开始整合来自不同临床站点的成像数据,以克服样本量限制并减少选择偏差。然而,多站点数据的整合需要有效的协调方法,以消除与生物学无关的站点特异性差异。

方法与技术:研究采用了Gamma广义线性模型(gamma-GLM),这是一种统计模型,用于处理结构网络数据。该模型在消除结构连接矩阵中的站点相关效应以及下游基于图的分析中表现优异,同时保留了生物学变异性。此外,gamma-GLM在处理站点与年龄之间的混杂因素方面也表现出色。研究还探讨了其他统计方法,但gamma-GLM在建模结构网络数据方面表现最佳。

研究结果:研究结果表明,gamma-GLM在消除站点相关效应方面优于其他方法,并且在增强脑年龄预测器的可转移性和促进患者研究中的数据整合方面具有实际应用价值。这种协调框架提高了多站点结构网络研究的统计能力,提供了更可靠的发现。

应用与贡献:本文的协调框架在两个实际应用中展示了其效用:一是增强脑年龄预测器在新数据集上的可转移性,二是改善患者研究中的数据整合,从而提高统计能力。研究为多站点结构网络研究提供了重要的指导方针,推动了大数据时代的协作研究。

未来研究方向:研究指出,未来的工作可以扩展到更多的分布和统计指标,特别是在使用更复杂的方法或受扩散指标调制的结构网络中。此外,研究建议在协调过程中纳入更多的人口统计变量,如种族和社会经济地位,以提高研究结果在不同人群中的适用性。

专业术语解释

  • 结构脑网络:通过非侵入性扩散加权MRI(dMRI)映射的脑网络,节点表示脑区,边表示它们的轴突连接。
  • Gamma广义线性模型(gamma-GLM):一种统计模型,用于处理具有非正态分布特征的数据,适合于建模结构网络数据。
  • 协调(Harmonization):在多站点研究中,消除与生物学无关的站点特异性差异,以提高数据的可比性和研究的可靠性。

总之,该文档通过开发和评估一种新的协调框架,为多站点结构脑网络研究提供了重要的工具和方法,显著提高了研究的统计能力和可靠性。

Chat Paper

当前问答基于全文

转入私有库对话