• 文件
  • 知识库

整合生殖系和体细胞基因组模型提高了冠状动脉疾病的风险预测。

原标题:An Integrated Germline and Somatic Genomic Model Improves Risk Prediction for Coronary Artery Disease

X. YangM. S. KimX. ZhuM. M. UddinT. NakaoS. M. J. ChoS. KoyamaT. XuL. F. ReeskampR. ZhangZ. LiuY. AP. S. D. VriesR. VasanE. BoerwinkleA. MorrisonB. PsatyR. P. TracyS. HeckbertE. K. SilvermanM. H. ChoJ. YunN. Palmer

medRxiv (2024)

|

5

关键词

基因组
冠状动脉疾病
风险预测
多民族研究
全基因组测序
多基因风险评分
心血管疾病
生物数据催化剂
表型协调
数据管理

摘要

多种生殖系和体细胞基因组因素与冠状动脉疾病(CAD)的风险相关,但目前没有一种能够整合DNA样本中所有信息的单一风险测量方法,这限制了基因组信息在临床上的应用。为了解决这一问题,我们开发了一种综合基因组模型(IGM),类似于将各种临床风险因素结合成统一风险估计的临床风险计算器。IGM包括六种CAD的遗传驱动因素,包括生殖系因素(家族性高胆固醇血症[FH]变异、CAD多基因风险评分[PRS]、蛋白质组PRS、代谢组PRS)和体细胞因素(不确定潜能的克隆性造血[CHIP]和白细胞端粒长度[LTL])。我们在英国生物银行(N=391,536)中评估了IGM对CAD风险的预测,并在精准医学的跨组学(TOPMed)计划(N=34,177)中进行了验证。基于IGM的10年CAD风险在英国生物银行中范围为1.1%至15.5%,在TOPMed中为3.8%至33.0%,男性的风险梯度比女性更明显。IGM捕捉了多种遗传驱动因素的累积效应,识别出那些尽管没有明显高风险遗传因素但仍处于CAD高风险的个体,或那些尽管具有已知遗传风险变异如FH和CHIP但仍处于CAD低风险的个体。IGM在年轻个体中表现最佳(C统计量0.805 [95% CI, 0.699-0.913],年龄[≤] 45岁)。在中年阶段,IGM增强了CAD临床风险计算器——合并队列方程(PCE)的表现。将IGM添加到PCE中,导致连续净重新分类指数为33.45%(95% CI, 32.11%-34.76%)。我们提出了第一个模型,该模型整合了单个DNA活检中所有当前可用的信息,将复杂的遗传信息转化为单一的风险估计。

AI理解论文

图片加载中
预览
图片加载中
预览
图片加载中
预览
图片加载中
预览
图片加载中
预览
图片加载中
预览
图片加载中
预览

这篇论文的主要内容是开发和验证一种综合基因组模型(IGM),用于改进冠状动脉疾病(CAD)的风险预测。CAD是导致死亡和疾病的主要原因之一,早期识别高风险个体是预防疾病的关键策略。本文提出的IGM整合了多种基因组信息,以提供一个统一的风险估计。

研究背景与动机

冠状动脉疾病的风险预测传统上依赖于临床风险因素。然而,基因组信息的使用正在获得关注,因为它能够识别早发病例,并在生命早期预测风险。本文的动机是利用单一DNA样本中的所有可用信息,开发一个能够改进CAD风险预测的模型。

方法与模型构建

IGM包括六个CAD的遗传驱动因素,其中包括:

  1. 家族性高胆固醇血症(FH)变异:与CAD风险相关的单基因变异。
  2. CAD多基因风险评分(PRS):基于多个基因变异的综合风险评分。
  3. 蛋白质组PRS代谢组PRS:分别基于蛋白质组和代谢组数据的多基因风险评分。
  4. 不确定潜力的克隆性造血(CHIP):与年龄相关的体细胞突变,增加CAD风险。
  5. 白细胞端粒长度(LTL):端粒缩短与CAD风险增加相关。

这些因素的整合旨在捕捉多种遗传驱动因素的累积效应,从而提供更准确的风险预测。

数据集与验证

研究使用了**英国生物银行(UK Biobank)精准医学转录组(TOPMed)**项目的数据进行验证。UK Biobank的数据集包含391,536名参与者,而TOPMed的数据集包含34,177名参与者。研究通过Cox比例风险回归模型估计10年CAD风险,并使用C-统计量评估模型的预测性能。

结果与发现

IGM在UK Biobank中的10年CAD风险范围为1.1%到15.5%,在TOPMed中为3.8%到33.0%。IGM能够识别出尽管缺乏明显高风险遗传因素但仍处于高风险的个体,以及尽管具有已知遗传风险变异(如FH和CHIP)但风险较低的个体。IGM在年轻个体中表现最佳(C-统计量为0.805),在中年个体中,IGM增强了**合并队列方程(PCE)**的性能,PCE是一个用于CAD的临床风险计算器。将IGM添加到PCE中,连续净重新分类指数为33.45%。

贡献与意义

本文首次提出了一个整合所有当前可用信息的模型,将复杂的基因组信息转化为单一的风险估计。IGM不仅在年轻个体中表现出色,还补充了中年个体的临床风险预测。该模型有望在一个“基因组优先”的医疗框架中转变CAD风险评估策略,基因组信息将成为患者护理的基本组成部分。此外,本文提出的框架可以扩展到其他已知具有多个基因组风险驱动因素的疾病。

结论

IGM通过整合多种基因组信息,提供了一个强大的工具来分层CAD风险,特别是在年轻个体中。该模型不仅能够识别高风险个体,还能够在中年个体中增强现有的临床风险预测工具。本文的研究为未来在医疗实践中更广泛地应用基因组信息奠定了基础。

通过这篇论文,研究人员展示了如何利用基因组数据的综合分析来改进疾病风险预测,这一方法可能会对未来的个性化医疗产生深远影响。

Chat Paper

当前问答基于全文

转入私有库对话