• 文件
  • 知识库

人工智能在乳腺癌免疫组化切片中分类HER2状态的诊断准确性及其对HER2低表达病例的影响:系统评价与荟萃分析

原标题:Diagnostic Accuracy of Artificial Intelligence in Classifying HER2 Status in Breast Cancer Immunohistochemistry Slides and Implications for HER2-Low Cases: A Systematic Review and Meta-Analysis

Daniel ArrudaMD MSc a Matheus Navarro AlbuquerquePhD Trotta ViannaLuana AlencarMD c Fernandes SampaioMSc Andrei VasiliuEduardo Henrique CunhaMD Neves FilhoSuperbiochipsSeoul

medRxiv (2024)

|

5

关键词

Trastuzumab deruxtecan
metastatic breast cancer
HER2 expression
DAISY trial
diagnostic test accuracy
AI algorithms
HER2 scores
meta-analysis
sensitivity analysis
publication bias

摘要

人类表皮生长因子受体2(HER2)过表达的乳腺癌占病例的15-20%,并且与较差的预后相关。尽管曲妥珠单抗-德鲁司他单抗(T-DXd)传统上已在转移性HER2阳性患者中显示出生存益处,但DESTINY Breast04试验将其有效性扩展到免疫组化(IHC)评分为1+和2+且原位杂交阴性的患者,这一患者群体被称为“HER2低表达”。准确区分HER2评分现在变得至关重要。然而,视觉IHC评分劳动强度大且易于出现观察者间的高变异性。人工智能(AI)在诊断医学中,特别是在组织病理学中,已成为一种有前途的工具。本研究评估了AI识别符合T-DXd治疗资格患者的能力及其在准确分类HER2评分方面的表现。电子检索在MEDLINE、EMBASE、Scopus和Web of Science中进行,截止到2024年5月。纳入标准限于评估AI与病理学家在利用IHC切片分类HER2表现的研究。使用双变量随机效应模型进行荟萃分析,以估计合并的敏感性、特异性、一致性和曲线下面积(AUC)。为了探索异质性的来源,进行了亚组分析和荟萃回归。使用QUADAS-AI工具评估偏倚风险。我们分析了13篇纳入的出版物中的25个列联表,显示AI在预测T-DXd治疗资格方面具有出色的准确性,合并敏感性为0.97 [95%CI 0.96-0.98],特异性为0.82 [95%CI 0.73-0.88],AUC为0.98 [95%CI 0.96-0.99]。在个别评分分析中,AI在2+和3+评分中表现更佳。观察到显著的异质性,荟萃回归显示深度学习和基于补丁的分析表现更好,而在外部验证和使用商业可用算法的情况下表现下降。我们的研究结果表明,AI在准确识别HER2低表达患者方面具有良好的潜力,并在区分2+和3+评分方面表现出色。即将进行的验证研究应重点提高AI在0-1+范围内的精确度,并改进临床和预分析数据的报告,以标准化样本特征,确保模型之间更具可比性。本综述强调,深度学习的进步正在推动自动化,要求病理学家适应并将这一技术整合到他们的工作流程中。

AI理解论文

该文档是一篇关于诊断测试准确性(DTA)系统评价和荟萃分析的研究,主要聚焦于人工智能(AI)算法在乳腺癌HER2评分中的应用。以下是对该文档的详细总结:

研究背景与目的

文档首先介绍了研究的背景和目的。HER2是一种在乳腺癌中常见的生物标志物,其表达水平对治疗决策至关重要。传统上,HER2的评分依赖于病理学家的视觉评估,但这种方法可能存在主观性和可变性。人工智能技术,特别是深度学习(DL)卷积神经网络(CNN),被认为可以提高HER2评分的准确性和一致性。因此,本研究旨在系统评估AI算法在HER2评分中的表现,并与病理学家的视觉评分进行比较。

方法

研究采用了系统评价和荟萃分析的方法。研究的纳入标准包括:使用数字化全切片图像(WSIs)进行HER2评分的研究;AI算法作为指数测试;与病理学家视觉评分作为参考标准进行比较;并报告AI性能指标。排除标准包括:缺乏足够数据构建2x2列联表的研究,以及使用非传统染色方法或动物组织的研究。

文献检索在多个数据库中进行,包括MEDLINE、EMBASE、Scopus和Web of Science,检索时间截至2024年5月3日。数据提取包括研究特征、参与者细节、指数测试和参考标准的详细信息,以及每个HER2评分的2x2列联表数据。

统计分析

研究使用双变量随机效应模型进行荟萃分析,以计算AI的综合敏感性和特异性。异质性通过Higgins不一致性指数(I²)评估,50%被定义为中等异质性,≥75%为高度异质性。汇总一致性通过DerSimonian和Laird方法进行随机效应荟萃分析计算。研究还进行了亚组分析元回归以探索异质性的潜在来源,并使用Deek’s漏斗图不对称性测试评估发表偏倚

结果

研究共纳入13项研究,涵盖1285个病例、168个WSIs和24626个补丁。大多数研究使用了CNN算法,部分研究使用了HER2 Scoring Contest数据库。AI算法在区分HER2评分1+/2+/3+与0的敏感性和特异性方面表现出色。研究还发现,AI算法在不同自动化程度和数据单位下的表现存在差异。

讨论与结论

研究总结了AI算法在HER2评分中的主要发现,强调了其在提高评分一致性和准确性方面的潜力。然而,研究也指出了一些局限性,如样本来源不一致和数据单位差异可能导致的异质性。研究建议未来的研究应关注AI算法的外部验证和在不同临床环境中的适用性。

贡献

该研究通过系统评价和荟萃分析,提供了AI算法在乳腺癌HER2评分中的综合性能评估,为临床实践中AI技术的应用提供了重要的证据支持。研究强调了AI在提高诊断准确性和减少主观偏差方面的潜力,具有重要的临床意义。

专业术语解释

  • HER2:人类表皮生长因子受体2,是一种在某些乳腺癌中过度表达的蛋白质。
  • 全切片图像(WSIs):数字化的组织切片图像,用于病理分析。
  • 卷积神经网络(CNN):一种深度学习算法,特别适用于图像识别和分类任务。
  • 敏感性和特异性:诊断测试的性能指标,分别表示测试正确识别阳性和阴性的能力。

通过以上总结,读者可以全面理解该文档的内容、方法和贡献,了解AI在乳腺癌HER2评分中的应用潜力和挑战。

Chat Paper

当前问答基于全文

转入私有库对话