找回密码
 立即注册

新型机器学习算法创建具有作为通用诊断平台潜力的癌症图谱 ...

2023-3-22 11:54| 发布者: admin| 查看: 28| 评论: 0

摘要: 在儿童癌症和成人癌症的首次广泛比较中,病童医院 (SickKids) 的研究人员分析了 13,000 例个体癌症,并使用新型机器学习算法构建了儿童癌症的“图谱”。用于 RNA-seq 数据聚类和分类的平台。a,我们的 RNA-seq 肿瘤 ...

在儿童癌症和成人癌症的首次广泛比较中,病童医院 (SickKids) 的研究人员分析了 13,000 例个体癌症,并使用新型机器学习算法构建了儿童癌症的“图谱”。

用于 RNA-seq 数据聚类和分类的平台。a,我们的 RNA-seq 肿瘤亚型鉴定方案中涉及的步骤的示意图。我们首先使用新型规模自适应聚类框架 RACCOON 构建了肿瘤和正常亚型的广泛参考层次结构。然后将该层次结构用作 OTTER 的目标,OTTER 是 CNN 分类器的集合,可用于识别临床实践样本中的多种肿瘤和正常组织成分。b,OTTER 性能作为测序读数数量的函数。这被量化为在二次采样数据和原始样本上获得的预测概率之间的层次相似性(方法)(> 1×10 8读)。值表示为六个肿瘤样本的平均值和标准差,每个样本随机二次采样 5 次。表达计数是通过 STAR + RSEM 管道获得的。

据估计,全世界每年有 1810 万人的癌症诊断主要依赖于特定蛋白质的显微镜检查和检测。这些方法的准确性是可变的,并且研究所之间不容易共享改进。对于小儿癌症尤其如此,这是发达国家婴儿期后儿童因病死亡的最常见原因。

“随着全球癌症负担的增加,除非开发出新的方法,否则癌症诊断的复杂性预计会增加,”遗传学和基因组生物学项目的高级科学家 Adam Shlien 博士解释说,他的团队开发了这种算法。“我们的平台可用于任何医院,以提高诊断癌症的速度和准确性,即使对于罕见类型也是如此。”

转录组分析阐明了小儿癌症的独特性

在发表的一项新研究中描述了这种机器学习算法对每种已知的主要儿童癌症类型进行分类,并且可以为 85% 的儿童癌症患者改进或匹配给定的癌症诊断。

与其他检测和诊断工具不同,例如寻找特定基因突变的癌症面板测试或其他可能单独分析基因组的方法,这种机器学习算法分析一个人的整个转录组。虽然基因组由细胞中的所有 DNA 组成,但只有一部分遗传密码被复制到 RNA 分子中,称为转录组。

“仅仅因为你有一个非常繁忙的癌症基因组,并不意味着一切都被公开了,”遗传学与基因组生物学项目的研究助理和该研究的第一作者 Federico Comitani 博士说。“通过分析完整的转录组,我们可以找到每个肿瘤的核心特征,并更清楚地了解每个个体的癌症活动。”

除了识别癌症类型之间的显着差异外,研究团队收集的大量数据和平台提供的放大倍率使研究人员能够识别出 455 种癌症亚型。大量的亚型支持这样一种观点,即大多数儿童癌症具有共同的祖先,然后分化成多种特定的肿瘤亚型。

“我们第一次能够看到癌症亚型之间的细微差异。与成人癌症相比,儿童癌症显示出更多的转录变异性——细胞中表达的基因数量,”Shlien 说,他是加拿大研究主席儿童癌症基因组学,是儿科检验医学系的副主任。“这为我们提供了一种全新的方式来看待癌症,并可能确定癌症的预后,并有可能改变我们对癌症的理解。”

分类器可以改善小儿癌症的诊断

作为 SickKids 癌症测序计划 (KiCS) 的一部分,该工具已经在更快、更准确地诊断癌症方面发挥了重要作用,该计划为患有癌症的儿童提供全面的基因测序。

在儿童中最常见的颅外实体瘤神经母细胞瘤的病例中,该工具鉴定的亚型预测了肿瘤分化和患者存活率的显着差异。同样,该平台的发现通过揭示免疫细胞的不平衡,解释了肉瘤、骨和软组织肿瘤对免疫疗法的不一致反应,从而为潜在的新治疗方法提供信息。

“随着我们向这个不断增长的图谱中添加更多样本并使用更大的数据集和样本类型对其进行验证,我们的分类器有可能成为诊断儿科癌症的通用测试,”Shlien 说。

该 RNA 平台目前仅供全球许多早期采用者癌症中心用于研究,允许医生将患者的诊断与该平台识别的癌症类型进行比较,并获得数字诊断。也正在努力将该工具作为一个平台带到更广泛的社区,以实现诊断测试和加速癌症药物产品的开发。



路过

雷人

握手

鲜花

鸡蛋

相关分类

QQ|Archiver|手机版|小黑屋|华夏中医论坛

GMT+8, 2025-8-22 03:24 , Processed in 0.071396 second(s), 16 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

返回顶部