肌萎缩侧索硬化症 (ALS) 是一种严重的运动神经系统疾病,具有遗传性,但这种遗传性的很大一部分以前一直无法解释。使用人工智能 (AI) 方法,由比勒费尔德大学技术学院的 Alexander Schönhuth 教授领导的研究人员成功记录和破译了 3,000 名 ALS 患者的基因型谱,从而更多地了解该疾病的发展。 DiseaseCapsule 的架构。输入是来自所有 Gene-PCA 模型的压缩特征的串联,其中每个特征对应一个 Gene-PCA。Gene-PCA 的数量为 75,584,因此输入的维数为 75,584 × 1。DiseaseCapsule 由三层组成:全连接层 (FC)、初级胶囊层 (PrimaryCaps) 和表型胶囊层 (PhenoCaps)。FC 层由 150 个神经元组成,后跟 ReLU 作为激活函数。PrimaryCaps 由 32 个初级胶囊组成。它们中的每一个都涉及四个不同的卷积过滤器(内核大小 5 × 1,步幅 2,无填充)。PhenoCaps 由两个 16 维向量组成。每个表型胶囊接收来自所有 32 个主要胶囊的输入。输出是一个二进制分类标签(健康或 ALS)。 使用新方法,可以以 87% 的准确率预测人们是否会患上 ALS。 在他的基因组数据科学工作组中,生物信息学教授 Alexander Schönhuth 博士正在开发处理数万个基因组并分析其数据的方法和工具。除了技术学院,该工作组还隶属于比勒费尔德大学生物技术中心 (CeBiTec)。 Schönhuth 团队目前的研究重点是肌萎缩侧索硬化症(ALS),也称为运动神经元病。在 ALS 中,患者的移动能力会随着时间的推移而下降,直至停止。然而,与此同时,大脑的活动仍然完全正常。 “关于肌萎缩侧索硬化还有很多我们不了解的地方,”领导肌萎缩侧索硬化诊断研究的亚历山大·舍恩胡特说。四年前,当他还是阿姆斯特丹 Centrum Wiskunde & Informatica (CWI) 的一个研究组组长时,他就开始研究这个课题,该中心是荷兰国家数学和计算机科学研究中心。“我们知道 ALS 是一种遗传性疾病,但 80% 的遗传性仍无法解释,”Schönhuth 说。 ALS 的遗传结构很复杂“许多遗传性疾病揭示了遗传因素的重叠,即所谓的累加效应。精神分裂症就是一个例子,”Schönhuth 解释说。“基因揭示的这些因素越多,一个人患精神分裂症的可能性就越大。因此,我们可以很容易地根据基因识别遗传倾向。相比之下,对于 ALS,事情要复杂得多。” Schönhuth 和他的团队假设单独的个体因素很可能导致肌萎缩侧索硬化。但是,如果这些因素同时发生,则情况恰恰相反:不会发生疾病。这个假设可以解释为什么人们对肌萎缩侧索硬化知之甚少。 用人工智能方法分析 3000 名 ALS 患者的基因数据Schönhuth 和他的团队应用的人工智能(AI)核心方法称为胶囊网络。它被用来评估来自 3,000 名 ALS 患者和 7,000 名未患有 ALS 的人 的基因数据。 “这种方法的巨大优势在于它可以捕获重叠的过程。” 经典方法无法应对数据量,也无法提供清晰的结果。Schönhuth 说:“相比之下,我们的 AI 方法清楚且易于理解地表明哪些基因及其过程对 ALS 的发展特别重要。” 发现 900 多个基因在 ALS 的发展中起作用科学家的结果表明,预测人们是否会患上 ALS 的准确率为 87%。“我们的方法可以对疾病做出预测,而且比其他方法准确得多。我们已经发现了 900 多个在识别疾病中起作用的基因和 644 个以复杂方式相互作用的基因。这些需要进一步研究在其他研究领域,”Schönhuth 继续说道。 “每个基因都参与不同的生物过程:我们对基因了解得越多,我们对这些过程的了解就越多。这样,我们的结果将帮助受 ALS 影响的人适应他们的生活方式并降低他们患上疾病。此外,还可以开发影响特定过程的药物,”Schönhuth 解释道。 |
Powered by Discuz! X3.5
© 2001-2025 Discuz! Team.