外科成像在脊柱疾病诊断和治疗中的机器学习应用:目前的技术水平
摘要
机器学习 (ML) 方法的最新发展展示了在脊柱中应用的无与伦比的潜力。ML 能够提供诊断能力,从现有能力中产生新的见解,并在与人类相当或更高的水平上增强或加速手术计划和决策的要素,这将极大地造福于脊柱外科医生和患者。在这篇综述中,我们旨在提供基于 ML 的技术的临床相关概述在脊柱畸形、退化和创伤的背景下,以及商业级和商业前级手术辅助系统和决策支持工具的概述。此外,在强调 ML 应用的一些限制之前,我们简要讨论了生成网络的潜在应用。我们得出结论,脊柱成像中的 ML 代表了神经外科医生设备的重要补充——它有能力直接解决和体现临床需求并提高诊断和手术质量和安全性——但仍面临在广泛实施之前必须解决的挑战。
在过去的 2 年中,我们目睹了用于诊断和指导干预以治疗脊柱疾病的成像技术设备的爆炸式扩展。结构和功能定量成像在脊柱及其内容物的评估中起着至关重要的作用——图像分析方法的进步导致了更快速和更具体的诊断、治疗和改善的结果。最近,应用于临床和脊柱研究活动的计算建模的最高能力为加速或自动化常规成像任务提供了无与伦比的机会,例如解剖结构分割、对象(例如,病变或感兴趣区域)检测和对象分类. 在各种医学专业取得许多成功的基础上,机器学习 (ML) 已被应用于改善脊柱病变的诊断、辅助手术干预计划以及改进复杂脊柱疾病的治疗。这些发展不仅限于研究环境——基于 ML 的工具正在进入临床,首批应用获得了食品和药物管理局 (FDA) 的批准。
这篇综述概述了 ML 在脊柱诊断和治疗中的应用,特别关注脊柱外科医生对该技术应用的直观理解。大致分为侧重于“区分”(即从提供的数据中收集见解)和“生成”(即产生新对象)应用的部分,我们调查了脊柱畸形、退化和创伤、手术计划和术中辅助系统中的机器学习研究,以及其他质量和安全改进(图[url=]1[/url])。最后,我们简要评估了局限性并概括了潜在的好处。
基于成像的机器学习使医生和患者受益。ML 方法的进步可能代表着对当前脊柱手术工作流程的重大改进。本综述中讨论的示例包括增加现有图片存档和通信系统的诊断和表征功能、对术前/术后管理决策的预后支持等。机器学习,机器学习。
表 1. - 脊柱手术中鉴别性 ML 应用的选定文献:脊柱畸形的诊断和表征应用
参考 | 机器学习方法 | 输入 | 行列式 | 结果 | 语境 | 数据集大小 | 任务 | 指数 | 价值 | 伯杰龙等人 | 支持向量机 | 激光扫描和 XR (PA) | 曲率系数 | | | | 脊柱侧弯 | 149套 | Jaremko 等人 | 人工神经网络 | 激光扫描和 XR (PA) | 科布角 | ∡ | 硒/磷 | 1.0/0.75 | 脊柱侧弯 | 65套 | 拉米雷斯等人 | 支持向量机,DT | 激光扫描和 XR (PA) | 曲率分类 | 支持向量机分类 | 累积 | 69%-85% | 特发性脊柱侧弯 | 111套 | DT分类 | 累积 | | 科美利等人 | DT | 激光扫描和 XR | 进度识别 | 进步 | 累积 | 85.7% | 特发性脊柱侧弯 | 100套 | 无进展 | 累积 | 71.6% | 渡边等人 | 美国有线电视新闻网 | 摩尔纹照片和 XR | 科布角 | ∡ | MAE | 3.42° | 特发性脊柱侧弯 | 1996套 | 张等人 | FHT | XR | 科布角 | ∡ | 国际商会 | >0.95 | 脊柱侧弯 | 76 张图片 | 疯狂的 | <5° | 吴等人 | 美国有线电视新闻网 | XR | 地标估计 | 估计 | MSE | 0.0046 | 脊柱侧弯 | 481 张图片 | 吴等人 | 美国有线电视新闻网 | XR(AP,纬度) | 科布角 | 美联社∡ | CMAE | 4.04° | 脊柱侧弯 | 526 张图片 | 纬度∡ | 4.07° | 潘等人 | 美国有线电视新闻网 | XR | 科布角 | ∡ | 国际商会 | 0.887 | 脊柱侧弯 | 248 张图片 | 疯狂的 | <3.5° | 霍恩等人 | 卷积神经网络 | XR (美联社) | 科布角 | ∡ | 累积 | >96% | 脊柱侧弯 | 35 张图片 | 硒/磷 | >0.98/0.945 | 张等人 | 深度卷积神经网络 | 模型/脊柱 XR | 科布角 | 型号∡ | 国际商会 | >0.912 | 脊柱侧弯 | 40 个模型和 65 个图像 | 脊柱∡ | >0.771 | 赵等人 | 美国有线电视新闻网 | XR(纬度) | 前凸角 | 脊柱前凸∡ | 累积 | 86.2% | 脊柱前凸 | 629 张图片 | MAE | 8.055° | Birtane 等人 | 模糊 | 模型/脊柱 XR | King-Moe分类 | 型号∡ | 累积 | 80% | 脊柱侧弯 | 10 个模型和 25 个图像 | 脊柱∡ | 50% | 杨等人 | 美国有线电视新闻网 | 照片和XR | 检测分级 | 检测 | 曲线下面积 | 0.929 | 脊柱侧弯 | 1683套 | Duong 等人 | 模糊 | 重建的脊柱模型 | 分类模式 | | | | 脊柱侧弯 | 409款 | Galbusera 等人 | 美国有线电视新闻网 | XR | 几何参数 | 科布∡ | 东南 | 9.9° | 脊柱侧弯/脊柱后凸/脊柱前凸 | 493套 | 脊柱后凸∡ | 8.6° | 脊柱前凸∡ | 11.5° | ∡、角度测量;ACC,准确度;ANN,人工神经网络;AP,前后;AUC,曲线下面积;CMAE,圆形平均角度误差;CNN,卷积神经网络;DCNN,深度卷积神经网络;DT,决策树;FHT,模糊霍夫变换;ICC,组内相关;MAD,平均角度偏差;MAE,平均角度误差;机器学习,机器学习;MSE,均方误差;PA,后前部;SE,标准误差;Se/Sp、敏感性和特异性;SVM,支持向量机;XR,X射线。
判别系统在脊柱中的应用脊柱畸形的检测和表征判别神经网络 (NN) 应用最流行的背景之一是脊柱侧凸和相关脊柱畸形的诊断和表征。在 60 岁以上的成年人中,发病率高达 68%,因此人们对开发更有效的疾病表征方法非常感兴趣。目前的临床范例涉及 Cobb 角的手动测量,这会基于维度和观察者偏差造成限制。因此,基于机器学习的方法试图以不同的方式解决这些限制(表1)。
表 2. - 用于脊柱手术中鉴别性 ML 应用的选定文献:在退行性和创伤性脊柱病变的诊断和表征中的应用
参考 | 机器学习方法 | 输入 | 行列式 | 结果 | 语境 | 数据集大小 | 任务 | 指数 | 价值 | Michopoulou 等人 | 流式细胞仪 | T2 核磁共振 | DD检测 | 退化的磁盘 ID | DSI | 89.2-91.7 | DDD | 170 体外诊断 | 普通磁盘 ID | 84.4-88.6 | 奥克泰等人 | 支持向量机 | T2 核磁共振 | DD检测 | 检测 | 累积 | 92.81% | DDD | 612 体外诊断 | 硒/磷 | 0.946/0.898 | 戈什等人 | 支持向量机、LDA、NBC、QDA、支持向量机 | T2 核磁共振 | DD检测 | 检测 | 累积 | 94.86% | DDD | 175 体外诊断 | 硒/磷 | 0.959/0.9245 | 戈什等人 | k -NN、SVM、NBC | T2-SPIR 核磁共振 | DD检测 | 由k -NN 识别 | 累积 | 96.57% | DDD | 175 体外诊断 | 硒/磷 | 0.981/0.959 | 支持向量机的 ID | 累积 | 92.0% | 硒/磷 | 1.0/0.8852 | NBC的身份证 | 累积 | 98.29% | 硒/磷 | 0.962/0.992 | 卡斯特罗-马特奥斯等人 | 神经网络 | T2 核磁共振 | DD 的普菲尔曼分级 | 磁盘等级 | 硒/磷 | 0.955/0.873 | DDD | 240 体外诊断 | 孙达辛和凯萨万 | 射频 | T2 核磁共振 | DD分类 | “凸起”分类 | 累积 | 94% | DDD | 第378章 | 硒/磷 | 0.89/0.96 | “干燥”分类 | 累积 | 92% | 硒/磷 | 0.97/0.87 | “正常”分类 | 累积 | 97.3% | 硒/磷 | 0.71/1.0 | Al-Helo 等人 | NN /千米 | CT(下垂) | 骨折检测 | NN检测 | 累积 | 93.2% | VF | 50 次扫描 | k M检测 | 硒/磷 | 0.991/0.875 | 罗斯等人 | 深度卷积神经网络 | CT(轴/心/下垂) | 骨折检测 | 检测 | 曲线下面积 | 0.857 | VF | 23 名患者 55 处骨折 | FPR = 5 硒 | 0.71 | FPR = 10 硒 | 0.91 | 伯恩斯等人 | 不清楚 | 电脑断层扫描 | 骨折检测、Genant 分类/分级和骨密度测量 | VF检测 | 硒/磷 | 0.957/0.71 | 声压级,OP | 150 名患者 210 处骨折 | 基因分类 | 累积 | 95% | WCκ | 0.90 | 基因分级 | 累积 | 68% | WCκ | 0.59 | 尤瑟菲等人 | 支持向量机,k -NN | 电脑断层扫描 | 骨折检测与分类 | 支持向量机检测 | 累积 | 86.6% | VF | 25 次扫描 | 硒/磷 | 0.914/0.85 | k- NN检测 | 累积 | 88.3% | 硒/磷 | 0.925/0.833 | 村田等人 | 深度卷积神经网络 | XR (美联社) | 骨折检测 | 检测 | 累积 | 86.0% | VF | 300 PTLR? | 硒/磷 | 0.847/0.873 | 维罗内齐等人 | 神经网络 | XR(纬度) | OA检测 | 检测 | 累积 | 62.85% | 初级OA | 206 张图片 | 硒/磷 | 0.657/0.60 | 硒/磷 | 0.85/0.679 | Ruiz-España 等人 | GVF | T2 MRI(轴/下垂) | DD 和 SS 检测的 Pfirrmann 分级 | DD Pfirrmann 分类 | 硒/磷 | 0.958/0.926 | DDD,SS | 295 体外诊断 | Cκ | 0.81 | SS检测 | Cκ | 0.84 | 韩等人 | 深度卷积神经网络 | T1/T2 核磁共振 | 神经椎间孔狭窄检测 | 异常孔检测 | 地图 | 0.837-0.876 | FS | 200 次扫描 | 李等人 | 深度卷积神经网络 | XR 和 DXA | 骨矿物质密度计算 | 密度预测 | 累积 | 71% | OP | 334 张图片 | 硒/磷 | 0.81/0.60 |
∡、角度测量;ACC,准确度;AP,前后;AUC,曲线下面积;Cκ,科恩卡帕;CMAE,圆形平均角度误差;CT,计算机断层扫描;DCNN,深度卷积神经网络;DD,退化磁盘;DDD,退行性椎间盘疾病;DSI,骰子平方指数;DXA,双能 X 线骨密度仪;FPR,每位患者的假阳性率;FCMs,模糊c均值;FS,椎间孔狭窄;ICC,组内相关;身份证、身份证;IVD,椎间盘;k M, k -均值;k -NN, k-最近的邻居; LDA,线性判别分析;MAD,平均角度偏差;MAE,平均角度误差;mAP,平均平均精度;MAE,平均角度误差;MSE,均方误差;NBC,朴素贝叶斯分类器;NN,神经网络;OA,骨关节炎;OP,骨质疏松症;QDA,二次判别分析;RF,随机森林;Se/Sp、敏感性和特异性;SPIR,具有反转恢复的光谱预饱和;SS,椎管狭窄症;SVM,支持向量机;VF,椎体骨折;WCκ,加权 Cohen kappa;XR,X射线。
最早的此类尝试涉及从表面形貌估计脊柱畸形。由于基于 MRI 的方法成本高昂且仰卧位要求高,现有“脊柱侧弯计”系统的结果存在异质性,以及基于放射照相的诊断和表征所需的大剂量辐射,因此能够从迫切需要表面地形。早期的努力涉及使用人工神经网络、支持向量机 (SVM)、和决策树从激光扫描中识别或表征脊柱侧弯。作者指出,这种方法可以减少没有脊柱侧凸进展的个体的辐射剂量。Watanabe 等人]和 Yang 等人基于摄影图像训练了基于卷积神经网络的脊柱侧弯分类器,并报告了超人的准确性。这些研究显示了基于表面断层扫描对脊柱侧弯的严重程度进行分类和监测的有希望的结果。值得注意的是,结果是异质的,没有验证研究就无法进行比较。尽管如此,成像技术、ML 开发和对更大数据集的训练的改进可以避免错误分类错误并提高训练 ML 的准确性和可重复性。因此,脊柱侧凸和脊柱侧凸进展的辐射独立识别可以允许在筛查能力中实施这种基于 ML 的地形分析。 脊柱侧弯表征的其他方法依赖于基于 ML 的脊柱几何特征提取。方法在脊柱 X 光片或制造模型上进行了训练,并且是自动或半自动的(即手动标记的感兴趣区域)。Zhang 等人、Wu 等人、 Pan 等人、和 Horng 等人的方法产生的 Cobb 角测量结果与专家医师测量结果没有显着差异,并且在手动测量中发现了相同的观察者间方差。最近在脊柱前凸测量中应用 U-nets 实现了医生级别的准确性,尽管具有更高的可变性,证明了这种方法在其他脊柱畸形情况下的前景。
退行性和创伤性脊柱病变的诊断
退化和创伤性损伤都是世界各地医疗保健负担的主要来源,特别是在人口老龄化的国家。尽管在开发检测和描绘临床相关脊柱解剖结构的自动化方法方面付出了巨大努力,但很少有方法能够在表征退行性疾病方面达到显着的准确度。相关解剖结构缺乏明显的放射学强度值是一个巨大的挑战——纤维环和周围的结缔组织是等强度的,椎间盘的核和周围的椎体也是如此。此外,传统 MRI 中使用的二维切片提供了较低分辨率的体素数据,从而导致可能导致边界模糊的部分体积效应。因此,将 ML 应用于放射影像解释任务可能代表了一种在治疗前表征退行性和创伤性脊柱疾病的更简化的方法(表2)。
用于识别退化磁盘的 ML 方法使用了模糊c均值、24 个SVM、25个 ML 方法的顺序组合、26 个或多数投票系统,其中对各种 ML 方法的输出进行加权。Ghosh 等人使用后两种方法在 T2 加权正中矢状 MRI 扫描中识别退化的椎间盘疾病——两者都取得了令人印象深刻的结果。Oktay 等人的后续工作在更大的数据集上使用了 SVM,发现他们的 SVM 方法优于 Ghosh 等人使用的 2 种方法。
后来的方法使用 ML 方法根据自定义标准或“黄金标准”Pfirrmann 分级标准对退化的磁盘进行分类。 Sundarsingh和 Kesavan 开发了一个全自动系统,该系统通过结合特征检测方法和 ML 分类器,将 T2 MRI 上的椎间盘识别和分类为“正常”、“隆起”或“干燥”。Ruiz-España 等人开发了一种半自动系统,该系统使用梯度矢量流对退化磁盘进行分级,与人类专家(科恩 kappa 为 0.81)实现了“几乎完美”的一致性。同样,Castro-Mateos 等人使用 NN 通过 T2 MRI 上的 Pfirrmann 标准对退化的椎间盘进行分类,手动标记的椎间盘中心具有相当高的准确性。因此,这些方法显示出自动化和临床相关准确性提高的趋势。
此类方法已在用于自动检测椎骨骨折的计算机辅助设计 (CAD) 系统中实施。在这种情况下使用的方法包括 NN、深度 CNN (DCNN)、和 SVM ,应用于计算机断层扫描 (CT) 扫描和射线照片。Burns 等人开发了一种 CAD 系统,能够检测、分类和 Genant 分级脊椎骨折,并与放射科专家“几乎完美”对齐。Murata 等人开发了一种非凡的方法,他们在 300 张前后位 X 光片的数据集上训练和验证了 DCNN。村田等人将 DCNN 的准确性与 20 名骨科住院医师、24 名董事会认证的骨科医生和 9 名董事会认证的脊柱外科医生进行了比较——DCNN 在准确性和灵敏度方面优于或几乎与住院医生和骨科医生相媲美,并捕获了 96% 的人类遗漏的骨折。尽管医生可以访问电子病历 (EMR) 中的非放射学信息,但 DCNN 的识别完全基于射线照片。这些工作证明了机器学习方法在提高诊断准确性和降低所涉及的成本和辐射暴露方面的巨大潜力——X 光片是 MRI 成本的一小部分,并且需要的辐射暴露量是 CT 扫描的 5% 到 33%。
尽管椎间盘退变、椎间盘突出和椎骨骨折的检测和分类代表了该领域中基于 ML 的大部分工作,但基于 ML 的 CAD 系统正在研究用于其他结构性脊柱疾病,例如骨关节炎、骨质疏松症、和椎间孔狭窄(图[url=]2[/url])。此外,能够识别多种病理的“多价”CAD系统也在研究中。这些应用表明 ML 在退行性和创伤性脊柱疾病方面的巨大潜力。
图 2:判别式和生成式机器学习。一般来说,ML模型分为判别模型和生成模型。此图显示了 ML 在脊柱成像和手术中的应用示例。A,判别建模是一项监督学习任务,涉及训练模型以计算给定输入的输出概率。在这个例子中,卷积神经网络被训练用于精确的椎骨分割和磁盘级定位。之后,该模型能够自动测量椎间盘体积以进行狭窄分级。乙, 生成式建模是一项无监督学习任务,它涉及自动发现和学习输入数据的特征,从而使模型可用于生成或输出可能从原始数据集中提取的新数据。在这里,生成对抗网络用于从捕获的计算机断层扫描图像生成磁共振图像。另一项任务可能涉及提高获取的放射学图像的分辨率。机器学习,机器学习。
决策支持手术计划
除了识别或表征病理之外,图像分析应用程序还体现了 ML 方法在协助脊柱外科医生制定计划和在手术过程中的能力。这些方法直接集成到手术工作流程中,可以增强或自动化原本耗时或容易出错的过程。这些系统在脊柱应用的术前和术中辅助方面具有巨大的潜力。
辅助规划软件使外科医生能够生成术前成像的 3D (3D) 模型,以便更好地理解复杂的解剖结构,并通过 3D 打印制造特定于患者的器械和植入物来促进更好的畸形矫正。这些模型还被用于定制椎弓根螺钉、引导截骨术,并通过模拟计划干预来定义脊柱上的应力。此功能由 ML 算法实现,该算法可自动分割脊柱和生成 3D 模型。这些模型根据患者数据进行训练,以设计特定患者的脊柱笼,从而显着减少笼装配时间并提高矫正质量以获得更好的结果。 此外,神经网络受过训练,可以自主放置具有正确长度、直径和角度的椎弓根螺钉,以进行矫正手术。在一项对 20 名患者和 208 颗椎弓根螺钉进行术前 CT 扫描的回顾性研究中,Siemionow 等人发现 ARAI (Surgalign) 建议的 99% 的椎弓根螺钉轨迹是 Ravi 1 级和 Gertzbein A 级,表明没有硬膜破裂。诸如此类的系统对于未来的脊柱外科医生来说可能是一种非常有效的工具。
术中辅助系统
其他 ML 方法直接与手术工作流程集成以协助外科医生——其中一个系统 ClarifEye(皇家飞利浦)已经实现商业化(图[url=]3[/url])。该系统将 ML 图像分割与基于术中锥形束 CT (cbCT) 的增强现实显示相结合,使外科医生能够通过头戴式显示器可视化手术部位内的解剖结构和设备。该系统已经过脊柱融合、骨活检和椎弓根螺钉放置、和经皮椎体成形术的测试。使用在 20 具尸体上训练的霍夫变换,ClarifEye 系统可以自动识别椎弓根并建议螺钉路径。当这个训练有素的模型应用于术中 cbCT 扫描时,生成的手术计划的准确率为 86.1%,当排除患有严重脊柱侧凸、退化或先前手术的尸体时,准确率上升到 95.4%。Elmi-Terander 等人在 ClarifEye 辅助下研究了 Jamshidi 针放置的准确性,发现平均误差与人工放置相当,同时角度偏差减少(与不利结果相关)。作者进一步报道了临床试验中螺钉置入的准确率为 94.1%。奥洛格等人在另一项临床试验中使用该系统规划微创经皮椎体成形术的经椎弓根入路,并发现计算机辅助和手动规划之间的准确性没有显着差异,但会花费双倍的套管针部署时间。此外,Auloge 等人和 Elmi-Terander 等人都注意到由于术中 CT 使用频率较低,辐射剂量显着降低。
图 3:计算机视觉的术中辅助。基于图像的术中支持应用程序可以在微创手术中实现解剖结构、仪器和轨迹体积的可视化,已经开始在脊柱手术中进行小规模临床验证。(1) 获取来自计算机断层扫描或 MRI 的术前/术中图像并将其输入到 ML 方法。(2) ML 方法识别脊柱解剖结构、病理和仪器,将 3D 模型与原始成像模式配准;(3) 可以生成螺钉和器械的最佳轨迹。(4) 3D 模型用于通过头戴式显示器(例如 Philips ClarifEye、xvision 和 ZedView)或反射到半透明镜(例如 ARAI、Fritz 等人使用的 Perk 站)上生成手术区域的覆盖图 )。3D,三维;机器学习,机器学习。
虽然 ClarifEye 系统正在等待 FDA 批准,但 xvision (Augmedics) 增强现实脊柱融合辅助系统已经在美国进入临床使用。xvision 系统由一个无线头戴式显示器组成,该显示器通过连接到手术设备和脊柱解剖结构(如髂嵴或棘突)的配准标记将解剖结构和仪器的位置投射到外科医生的视野中。该系统允许外科医生在不将眼睛或手移出现场的情况下可视化解剖结构和术中导航计划。与现有的基于计算机的导航方法相比,xvision 能够匹配或超过椎弓根螺钉放置精度。
尽管 ClarifEye 和 xvision 系统可能是基于 ML 的商业手术计划和辅助技术的先锋,但它们绝不是孤立的。ARAI (Surgalign) 将基于神经网络的椎弓根螺钉轨迹规划器与实时脊柱分割和配准相结合。由此产生的系统能够将解剖结构和硬件的位置投影到外科医生和患者之间的透明屏幕上,并在尸体上进行验证。此类技术的开发也在学术界进行——Fritz 等人使用带有 Perk 工作站的 3D Slicer 平台来执行 MRI 引导的椎体成形术——Perk 工作站将实时针跟踪叠加在已注册的 MRI 扫描上,并将其投射到患者身上。使用这种方法,作者报告了准确的针放置,没有水泥泄漏到周围空间中。同样,Abe 等人将由 ZedView (LEXI) 术前规划系统生成的手术计划叠加到头戴式显示器上,以显示椎体成形术针头,并发现与手动生成的计划相比,插入角度误差显着降低。其他基于 ML 引导的基于图像的方法仍在开发中,并且可能会扩大这个公认的有限范围——强化学习系统的技术验证和基于马尔可夫决策过程的前路脊柱融合手术自动规划方法已经得到证实。尽管这些技术还处于起步阶段,但重要的是要注意它们在帮助外科医生的准确性和效率方面的潜力。
预测和预后支持
将 ML 应用于医学数据的解释以开发用于预测和决策支持的预后指标是所有医学专业都具有重要研究兴趣的领域。然而,大多数方法使用来自 EMR 的人口统计和定量数据的组合,并且超出了本综述的放射和脊柱重点。感兴趣的读者可以阅读 Malik 和 Khan、 [/url] Damron 和 Mann、和 Buchlak 等人对 ML 对神经外科决策支持的此类应用的出色评论。在本节中,我们旨在概述主要使用脊柱放射学数据的基于 ML 的预测、预后和决策支持系统。
传统的骨成像技术以极高的分辨率收集许多骨学参数的数据。然而,骨的参数和骨学特性之间的关系基本上知之甚少。ML 方法已被应用于从此类参数/属性关系中生成新颖的预测见解。Atkinson 等人基于定量 CT 和双能 X 射线吸收测定法使用梯度增强机 (GBM) 评估椎体和 Colles 骨折风险,发现 GBM 优于传统回归模型。Muehlematter 等人最近的工作让初级和高级放射科医师和一个 SVM 仅根据初始 CT 扫描预测椎体骨折,并发现它轻松胜过两位放射科医师。Hopkins 等人的另一项工作是根据修改后的日本骨科协会临床标准,将 DCNN 应用于 MRI 扫描对脊髓型颈椎病的诊断和分级,取得了很好的结果。
这种独特的洞察力生成能力也被应用于治疗结果的预测。Lewandrowski 等人报告称,让 Multus Radbot (Aptus Engineering) DCNN 预测术前 MRI 成功进行内窥镜减压的可能性,并发现放射科医生和 DNN 之间的预测准确度几乎相同。同样,Pasha 等人使用随机森林 (RF) 分类器根据术前影像学和临床测量以及手术参数以 75% 的准确度预测后路脊柱融合结果。此外,基于 DNN 的数据融合方法的最新发展使基于成像和基于 EMR 的 ML 方法的合成成为可能。因此,常规或介入后成像可能会产生强大的预后和预测洞察力,尤其是与其他数据源结合时(图4)。
图 4:集成的数据融合工作流程。来自针对放射照相分析和人口统计数据定制的 ML 应用程序的判别性和生成性数据产品反过来可以通过“融合”ML 方法进行合成。因此,可以通过 ML 方法对大量数据(例如术前或常规成像、实验室值和人口统计细节)进行顺序分析和整合,以根据临床医生或外科医生。机器学习,机器学习。
生成系统的应用
虽然判别网络代表了医学 ML 正在进行的大部分工作,但在撰写本文时,生成对抗网络 (GAN) 还不到十年的历史,但它代表了一个巨大且尚未开发的临床应用空间。根据定义,GAN 使生成器和判别器网络相互对抗,最终生成充分模仿训练数据以欺骗判别器网络的对象(图[url=]2[/url])。因此,可以调整这些系统以专注于它们的生成或判别功能。虽然后者在很大程度上类似于神经网络的应用,前者可以为图像采集和分析方法中的挑战提供更有效和/或更准确的解决方案。个接受过放射影像训练的 GAN 已应用于放射治疗计划生成、个脑肿瘤生长模式预测、个以及在现有图片存档和通信系统中加速图像重新编译。然而,最大的优势在于 GAN 所代表的“生活质量”改进。由于同质训练数据的稀缺性,一些人已经应用 GAN 来生成人工医学图像,作为其他 ML 系统的训练集。同样,基于 GAN 的图像协议已捕获 MRI 和 CT 图像,扫描时间减少、辐射剂量、]和对比度需要。回顾性 GAN 可以智能地去噪低质量图像并纠正运动伪影。GAN 最令人着迷的应用涉及成像的多模态转换——磁共振成像到 CT,CT 到磁共振成像,和 CT 到 cbCT。此功能可以使外科医生和内科医生受益于任一方式的诊断洞察力,同时降低患者的成本或最大限度地减少辐射剂量。因此,尽管 GAN 方法仍处于起步阶段,但成功实施将显着改善医学图像工作流程。有兴趣的读者请参阅 Yi et al 的优秀评论有关该主题的更多信息。
限制
一个机器学习模型只会和它训练的数据一样好——这对当前基于脊柱成像的应用程序来说是一个严重的限制。尽管存在用于人口统计或基于 EMR 的应用程序的大型数据集,但很少有专门用于神经影像学的数据集。如果没有全面涵盖脊柱病理学特征的大型数据集,真正可推广的应用程序的开发将受到严重阻碍。此外,成像分析和计算机视觉中许多判别应用的“基本事实”通常是人类专家的评估。因此,准确性的评估将始终受到基本事实固有的测量可变性的限制。最后,许多较新的深度学习方法在功能上是“黑匣子”——它们得出结论的机制是未知的。这为这些系统学在临床环境中的应用提出了新的伦理和法医学考虑。因此,机器学习在脊柱手术中的应用是非常未知的——必须仔细应对这些挑战,才能充分享受机器学习可以提供的好处。
结论
ML 应用程序和可访问性的增加为其在神经外科医生的医疗设备中的应用带来了无与伦比的潜力。ML 快速接近人类或超人类水平的诊断能力或从现有能力中提供新见解的能力将极大地造福医生及其患者。虽然有些系统已经达到了商业水平,但在广泛实施之前还需要做大量的工作。
|