发表的一篇新论文描述了 DALL-E 2 等生成模型(一种用于文本到图像生成的新型深度学习模型)如何代表一种有前途的未来图像生成、增强和操作工具卫生保健。生成模型是否具有足够的医学领域知识来提供准确有用的结果?Lisa C Adams 博士及其同事在他们最新的题为“DALL-E 2 对放射学了解多少?”的观点中探讨了这个话题。 DALL-E 2由 OpenAI 于 2022 年 4 月首次推出,是一种人工智能 (AI) 工具,因基于文本输入生成新颖的逼真图像或艺术品而广受欢迎。DALL-E 2 的生成能力非常强大,因为它已经接受了互联网上数十亿个现有文本图像对的训练。 为了了解这些功能是否可以转移到医疗领域以创建或增加数据,来自德国和美国的研究人员检查了 DALL-E 2 在创建和操作 X 射线、计算机断层扫描 (CT)、磁共振成像 ( MRI)和超声图像。 该研究的作者发现,DALL-E 2 已经学习了 X 射线图像的相关表示,并显示出文本到图像生成的巨大潜力。具体来说,DALL-E 2 能够根据简短的文本提示创建逼真的 X 射线图像,但在给出特定的 CT、MRI 或超声图像提示时,它的表现就不太好。 它还能够合理地重建放射图像中缺失的方面。它可以做的更多——例如,仅使用一张膝盖图像作为起点,创建一张完整的全身 X 光片。然而,DALL-E 2 生成具有病理异常的图像的能力有限。 使用 DALL-E 2 创建的 CT、MRI 和超声图像中文本到图像生成的解剖结构示例。MRI:磁共振成像。 DALL-E 2 生成的合成数据可以大大加快新的放射学深度学习工具的开发,并解决与机构间数据共享相关的隐私问题。该研究的作者指出,生成的图像应由领域专家进行质量控制,以降低错误信息进入生成数据集的风险。他们还强调需要进一步研究,以根据医学数据微调这些模型,并结合医学术语来创建强大的模型,用于放射学研究中的数据生成和扩充。 尽管公众无法对 DALL-E 2 进行微调,但其他生成模型(如Stable Diffusion)可以进行微调,可用于生成各种医学图像。 总的来说,这种观点为放射学中人工智能图像生成的未来提供了一个充满希望的前景。这一领域的进一步研究和开发可能会为放射科医生和医疗专业人员带来令人兴奋的新工具。 |
Powered by Discuz! X3.5
© 2001-2025 Discuz! Team.