2024-07-10发表2025-03-21更新 ByteAILab 4 分钟读完 (大约654个字)

开源3D医学大模型SAT，支持497类器官，性能超越72个nnU-Nets，上交大团队发布

作者 | 上海交通大学、上海人工智能实验室
编辑 | ScienceAI

近日，上海交通大学与上海人工智能实验室联合团队发布3D医学图像分割大模型SAT（Segment Anything in radiology scans, driven by Text prompts），在3D医学图像（CT、MR、PET）上，基于文本提示实现对人体497种器官/病灶的通用分割。所有数据和代码、模型均已开源。

论文链接：https://arxiv.org/abs/2312.17183
代码链接：https://github.com/zhaoziheng/SAT
数据链接：https://github.com/zhaoziheng/SAT-DS/

研究背景
医学图像分割在诊断、手术规划和疾病监测等一系列临床任务中都有重要作用。传统的研究针对每个特定的分割任务训练「专用」模型，导致每个「专用」模型的应用范围都相对有限，无法高效便捷地满足广泛多样的医疗分割需求。

与此同时，大语言模型最近在医疗领域取得了巨大成功，而要进一步推动通用医疗人工智能的发展，构建一个可以连接语言和定位能力的医学分割工具变得十分必要。

研究价值
作为首个基于文本提示的3D医疗图像通用分割大模型，SAT的价值体现在许多方面：

SAT构建了高效灵活的通用分割
SAT是基于大规模分割数据预训练的基础模型
SAT实现了基于文本提示的准确、鲁棒分割
SAT可以作为大语言模型的代理工具
模型尺寸对于分割的影响
领域知识对于分割的影响

文章作者为赵子恒，张耀，吴超逸，张小嫚，张娅教授，王延峰教授，谢伟迪教授。

数据构建

多模态知识图谱
SAT-DS

模型架构

知识注入
基于文本提示的通用分割

模型测评

与专用模型nnU-Nets的对比实验
与交互式分割模型MedSAM的对比实验
定性比较
域外测试结果

消融实验

视觉骨干网络
文本编码器

与大语言模型的结合

文章标签

产业
图像分割
医学影像
大模型
AI

文章操作

收藏文章
评论
分享

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

开源3D医学大模型SAT，支持497类器官，性能超越72个nnU-Nets，上交大团队发布

https://www.gptnb.com/2024/07/10/2024-07-09-auto5_2-V4dLWk/

作者

ByteAILab

发布于

2024-07-10

更新于

2025-03-21

开源3D医学大模型SAT，支持497类器官，性能超越72个nnU-Nets，上交大团队发布

作者

发布于

更新于

许可协议

喜欢这篇文章？打赏一下作者吧

链接

分类

最新文章

归档

标签

订阅更新