癌症治疗中,医生最怕判断错误。淋巴结有没有被癌细胞侵犯?侵犯到什么程度?这些问题直接决定患者该做手术还是化疗,该切多少组织。但人眼看CT片,经常会漏诊或误判。现在,复旦大学附属中山医院联合阿里达摩院开发的AI模型DeepENE,在这个让专家都头疼的难题上交出了惊艳答卷。
这项研究成果最近发表在医学影像领域的权威期刊《放射学》上。研究团队聚焦喉癌和下咽癌这两种”邻居”式的恶性肿瘤。别小看这两种癌症,2022年全球新发病例就有25万,死亡人数超过13万。对于这类头颈部肿瘤,淋巴结转移的情况是医生制定治疗方案的核心依据,尤其是更严重的”淋巴结包膜外侵犯”——也就是癌细胞已经突破淋巴结的包膜,开始向周围组织扩散,这意味着病情进入了更凶险的阶段。
问题在于,头颈部的淋巴结密密麻麻,在CT影像上经常重叠在一起,早期的包膜外侵犯变化又特别细微,放射科医生从术前CT片里做出准确判断并不容易。即便是经验丰富的专家,不同人的判断结果也可能相差很大。这种不确定性让临床决策面临风险,患者可能因此接受过度治疗或治疗不足。
复旦中山医院耳鼻咽喉头颈外科的黄新生、沈纳团队和达摩院的AI专家们决定用人工智能来解决这个棘手问题。他们首先构建了一个高质量的训练数据集,仔细标注了289例喉癌、下咽癌患者的1954枚淋巴结,以及32例口腔鳞癌患者的409枚淋巴结。这些淋巴结都经过病理切片证实,是最可靠的”标准答案”。
达摩院资深算法专家金达开介绍,DeepENE采用了一种创新的技术架构,叫做”双流2.5D多尺度深度特征融合和联合优化网络”。简单来说,这个AI既能看清淋巴结局部的细节变化,又能把握整体的结构特征,然后把这些信息综合起来做判断。就像一个医生既用放大镜仔细观察可疑区域,又后退几步看整体布局,两种视角结合才能得出准确结论。
AI模型的表现确实令人惊讶。在三个独立的外部测试集中,DeepENE的AUC值分别达到0.96、0.87和0.90。AUC值是衡量诊断准确性的关键指标,数值越接近1表示准确性越高。这三个测试集来自不同医院,涵盖了不同设备和不同患者群体,AI在各种条件下都保持了稳定的高水平表现。
更关键的是,AI的整体表现超过了5位头颈部医学影像专家。特别是在诊断难度最大的那个测试集中——这个测试集里早期包膜外侵犯的比例很高,正是人类专家最容易失手的情况——AI模型的AUC达到0.87,敏感性达到78%。而人类专家的平均AUC只有0.66,敏感性仅为36%。也就是说,在这种”地狱难度”的诊断场景下,专家们平均只能发现三分之一的病变,而AI能找出将近八成。
这个差距意味着什么?对患者来说,可能就是生死之别。如果医生没能在术前发现包膜外侵犯,手术切除范围不够,术后复发风险会大大增加。如果误判了良性淋巴结,患者可能承受不必要的扩大手术和更强的放化疗副作用。DeepENE的高准确率能帮助医生避开这些陷阱,让治疗决策建立在更可靠的基础上。
值得注意的是,国际癌症分期权威指南AJCC的新版本已经将包膜外侵犯阳性直接定为N3b期,这是一个相当晚期的分期,意味着治疗策略会有根本性改变。能不能准确识别包膜外侵犯,不仅关系到预后判断,更直接影响患者接受什么样的治疗组合。
研究团队表示,DeepENE有效解决了传统人工判读的诸多痛点,接下来的计划是把这个AI模型真正整合进医院现有的工作流程中,在实际临床环境里验证它的价值。从研究成果到临床应用,这中间还有很多工作要做,包括软件的优化、与医院影像系统的对接、医生培训等等。
这不是达摩院第一次在医疗AI领域取得突破。据介绍,达摩院长期投入医疗影像AI研发,在胰腺癌、胃癌、主动脉夹层等重大疾病的筛查上都有创新成果,相关论文三次登上《自然·医学》这本顶级期刊,还获得了美国FDA”突破性医疗器械”的认定。目前,达摩院的医疗AI服务已经覆盖全球9个国家和地区的医疗机构,累计服务超过5000万人次。
医疗AI的价值正在从实验室走向真实世界。当AI能够在人类专家最容易出错的地方提供可靠的第二意见,当算法的眼睛能看到CT片上那些人眼难以捕捉的微小征象,医疗诊断的准确性和一致性就会得到实质性提升。对于喉癌、下咽癌患者来说,这意味着更精准的分期、更合理的治疗方案和更好的生存预后。
