2023年4月3日,清华大学精密仪器系、清华-IDG/麦戈文脑科学研究院孔令杰课题组与清华长庚医院、清华大学自动化系合作者在Nature Machine Intelligence杂志以长文的形式在线发表了题为“Deep learning supported discovery of biomarkers for clinical prognosis of liver cancer”的研究论文。该研究以AI和病理医生相互协作的方式构建了癌症预后标志物智能挖掘平台PathFinder,证实了仅使用活检病理样本的全局组织稀疏空间分布信息即可实现准确预后。并以肝细胞癌为例进行数据挖掘、表征,验证了两种全新的预后标志物,展示了深度学习方法在精准医学应用的新范式。
病理组织的生物标记物对癌症诊断、预后评估和治疗规划至关重要。随着深度学习技术的发展以及大量数字病理信息的积累,通过计算机视觉等方法处理数字病理信息的计算病理学发展迅速。已有研究表明,基于大量数字病理图像信息和病人生存信息训练的深度神经网络可以实现高于传统分期的预后准确度。然而,深度神经网络有限的可解释性和泛化能力阻碍了这些高准确度的深度预后模型的临床实践和应用。将深度学习作为工具,从大量病理数据中以知识挖掘的方式寻找出有明确病理意义、可用数学模型表征的病理预后标志物有望成为连接临床病理和深度学习的桥梁。
针对上述难题,本文提出了一种可解释的、以人为中心的深度学习框架——PathFinder,帮助病理学家从表现良好的深度学习模型中发掘新的病理预后标志物。通过将数字病理切片图像(WSI)的稀疏多类组织空间分布信息与归因方法相结合,PathFinder可以实现潜在生物标志物的定位、表征和验证,同时保证优越的预后性能。该研究以肝细胞癌为例,通过PathFinder发现肝脏坏死组织的空间分布——这一长久以来被忽视的特征与病人预后有显著关系,并基于此提出了两种全新的病理预后标志物。通过在国内外数据集上进行测试,验证了两种标志物是肝细胞癌的重要预后指标。
该研究构建了PathFinder预后标志物智能挖掘平台,可服务于多种癌症、空间多组学、三维病理学等多种模态数据,具有广阔应用前景。该研究展示了深度学习和病理医生相互协助发掘新知识的方式,搭建了连接临床病理和深度学习的桥梁,为克服深度学习由于有限的可解释性而难以进入临床的难题探索了一条新途径。
清华大学精密仪器系博士生梁君浩为本文第一作者。清华大学精密仪器系、清华-IDG/麦戈文脑科学研究院孔令杰、清华长庚医院肖颖、尹洪芳及清华大学自动化系、清华-IDG/麦戈文脑科学研究院戴琼海为该论文共同通讯作者。清华大学精密仪器系博士生张维晟、清华长庚医院杨江辉和吴美龙参与了本研究工作。本研究受到科技创新2030——脑科学与类脑研究重大项目、国家自然科学基金等项目的支持。
|