近日,国家健康医疗大数据研究院薛付忠教授团队在Nature子刊--数字医疗顶级期刊npj Digital Medicine杂志上在线发表了题为“Interpretable machine learning model for digital lung cancer prescreening in Chinese populations with missing data”的肺癌数字化筛查文章。国家健康医疗大数据研究院/山东大学公共卫生学院博士研究生仉率杰为本论文的第一作者,薛付忠教授和博士后于媛媛为共同通讯作者,山东大学为第一作者单位和通讯作者单位。
肺癌作为全球范围内最常见的癌症之一,其早期筛查和诊断对于提高患者生存率至关重要。然而,传统的肺癌筛查方法,如低剂量CT扫描,不仅成本高昂,而且还存在辐射风险,限制了其广泛应用。此外,电子健康记录(EHR)中常常存在数据缺失问题,这进一步增加了肺癌筛查的难度。因此,开发一种能够在数据缺失情况下有效预测肺癌风险的模型,对于提高肺癌筛查的普及性具有重要意义。为了解决这一问题,本研究使用来自中国山东省涵盖500万人的Cheeloo LEAD数据库,基于贝叶斯网络开发了BOUND模型。为了进一步提高肺癌筛查的便利性,研究团队还创建了一个风险评分卡,该评分卡可将肺癌检出率提高至原来的6.8倍。BOUND模型的开发不仅提供了一种非放射性、成本效益高的肺癌筛查方法,还特别适用于数据缺失情况下的风险预测。
npj Digital Medicine杂志在全球175个卫生保健科学与服务领域的期刊中排名第2,且在全球138个计算科学医学信息领域的期刊中排名第2。2024年的5年影响因子为15.2,中科院杂志分区属于医学一区,Top期刊,Clarivate JCR分区1区。