Copyright
©The Author(s) 2025.
世界华人消化杂志. 2025-05-28; 33(5): 361-372
在线出版 2025-05-28. doi: 10.11569/wcjd.v33.i5.361
在线出版 2025-05-28. doi: 10.11569/wcjd.v33.i5.361
表1 患者基线特征
变量 | 训练集(n = 150) | 验证集(n = 66) | ||||||
良性(n = 78) | 恶性(n = 72) | 统计量 | P值 | 良性(n = 34) | 恶性(n = 32) | 统计量 | P值 | |
年龄[岁, M(Q1, Q3)] | 60.00(46.00, 64.00) | 63.50(55.50, 67.00) | Z = -3.17 | 0.002a | 66.50(58.00, 68.00) | 68.00(58.00, 70.00) | Z = -1.43 | 0.152 |
病变大小[厘米, M(Q1, Q3)] | 2.40(1.33, 3.70) | 3.85(3.10, 4.65) | Z = -5.10 | <0.001a | 2.40(1.21, 3.24) | 3.60(3.08, 4.82) | Z = -3.87 | <0.001a |
CA199[U/mL, M(Q1, Q3)] | 21.15(7.36, 157.18) | 467.67(67.67, 1200.00) | Z = -5.86 | <0.001a | 8.90(3.78, 21.15) | 855.15(185.05, 1200.00) | Z = -6.07 | <0.001a |
直接胆红素[μmol/L, M(Q1, Q3)] | 2.90(2.90, 4.70) | 4.50(2.95, 12.20) | Z = -2.56 | 0.011a | 2.95(2.62, 4.52) | 4.30(2.68, 7.25) | Z = -1.70 | 0.090 |
癌胚抗原[ng/mL, M(Q1, Q3)] | 2.02(1.89, 3.10) | 4.69(2.93, 9.27) | Z = -5.84 | <0.001a | 1.94(1.77, 2.26) | 5.85(3.82, 6.55) | Z = -4.92 | <0.001a |
血糖[mmol/L, M(Q1, Q3)] | 4.95(4.95, 6.00) | 5.80(5.15, 6.62) | Z = -3.11 | 0.002a | 6.30(5.50, 6.30) | 5.40(5.38, 6.35) | Z = -1.39 | 0.163 |
钙[mmol/L, M(Q1, Q3)] | 2.25(2.23, 2.26) | 2.27(2.20, 2.33) | Z = -0.99 | 0.321 | 2.35(2.21, 2.35) | 2.31(2.26, 2.42) | Z = -0.56 | 0.575 |
白细胞[×109/L, M(Q1, Q3)] | 5.48(5.15, 5.58) | 6.43(4.39, 7.58) | Z = -2.26 | 0.024a | 6.07(5.11, 6.10) | 6.58(5.75, 7.70) | Z = -2.41 | 0.016a |
红细胞[×109/L, M(Q1, Q3)] | 4.27(4.11, 4.34) | 4.15(3.71, 4.57) | Z = -0.66 | 0.508 | 4.08(3.84, 4.08) | 4.22(3.88, 4.70) | Z = -1.89 | 0.059 |
血红蛋白[g/L, M(Q1, Q3)] | 127.00(122.00, 131.00) | 124.50(112.00, 139.00) | Z = -0.51 | 0.607 | 125.00(119.75, 125.00) | 125.50(117.25, 138.00) | Z = -0.98 | 0.327 |
血小板[×109/L, M(Q1, Q3)] | 197.00(186.75, 210.00) | 200.00(147.75, 261.50) | Z = -0.75 | 0.456 | 239.00(227.25, 243.00) | 229.50(187.50, 279.00) | Z =-0.77 | 0.440 |
总蛋白[g/L, M(Q1, Q3)] | 68.00(64.00, 68.00) | 68.00(62.00, 72.00) | Z = -0.86 | 0.389 | 64.00(63.25, 68.75) | 68.50(64.75, 74.00) | Z = -1.84 | 0.066 |
白蛋白[g/L, M(Q1, Q3)] | 40.00(36.00, 40.00) | 38.50(36.00, 42.00) | Z = -0.68 | 0.497 | 38.00(35.00, 38.75) | 38.00(36.00, 41.00) | Z = -1.23 | 0.217 |
球蛋白[g/L, M(Q1, Q3)] | 31.00(27.00, 31.00) | 28.50(25.00, 32.00) | Z = -0.78 | 0.436 | 28.00(27.00, 31.75) | 29.00(26.00, 32.25) | Z = -0.84 | 0.402 |
谷丙转氨酶[U/L, M(Q1, Q3)] | 15.00(15.00, 33.25) | 23.00(13.75, 61.25) | Z = -1.82 | 0.068 | 14.00(12.25, 17.75) | 16.50(11.75, 44.25) | Z = -1.40 | 0.162 |
谷草转氨酶[U/L, M(Q1, Q3)] | 20.00(17.00, 20.75) | 19.00(15.00, 64.50) | Z = -0.58 | 0.560 | 17.00(16.25, 19.75) | 21.50(15.75, 44.75) | Z = -1.53 | 0.127 |
碱性磷酸酶[U/L, M(Q1, Q3)] | 74.00(74.00, 88.75) | 107.00(73.00, 195.00) | Z = -3.64 | <0.001a | 76.00(72.25, 93.50) | 97.00(77.00, 246.75) | Z = -2.56 | 0.011a |
糖化血红蛋白[例(%)] | χ2 = 0.07 | 0.791 | χ2 = 0.30 | 0.585 | ||||
正常 | 61(78.21) | 55(76.39) | 19(55.88) | 20(62.50) | ||||
升高 | 17(21.79) | 17(23.61) | 15(44.12) | 12(37.50) | ||||
性别[例(%)] | χ2 = 1.36 | 0.244 | χ2 = 0.97 | 0.325 | ||||
男 | 37(47.44) | 41(56.94) | 15(44.12) | 18(56.25) | ||||
女 | 41(52.56) | 31(43.06) | 19(55.88) | 14(43.75) | ||||
病变部位[例(%)] | χ2 = 0.20 | 0.903 | - | 0.101 | ||||
胰腺头颈部 | 37(47.44) | 34(47.22) | 16(47.06) | 22(68.75) | ||||
胰腺体尾部 | 34(43.59) | 30(41.67) | 15(44.12) | 10(31.25) | ||||
全部胰腺 | 7(8.97) | 8(11.11) | 3(8.82) | 0(0.00) |
表2 5种机器学习模型在训练集中的表现
机器学习模型 | AUC | 准确性 | 敏感性 | 特异性 | F1分数 |
GNB | 0.8250 | 0.8333 | 0.7333 | 0.9583 | 0.8302 |
LR | 0.8819 | 0.7963 | 0.7333 | 0.8750 | 0.8000 |
RF | 0.8500 | 0.8148 | 0.8000 | 0.8750 | 0.8421 |
XGBoost | 0.8521 | 0.8333 | 0.7333 | 0.8750 | 0.8000 |
SVM | 0.8369 | 0.7931 | 0.6667 | 0.9167 | 0.7692 |
表3 5种机器学习模型在验证集中的表现
机器学习模型 | AUC | 准确性 | 敏感性 | 特异性 | F1分数 |
GNB | 0.7229 | 0.6212 | 0.7794 | 0.4531 | 0.6795 |
LR | 0.8196 | 0.7727 | 0.6765 | 0.8750 | 0.7541 |
RF | 0.8095 | 0.7576 | 0.6471 | 0.8750 | 0.7333 |
XGBoost | 0.8761 | 0.7955 | 0.7206 | 0.8750 | 0.7840 |
SVM | 0.7096 | 0.6288 | 0.6176 | 0.6406 | 0.6316 |
表4 用于选择临床特征的单因素和多因素逻辑回归
变量variables | 单因素逻辑回归 | 多因素逻辑回归 | ||||||||
β | S.E | Z | P值 | OR(95%CI) | β | S.E | Z | P值 | OR(95%CI) | |
年龄[岁, M(Q1, Q3)] | 0.04 | 0.01 | 3.09 | 0.002a | 1.05(1.02-1.08) | 0.05 | 0.02 | 2.64 | 0.008a | 1.05(1.01-1.09) |
病变大小[厘米, M(Q1, Q3)] | 0.28 | 0.10 | 2.85 | 0.004a | 1.33(1.09-1.61) | 0.24 | 0.09 | 2.56 | 0.011a | 1.27(1.06-1.54) |
CA199 [U/mL, M(Q1, Q3)] | 0.01 | 0.00 | 5.12 | <0.001a | 1.01(1.01-1.01) | 0.01 | 0.00 | 4.63 | <0.001a | 1.01(1.01-1.01) |
直接胆红素[μmol/L, M(Q1, Q3)] | 0.01 | 0.00 | 1.58 | 0.114 | 1.01(1.00-1.01) | |||||
癌胚抗原[ng/mL, M(Q1, Q3)] | 0.01 | 0.01 | 1.39 | 0.163 | 1.01(1.00-1.02) | |||||
血糖[mmol/L, M(Q1, Q3)] | 0.04 | 0.05 | 0.85 | 0.397 | 1.04(0.95-1.15) | |||||
钙[mmol/L, M(Q1, Q3)] | -0.16 | 0.25 | -0.64 | 0.520 | 0.85(0.53-1.39) | |||||
白细胞[×109/L, M(Q1, Q3)] | 0.15 | 0.09 | 1.67 | 0.095 | 1.16(0.98-1.37) | |||||
红细胞[×109/L, M(Q1, Q3)] | -0.39 | 0.32 | -1.20 | 0.230 | 0.68(0.36-1.28) | |||||
血红蛋白[g/L, M(Q1, Q3)] | -0.01 | 0.01 | -0.65 | 0.515 | 0.99(0.97-1.01) | |||||
血小板[×109/L, M(Q1, Q3)] | 0.00 | 0.00 | 1.70 | 0.088 | 1.00(1.00-1.01) | |||||
总蛋白[g/L, M(Q1, Q3)] | 0.02 | 0.03 | 0.82 | 0.411 | 1.02(0.97-1.08) | |||||
白蛋白[g/L, M(Q1, Q3)] | 0.01 | 0.04 | 0.16 | 0.875 | 1.01(0.94-1.08) | |||||
球蛋白[g/L, M(Q1, Q3)] | -0.03 | 0.04 | -0.79 | 0.430 | 0.97(0.91-1.04) | |||||
谷丙转氨酶[U/L, M(Q1, Q3)] | 0.01 | 0.00 | 2.26 | 0.024a | 1.01(1.01-1.01) | 0.00 | 0.01 | 0.87 | 0.385 | 1.00(0.99-1.01) |
谷草转氨酶[U/L, M(Q1, Q3)] | 0.01 | 0.00 | 2.12 | 0.034a | 1.01(1.01-1.01) | -0.00 | 0.01 | -0.49 | 0.623 | 1.00(0.98-1.01) |
碱性磷酸酶[U/L, M(Q1, Q3)] | 0.01 | 0.00 | 2.48 | 0.013a | 1.01(1.01-1.01) | 0.00 | 0.00 | 1.35 | 0.176 | 1.00(1.00-1.01) |
糖化血红蛋白[例(%)] | ||||||||||
正常 | 1.00(reference) | |||||||||
升高 | 0.10 | 0.39 | 0.27 | 0.791 | 1.11(0.52-2.38) | |||||
性别[例(%)] | ||||||||||
男 | 1.00(reference) | |||||||||
女 | -0.38 | 0.33 | -1.16 | 0.245 | 0.68(0.36-1.30) | |||||
病变部位[例(%)] | ||||||||||
胰腺头颈部 | 1.00(reference) | |||||||||
胰腺体尾部 | -0.04 | 0.35 | -0.12 | 0.906 | 0.96(0.49-1.89) | |||||
全部胰腺 | 0.22 | 0.57 | 0.38 | 0.702 | 1.24(0.41-3.80) |
表5 不同预测模型的性能比较
模型 | 训练集 | 验证集 | ||||
AUC | 敏感性 | 特异性 | AUC | 敏感性 | 特异性 | |
影像组学模型 | 0.8521 | 0.7333 | 0.8750 | 0.8761 | 0.7206 | 0.8750 |
临床模型 | 0.9286 | 0.6667 | 0.9167 | 0.9200 | 0.7353 | 0.9062 |
多模态联合模型 | 0.9458 | 0.8667 | 1.000 | 0.9357 | 0.7941 | 0.9357 |
引文著录: 蔡晓晗, 范晓飞, 李姝, 方维丽, 王邦茂, 王玉峰, 冯月, 穆金宝, 刘文天. 基于影像组学和临床特征构建用于区分胰腺良恶性病变的多模态可解释机器学习模型. 世界华人消化杂志 2025; 33(5): 361-372