当前,机器学习模型在区域地下水潜力预测中虽然应用广泛,但受限于调查样本不完备导致的随机不确定性以及模型本身“黑箱”特性带来的可解释性不足等问题,预测精度面临挑战。针对这一痛点,该团队构建了基于装袋的正未标记混合学习模型(BPUL),并以漓江流域为研究对象开展实证研究。研究中,团队系统整合地形、水文、地质、气象和土地等多维因子,以水井、钻孔、岩溶泉和地下河作为训练样本,将逻辑回归(LR)、K近邻(KNN)、随机森林(RF)和轻量梯度增强机(LightGBM)四种基学习器嵌入BPUL算法,并进行了模型验证,构建了岩溶地区的地下水潜力预测模型。结果表明,所有模型均表现出良好性能,其中RF-BPUL和LightGBM-BPUL两种混合集成模型验证分数尤为突出。
此外,借助SHAP值揭示了各种条件因子对岩溶区地下水分布的贡献规律,强调岩性、谷底平整度多分辨率指数(MRVBF)和地球化学元素氧化钙(CaO)对岩溶区地下水富集的影响最为显著。未来,该团队将进一步聚焦于开发该框架更全面的评估指标,挖掘更多地下水条件因素,以提升模型在不同岩溶地区的泛化能力。