因此,本研究旨在建立机器学习模型,以预测微污染物与反应性氮自由基(RNS)的反应速率常数(k),并阐明其反应机理。我们收集了285个样本,用于测定各种有机化合物与两种反应性氮自由基(NO₂•和NH₂•)的反应速率常数,并采用MF和MACCS两种方法对数据集中的化合物分子信息进行编码。我们对比了10种常用机器学习算法在默认超参数下的预测性能,并应用贝叶斯优化法选出了最优的机器学习框架。随后,我们通过实验验证了所选模型的预测精度,并利用该模型预测了413种微污染物(数据集中未包含的)与RNS的反应速率常数。为了便于水处理领域的工程师和从业人员使用,我们开发了一个网页界面,使该模型能够开放访问。

Fig. 1. Predictive performances of 8 optimized frameworks based on (a) Morgan Fingerprints, (b) Molecular Access System fingerprints, and (c) the performance of the optimal model (MACCS-XGBoost).
Fig. 2. (a) The kinetics of degradation of DPH, CIP and SAM under UV222 in the presence and absence of nitrate (conditions: [SAM] = [CIP] = [DPH] = 5 µM, [Nitrate] = 5 mg N L–1, [Phosphate buffer] = 5 mM, and pH = 7.0), (b) comparison of kpre and kexp of DPH, CIP and SAM, and (c) contributions of photolysis, HO• and NO2• in degradation.
Fig. 3. (a) Mean absolute SHAP values and (b) plot illustrating the influence of the top 9 MACCS features exerting the greatest statistical influence on the predictions of the MACCS-XGBoost model.
Fig. 4. Prediction of bimolecular rate constants of 413 micropollutants with NO2• by the MACCS-XGBoost model.活性氮物种在许多天然和人工水体中都会形成,但它们在微污染物降解中的作用却往往被忽视。活性氮物种与微污染物之间的双分子反应速率常数是评估活性氮物种降解微污染物能力的关键参数。为克服实验法测定k值的局限性,我们开发了基于机器学习的数学方法,利用NIST/文献数据对模型进行训练,并通过贝叶斯优化对模型进行优化。针对三个未纳入数据集的微污染物与NO₂•的反应,通过与实验结果对比验证了优化后的模型对k值的预测能力。该经验证的模型进一步被用于预测413种微污染物的k值,例如,微污染物与NO₂•反应的预测k值范围为7.76 × 10⁴–5.26 × 10⁸ M⁻¹ s⁻¹。这些数据在文献中从未被报道过。该模型还为微污染物与RNS反应的结构依赖性提供了基础性见解。SHAP分析识别出了文献中报道的富电子基团(C=C、C≡C和芳香环)以及提供HAT位点的结构(QH和CH3ACH3)。分析还揭示,这些贡献仍受数据集特有的局限性和相对效应的影响。为进一步明确该模型的适用性,需承认以下局限性:当前模型的适用性受限于训练数据集所涵盖的结构范围及环境条件;真实水生系统比本研究采用的pH和温度条件更为复杂,且多种共存自由基物种之间的相互作用可能进一步影响AOPs中微污染物的反应性。因此,未来研究应致力于扩展结构覆盖范围和环境特征集,并开发能够捕捉多自由基及基质特异性反应行为的建模框架。最后,我们开发了一个基于网络的界面,以便公众访问并交互式使用本模型进行微污染物反应性预测。
Xinjie Song, Jing Zhao, Mingkai Jia, Ran Yin, Hongqiang Ren, Elucidating the role of reactive nitrogen species in micropollutant degradation using machine learning, Water Research, 2026, https://doi.org/10.1016/j.watres.2026.125345
声明:本公众号仅分享前沿学术成果,无商业用途。如涉及侵权,请立刻联系公众号后台或发送邮件,我们将及时修改或删除!
邮箱:Environ2022@163.com