污水处理厂是保护受纳水体生态安全的关键屏障。然而,关于其进水综合毒性的全国性特征图谱,以及城市尺度上的社会经济发展水平如何通过影响污水的分子组成来调控毒性,目前尚缺乏系统认知。本研究基于中国30个省级行政区内100座污水处理厂的进水样本,结合斑马鱼胚胎毒性测试、傅里叶变换离子回旋共振质谱(FT-ICR MS)及机器学习方法,系统揭示了污水综合毒性的空间异质性、关键的致毒分子特征,并首次建立了“社会经济-分子特征-综合毒性”的调控路径。研究发现,GDP较高、人口密度较大及工业活动更密集的城市,其进水毒性显著更强。这种关联的分子机制在于,社会经济因素驱动了含CHO类化合物(特别是非饱和烃类、稠合烃类和氨基糖类化合物)在污水中的富集,这些分子被证实是毒性的主要贡献者。该研究为实施基于分子证据的精准毒性控制策略提供了科学依据。
1 科学问题
城市尺度的社会经济状况是否及如何通过特定的有机分子介导,进而影响污水处理厂进水(原水)的综合毒性?
2 研究方案
为回答上述问题,研究团队设计了一套多维度、跨尺度的研究方案:
样本采集:于2020年9月至2021年4月,采集了中国30个省份100座代表性市政污水处理厂的进水样品,覆盖了广泛的地理分布、处理规模(0.03万至280万吨/日)和服务人口。
毒性评估:采用国际标准化组织(ISO)标准的斑马鱼胚胎急性毒性试验,测定进水的半数致死浓度(LC50),用以表征综合毒性。
分子表征:利用15T FT-ICR MS对固相萃取后的溶解性有机物进行分子级表征,获取数万个分子式,并将其分为CHO、CHON、CHOP、CHOS四大类。
建模与分析:
使用十种机器学习算法,分别基于四类分子特征构建LC50预测模型,并通过SHAP分析识别关键致毒分子。
运用广义可加模型(GAM)评估城市级社会经济指标(源自2022年统计年鉴)与进水毒性的关联。
构建偏最小二乘路径模型(PLS-PM),检验“社会经济因素→分子特征→综合毒性”的介导路径。
3 结论
毒性驱动的分子指纹:基于CHO类化合物构建的模型(CatBoost Regressor)对进水毒性(LC50)的预测性能最佳,测试集R²达到0.84,显著优于含有N、P、S的杂原子化合物类别。SHAP分析进一步揭示,非饱和烃类、稠合烃类和氨基糖类化合物是驱动毒性的三大核心分子特征。这表明,CHO类化合物因其结构多样性和环境持久性,是预测和控制污水综合毒性的关键靶点。
社会经济因素的显著影响:GAM模型显示,城市总人口、人口密度、GDP、人均GDP、第二产业总产值以及医疗卫生机构数等六项指标与进水毒性(LC50)呈显著负相关。这意味着在经济发达、人口密集、工业活动强的城市,污水毒性显著升高,且这种关系在数据范围内多呈近线性趋势。
分子介导路径的实证:PLS-PM模型证实了预设的调控路径。社会经济指标对污水分子组成具有强且显著的正向影响,而特定毒性分子(上述三类)的丰度变化进而显著影响了综合毒性。关联分析显示,不同社会经济因子关联着不同的毒性分子类型:如GDP与医疗卫生机构数主要与非饱和烃类相关;第二产业总产值与稠合芳烃类相关;人均GDP与总人口则与蛋白/氨基糖类相关。
不足与展望
方法局限性:固相萃取可能遗漏部分挥发性或弱保留组分;斑马鱼胚胎急性毒性试验主要反映急性致死效应,对慢性、亚致死效应的解析有限。
数据特征:基于单次瞬时采样,无法捕捉季节和日内波动;FT-ICR MS提供的相对丰度信息难以对特定化合物进行定量归因。
因果推断:社会经济指标间存在共线性,尽管使用了PLS-PM,但观测性研究设计限制了因果关系的直接推断。
未来方向:未来研究需结合互补萃取技术、多物种/多终点生物测试、靶向定量分析以及纵向时间序列设计,以更全面地解析毒性机制和动态变化,为精准源头控制提供更坚实的科学基础。