当前位置：首页>南京>南京农业大学团队发布WPDSI:仅需单张田间照片,即可精准识别小麦生育期

南京农业大学团队发布WPDSI:仅需单张田间照片,即可精准识别小麦生育期

2026-06-13 20:14:18

论文简介

论文名称：《WPDSI：A deep learning method for wheat phenology detection from single-temporal images》

发表期刊：Plant Phenomics

期刊影响因子：7.1

第一作者：Yan Li

年份：2025年

获取方式：

https://doi.org/10.1016/j.plaphe.2025.100144

摘要

小麦物候的准确监测是保证小麦产量的关键。深度学习的最新进展使得田间小麦物候的自动检测成为可能。特别是深度学习，使用多时相图像序列的模型通过纳入小麦生长过程的动态方面，解决了仅使用空间特征的模型精度低的挑战。针对利用多时间序列图像存在模型参数冗余、推理过程复杂、难以实时部署等问题，提出了一种结合知识提取、知识提取和多层注意力转移的小麦物候学优化方法(WPDSI)。该方法采用了知识提炼的方法。在这个框架中，教师模型从多时相图像序列中提取时空特征，并生成软标签来指导在单时间图像上训练的学生模型。这降低了模型的复杂性和输入数据的要求。多层注意力转移允许学生模型继承教师模型多层的特征表征。这增强了其捕捉关键物候特征的能力，并通过注意机制支持可解释性。该模型在保持较高精度的同时，提高了算法的实时性和计算效率，为田间小麦物候数据的提取提供了一种实用的解决方案

研究区域与数据

1研究区域：南京农业大学白马教学科研基地

田间试验于2022-2023年及2023-2024年两个小麦生长季在南京农业大学白马教学科研基地进行。该基地位于江苏省南京市溧水区，地理坐标为119°09′E，31°37′N，是典型的稻麦轮作区，具备完善的田间试验条件。

2田间试验设计

为增强模型的泛化能力，两个生长季采用了不同的试验设计：

第一年试验（2022-2023年）：

供试品种：南农1632（单一品种）
小区设置：6个小区，每小区面积90 m²（30 m × 3 m）
播种方式：人工撒播

第二年试验（2023-2024年）：

供试品种：镇麦168、农麦88（两个品种）
种植密度：两个水平，分别为240万株/公顷和150万株/公顷
施氮水平：三个水平，分别为90 kg/ha、180 kg/ha、270 kg/ha
小区设置：12个小区，每小区面积36 m²（6 m × 6 m）
播种方式：人工条播

3、图像采集

图像采集设备为海康威视DS-2DE4223IW-D/GLT/XM型RGB相机，主要参数如下：

4数据集构建

第一年数据：构建了多时相图像序列数据集。每个样本包含30张按时间顺序排列的图像，覆盖小麦完整生育周期。经数据增强（亮度调整、翻转、随机旋转等）后，共获得13,648个多时相样本，按6:2:2比例划分为训练集、验证集和测试集。

第二年数据：采集了25,002张单时相图像，专门用于模型泛化能力评估，不参与任何训练过程。

5生育期划分标准

依据小麦生长发育标准定义，研究共划分8个关键生育期：

研究方法

1总体技术框架

WPDSI方法采用教师-学生网络训练范式。教师模型以ResNet50为空间特征提取骨干，结合LSTM模块处理多时相图像序列，用于提取小麦生育进程的时空特征。学生模型采用简化的ResNet50架构，仅输入单张图像。通过知识蒸馏与多层注意力迁移，使学生模型在保持轻量化的同时，逼近教师模型的检测性能。

2 知识蒸馏

知识蒸馏的核心在于将教师模型的“暗知识”迁移至学生模型。具体而言，教师模型对每个输入样本输出一个概率分布（软标签），该分布不仅包含正确类别的高概率，还蕴含了类别间的相似性信息（如拔节期与孕穗期的特征接近性）。

引入温度参数T对softmax函数进行软化：

总损失函数由软标签损失和硬标签损失加权组成：

3 多层注意力迁移

为使学生模型不仅模仿教师模型的输出，还能继承其内部特征表示，研究引入了多层注意力迁移机制。具体步骤如下：

计算教师模型各网络层的注意力图（Attention Map），反映模型在不同深度对图像区域的关注程度；
以L2范数为距离度量，计算学生模型对应层注意力图与教师模型之间的差异；
将该差异作为额外的注意力损失项，加入总损失函数。

最终损失函数定义为：

各层注意力分布特征：

浅层（第1层）：聚焦于叶片边缘、纹理等低级特征，对早期生育期（出苗、分蘖）判别起关键作用；
中层（第3-4层）：逐步聚焦于麦穗形态等高级语义特征，对抽穗后各期判别至关重要；
深层（第5层）：关注整株小麦的全局特征，用于综合决策。

值得注意的是，第2层注意力主要集中于土壤背景，该层信息的迁移反而导致模型精度下降（从0.927降至0.899），提示并非所有网络层的注意力都具有正向迁移价值。

4 评价指标

研究采用以下5项指标对模型性能进行综合评价：

研究结果

1 模型性能对比

将WPDSI与ResNet50、MobileNetV3、EfficientNetV2、RepVGG、SCNet、STViT、PhenoNet等7种主流图像分类模型进行对比，所有模型均采用相同的数据划分与训练策略。

结果分析：

WPDSI与教师模型的精度差距仅为0.8%，但输入数据量仅为后者的1/30；
相比专门针对小麦生育期设计的PhenoNet模型，WPDSI精度提升2.5%；
相比基础ResNet50模型，WPDSI精度提升4.5%；
在所有对比模型中，WPDSI的MAE最低（0.075），表明预测误差最小。

2 混淆矩阵分析

从混淆矩阵（Fig. 3）可以看出，所有模型在拔节期（3）、孕穗期（4）、抽穗期（5）、开花期（6）四个连续阶段均存在一定程度的误判。这一现象可归因于：该时段小麦形态变化呈渐进性（茎秆逐渐伸长、叶片角度缓慢变化、麦穗尚未完全抽出），缺乏明显的视觉突变特征。

相比之下，WPDSI的混淆矩阵对角线分布最为显著，尤其在上述四个易混淆阶段的误判率明显低于其他对比模型。这表明知识蒸馏与注意力迁移的联合优化策略有效增强了模型对细微形态差异的捕捉能力。

3 泛化能力评估

为检验模型在实际应用场景中的泛化能力，研究使用第一年数据训练完成的模型，直接对第二年采集的25,002张单时相图像（不同品种、不同种植密度、不同施氮水平、不同气象条件）进行预测，未作任何微调。

泛化能力测试结果：

结果表明，模型在完全未见过的数据集上仍保持了91.7%的总体精度，各指标下降幅度均在可接受范围内，说明WPDSI具备良好的跨年份、跨品种、跨栽培管理的泛化能力。

4 注意力可视化分析

研究对各网络层的注意力图进行了可视化分析，以揭示模型的特征提取机制（Fig. 6）。主要发现如下：

这一分层特征提取模式符合卷积神经网络的一般规律：浅层网络提取低级几何特征，深层网络提取高级语义特征。值得注意的是，第2层注意力主要集中于土壤背景，该层信息的迁移并未带来性能提升，提示在注意力迁移策略中应选择性选取有效网络层。

5 消融实验

为验证各模块的独立贡献，研究开展了消融实验：

结果表明：

仅使用知识蒸馏时，模型精度为0.882；
仅使用注意力迁移时，模型精度为0.910；
两者联合使用时，模型精度达到0.927，显著优于单一模块配置。

上述结果验证了知识蒸馏与注意力迁移在功能上的互补性：前者负责传递教师模型的输出分布知识，后者负责传递中间层的特征表示知识，二者协同作用实现了最佳的检测性能。

结语

本研究提出的WPDSI方法，通过知识蒸馏与多层注意力迁移的协同优化，成功实现了基于单张田间图像的小麦生育期高精度检测，总体精度达92.7%，与需输入30张时序图像的复杂教师模型性能基本持平，同时显著降低了数据获取与计算成本。该方法在跨年份、跨品种、跨栽培管理的独立数据集上展现出良好的泛化能力（91.7%），且注意力可视化分析揭示了不同网络层对生育期判别的差异化贡献，为模型轻量化部署提供了理论依据。未来研究将聚焦于跨生态区适应性验证、病虫害等复杂田间环境下的鲁棒性提升，以及向水稻、玉米等主要作物的方法迁移，以推动智慧农业监测技术的实用化发展。

—END—

来源 | 成都理工大学

编写与排版 | 扶羽佳

责任编辑 | 马雨阳

公众号 | 农业与遥感技术应用前沿