点击蓝字 关注我们

论文简介
论文名称:《WPDSI:A deep learning method for wheat phenology detection from single-temporal images》
发表期刊:Plant Phenomics
期刊影响因子:7.1
第一作者:Yan Li
年份:2025年
获取方式:
https://doi.org/10.1016/j.plaphe.2025.100144
01 摘要
小麦物候的准确监测是保证小麦产量的关键。深度学习的最新进展使得田间小麦物候的自动检测成为可能。特别是深度学习,使用多时相图像序列的模型通过纳入小麦生长过程的动态方面,解决了仅使用空间特征的模型精度低的挑战。针对利用多时间序列图像存在模型参数冗余、推理过程复杂、难以实时部署等问题,提出了一种结合知识提取、知识提取和多层注意力转移的小麦物候学优化方法(WPDSI)。该方法采用了知识提炼的方法。在这个框架中,教师模型从多时相图像序列中提取时空特征,并生成软标签来指导在单时间图像上训练的学生模型。这降低了模型的复杂性和输入数据的要求。多层注意力转移允许学生模型继承教师模型多层的特征表征。这增强了其捕捉关键物候特征的能力,并通过注意机制支持可解释性。该模型在保持较高精度的同时,提高了算法的实时性和计算效率,为田间小麦物候数据的提取提供了一种实用的解决方案。
02 研究区域与数据
1、研究区域:南京农业大学白马教学科研基地
田间试验于2022-2023年及2023-2024年两个小麦生长季在南京农业大学白马教学科研基地进行。该基地位于江苏省南京市溧水区,地理坐标为119°09′E,31°37′N,是典型的稻麦轮作区,具备完善的田间试验条件。
2、田间试验设计
为增强模型的泛化能力,两个生长季采用了不同的试验设计:
第一年试验(2022-2023年):
● 供试品种:南农1632(单一品种)
● 小区设置:6个小区,每小区面积90 m²(30 m × 3 m)
● 播种方式:人工撒播
第二年试验(2023-2024年):
● 供试品种:镇麦168、农麦88(两个品种)
● 种植密度:两个水平,分别为240万株/公顷和150万株/公顷
● 施氮水平:三个水平,分别为90 kg/ha、180 kg/ha、270 kg/ha
● 小区设置:12个小区,每小区面积36 m²(6 m × 6 m)
● 播种方式:人工条播
3、图像采集
图像采集设备为海康威视DS-2DE4223IW-D/GLT/XM型RGB相机,主要参数如下:

4、数据集构建
第一年数据:构建了多时相图像序列数据集。每个样本包含30张按时间顺序排列的图像,覆盖小麦完整生育周期。经数据增强(亮度调整、翻转、随机旋转等)后,共获得13,648个多时相样本,按6:2:2比例划分为训练集、验证集和测试集。
第二年数据:采集了25,002张单时相图像,专门用于模型泛化能力评估,不参与任何训练过程。

5、生育期划分标准
依据小麦生长发育标准定义,研究共划分8个关键生育期:

03 研究方法
1、总体技术框架
WPDSI方法采用教师-学生网络训练范式。教师模型以ResNet50为空间特征提取骨干,结合LSTM模块处理多时相图像序列,用于提取小麦生育进程的时空特征。学生模型采用简化的ResNet50架构,仅输入单张图像。通过知识蒸馏与多层注意力迁移,使学生模型在保持轻量化的同时,逼近教师模型的检测性能。

2、知识蒸馏
知识蒸馏的核心在于将教师模型的“暗知识”迁移至学生模型。具体而言,教师模型对每个输入样本输出一个概率分布(软标签),该分布不仅包含正确类别的高概率,还蕴含了类别间的相似性信息(如拔节期与孕穗期的特征接近性)。
引入温度参数T对softmax函数进行软化:

总损失函数由软标签损失和硬标签损失加权组成:

3、多层注意力迁移
为使学生模型不仅模仿教师模型的输出,还能继承其内部特征表示,研究引入了多层注意力迁移机制。具体步骤如下:
(1)计算教师模型各网络层的注意力图(Attention Map),反映模型在不同深度对图像区域的关注程度;
(2)以L2范数为距离度量,计算学生模型对应层注意力图与教师模型之间的差异;
(3)将该差异作为额外的注意力损失项,加入总损失函数。
最终损失函数定义为:

各层注意力分布特征:
● 浅层(第1层):聚焦于叶片边缘、纹理等低级特征,对早期生育期(出苗、分蘖)判别起关键作用;
● 中层(第3-4层):逐步聚焦于麦穗形态等高级语义特征,对抽穗后各期判别至关重要;
● 深层(第5层):关注整株小麦的全局特征,用于综合决策。
值得注意的是,第2层注意力主要集中于土壤背景,该层信息的迁移反而导致模型精度下降(从0.927降至0.899),提示并非所有网络层的注意力都具有正向迁移价值。
4、评价指标
研究采用以下5项指标对模型性能进行综合评价:

04 研究结果
1、模型性能对比
将WPDSI与ResNet50、MobileNetV3、EfficientNetV2、RepVGG、SCNet、STViT、PhenoNet等7种主流图像分类模型进行对比,所有模型均采用相同的数据划分与训练策略。

结果分析:
● WPDSI与教师模型的精度差距仅为0.8%,但输入数据量仅为后者的1/30;
● 相比专门针对小麦生育期设计的PhenoNet模型,WPDSI精度提升2.5%;
● 相比基础ResNet50模型,WPDSI精度提升4.5%;
● 在所有对比模型中,WPDSI的MAE最低(0.075),表明预测误差最小。
2、混淆矩阵分析

从混淆矩阵可以看出,所有模型在拔节期(3)、孕穗期(4)、抽穗期(5)、开花期(6)四个连续阶段均存在一定程度的误判。这一现象可归因于:该时段小麦形态变化呈渐进性(茎秆逐渐伸长、叶片角度缓慢变化、麦穗尚未完全抽出),缺乏明显的视觉突变特征。
相比之下,WPDSI的混淆矩阵对角线分布最为显著,尤其在上述四个易混淆阶段的误判率明显低于其他对比模型。这表明知识蒸馏与注意力迁移的联合优化策略有效增强了模型对细微形态差异的捕捉能力。
3、泛化能力评估
为检验模型在实际应用场景中的泛化能力,研究使用第一年数据训练完成的模型,直接对第二年采集的25,002张单时相图像(不同品种、不同种植密度、不同施氮水平、不同气象条件)进行预测,未作任何微调。
泛化能力测试结果:

结果表明,模型在完全未见过的数据集上仍保持了91.7%的总体精度,各指标下降幅度均在可接受范围内,说明WPDSI具备良好的跨年份、跨品种、跨栽培管理的泛化能力。
4、注意力可视化分析
研究对各网络层的注意力图进行了可视化分析,以揭示模型的特征提取机制。主要发现如下:

这一分层特征提取模式符合卷积神经网络的一般规律:浅层网络提取低级几何特征,深层网络提取高级语义特征。值得注意的是,第2层注意力主要集中于土壤背景,该层信息的迁移并未带来性能提升,提示在注意力迁移策略中应选择性选取有效网络层。
5、消融实验
为验证各模块的独立贡献,研究开展了消融实验

结果表明:
● 仅使用知识蒸馏时,模型精度为0.882;
● 仅使用注意力迁移时,模型精度为0.910;
● 两者联合使用时,模型精度达到0.927,显著优于单一模块配置。
上述结果验证了知识蒸馏与注意力迁移在功能上的互补性:前者负责传递教师模型的输出分布知识,后者负责传递中间层的特征表示知识,二者协同作用实现了最佳的检测性能。
05 结语
本研究提出的WPDSI方法,通过知识蒸馏与多层注意力迁移的协同优化,成功实现了基于单张田间图像的小麦生育期高精度检测,总体精度达92.7%,与需输入30张时序图像的复杂教师模型性能基本持平,同时显著降低了数据获取与计算成本。该方法在跨年份、跨品种、跨栽培管理的独立数据集上展现出良好的泛化能力(91.7%),且注意力可视化分析揭示了不同网络层对生育期判别的差异化贡献,为模型轻量化部署提供了理论依据。未来研究将聚焦于跨生态区适应性验证、病虫害等复杂田间环境下的鲁棒性提升,以及向水稻、玉米等主要作物的方法迁移,以推动智慧农业监测技术的实用化发展。
免责声明:文章所引图文来自农业与遥感技术应用前沿微信公众号,仅供学习参考,若涉及侵犯版权请告知,我们将及时删除。

精彩推荐




研究院简介

南京神农智慧农业技术与装备研究院是由南京溧水区人民政府、南京农业大学、国家信息农业工程技术中心等共同组建并获批的南京市新型研发机构,其运营实体为神农智慧农业研究院南京有限公司是专注于智慧农业产业技术创新、产品创制、系统集成及生产销售的高新技术企业。研究院以智慧农业领域技术研发与产业化为核心,重点围绕农业大数据、农情遥感监测服务、农业传感器与物联网、农业智能装备、农业智能决策系统等方向开展研发及产业化工作。
在技术成果积累方面,研究院现已申请国家专利 26 件(含授权发明专利 11 件、实用新型专利 2 件、PCT 美国专利 1 件),登记软件著作权 14 件,参与制定地方标准 1 项,持有注册商标 13 件,并拥有软硬件产品 30 余件;项目实践与落地应用上,研究院主持或参与国家级课题 1 项、省部级课题 4 项、市级课题 3 项。研究院已在江苏、海南、河南等落地多座智慧农业园区产业化项目,取得显著社会与经济效益。
此外,研究院积极构建行业生态与提升综合实力,牵头成立江苏省智慧农业产业技术创新战略联盟,作为骨干成员参与建设南京市智慧农业创新联合体。工作成果荣获 2019-2021 年度全国农牧渔业丰收奖一等奖、江苏省数字农业建设支撑服务单位等荣誉,先后获批江苏省研究生工作站、南京市科普教育示范基地,通过 3A 认证与 QEO 三体系认证,企业管理能力与行业影响力持续攀升。

官方微信公众号