• 首页
  • 期刊简介
  • 编委会
  • 投稿指南
  • 收录情况
  • 杂志订阅
  • 联系我们
引用本文:【点击复制】
【打印本页】   【下载PDF全文】   【查看/发表评论】  【下载PDF阅读器】  
←前一篇|后一篇→ 过刊浏览
分享到: 微信 更多
基于轻量化YOLO的水下图像目标检测
徐翔渝, 肖学中
南京邮电大学计算机学院、软件学院、网络空间安全学院
摘 要: 针对水下图像普遍存在的颜色失真、对比度降低、小目标特征弱以及遮挡严重等问题,同时考虑AUV、ROV等水下平台算力受限、功耗受限的实际应用需求,本文提出一种基于YOLOv8的轻量化水下图像目标检测算法。首先,在特征提取阶段,借鉴GhostNet的特征冗余抑制思想与RepVGG的结构重参数化技术,设计轻量化重参数特征提取模块(LRP-FEM),通过以少量“固有特征图”配合线性变换生成的“幽灵特征图”完成表征重构,在显著压缩参数量和计算量的同时保持主干网络的语义表达能力和梯度流通效率。其次,在特征融合阶段,引入具备无损下采样特性的SPDConv与基于稀疏注意力机制的PyramidSparseTransformer,构建多尺度细节增强融合结构(MSDE-FN),利用空间到通道重排与跨尺度稀疏注意力实现小目标细节的保真传递与条件重加权,提升退化背景下多尺度特征的判别性,而无需额外增加检测层。最后,在检测头阶段,结合遮挡场景下的特征残缺特点,对MultiSEAM进行轻量化改造,得到SEAM模块并嵌入解耦检测头,通过深度可分离卷积与通道注意力强化未遮挡区域响应,抑制泥沙、海草等遮挡与背景干扰,从而提升目标定位与分类的鲁棒性。在URPC2019与URPC2020数据集上的实验结果表明,相较于YOLOv8n及多种主流轻量化检测模型,本文方法在mAP@0.5和mAP@0.5:0.95等指标上均取得了竞争性甚至更优的检测性能;在此基础上,模型参数量降至约2.5M、计算量控制在6.5GFLOPs左右,推理帧率保持在数百FPS级别,实现了检测精度、模型轻量化与实时性的综合平衡,验证了所提框架在复杂水下场景中的有效性与工程应用潜力。
关键词: 水下目标检测  轻量化  YOLOv8
中图分类号:     文献标识码: 
Underwater image object detection based on lightweight YOLO
xuxiangyu, xiaoxuezhong
School of Computer Science, Nanjing University of Posts and Telecommunications, Nanjing
Abstract: 针对水下图像普遍存在的颜色失真、对比度降低、小目标特征弱以及遮挡严重等问题,同时考虑AUV、ROV等水下平台算力受限、功耗受限的实际应用需求,本文提出一种基于YOLOv8的轻量化水下图像目标检测算法。首先,在特征提取阶段,借鉴GhostNet的特征冗余抑制思想与RepVGG的结构重参数化技术,设计轻量化重参数特征提取模块(LRP-FEM),通过以少量“固有特征图”配合线性变换生成的“幽灵特征图”完成表征重构,在显著压缩参数量和计算量的同时保持主干网络的语义表达能力和梯度流通效率。其次,在特征融合阶段,引入具备无损下采样特性的SPDConv与基于稀疏注意力机制的PyramidSparseTransformer,构建多尺度细节增强融合结构(MSDE-FN),利用空间到通道重排与跨尺度稀疏注意力实现小目标细节的保真传递与条件重加权,提升退化背景下多尺度特征的判别性,而无需额外增加检测层。最后,在检测头阶段,结合遮挡场景下的特征残缺特点,对MultiSEAM进行轻量化改造,得到SEAM模块并嵌入解耦检测头,通过深度可分离卷积与通道注意力强化未遮挡区域响应,抑制泥沙、海草等遮挡与背景干扰,从而提升目标定位与分类的鲁棒性。在URPC2019与URPC2020数据集上的实验结果表明,相较于YOLOv8n及多种主流轻量化检测模型,本文方法在mAP@0.5和mAP@0.5:0.95等指标上均取得了竞争性甚至更优的检测性能;在此基础上,模型参数量降至约2.5M、计算量控制在6.5GFLOPs左右,推理帧率保持在数百FPS级别,实现了检测精度、模型轻量化与实时性的综合平衡,验证了所提框架在复杂水下场景中的有效性与工程应用潜力。
Keywords: Underwater object detection,lightweight,YOLO


版权所有:软件工程杂志社
地址:辽宁省沈阳市浑南区创新路195号 邮政编码:110169
电话:0411-84767887 传真:0411-84835089 Email:semagazine@neusoft.edu.cn
备案号:辽ICP备17007376号-1
技术支持:北京勤云科技发展有限公司

用微信扫一扫

用微信扫一扫