面向实时目标检测的ＦａｓｔｅｒＲ⁃ＣＮＮ算法 -葫芦时刻

依法合规经营，保障用户权益是我们的生命线，对于部分广告发布者为牟取高收益侵犯用户权益行为，我司将通过法律途径追责到底！

面向实时目标检测的ＦａｓｔｅｒＲ⁃ＣＮＮ算法

作者曹宏徙

发表于 2023年8月

摘要：文章讨论了目标检测在计算机视觉领域中的重要性，并介绍了目标检测算法的 2 种主要类型：传统计算机视觉方法和基于深度学习的方法。随着深度学习技术的发展，基于深度学习的目标检测算法逐渐成为主流，并取得了较好的效果。然而，为进一步提高 Faster R-CNN 在目标检测方面的性能，文章结合鲸鱼优化算法对Faster R-CNN 网络进行优化，并使用 PASCAL VOC 2012数据集对网络性能进行测试。实验结果表明，基于鲸鱼优化算法的 Faster R-CNN 网络性能明显优于标准 Faster RCNN 网络。基于此，深度学习的目标检测算法将在未来有更广泛的应用和更好的效果。

关键词：Faster R-CNN;目标检测：实时性

中图法分类号：TP391文献标识码：A

１引言

目标检测是计算机视觉领域的一项重要任务，其主要作用是在图像或视频中自动识别并定位感兴趣的目标物体。目标检测在许多应用中都具有重要作用，如自动驾驶、医学影像分析领域等。

现有的目标检测算法主要分为２类：传统计算机视觉方法的算法和基于深度学习的算法。传统计算机视觉方法主要基于图像特征提取和分类器构建，如Ｈａａｒ特征［１］、ＨＯＧ特征［２］、ＳＩＦＴ特征［３］等。而基于深度学习的算法主要基于卷积神经网络和其变种，如ＦａｓｔｅｒＲ⁃ＣＮＮ［４］、ＹＯＬＯ［５］等。随着深度学习技术的不断发展，基于深度学习的目标检测算法逐渐成为主流，并取得了较好的效果。这些算法不仅具有较高的检测准确率，还具有较快的检测速度，能够满足实时应用的需求。

随着技术的不断发展，其应用范围将会越来越广泛。为了进一步提高ＦａｓｔｅｒＲ⁃ＣＮＮ在目标检测方面的性能，本文结合鲸鱼优化算法对ＦａｓｔｅｒＲ⁃ＣＮＮ网络进行优化，并采用数据集ＰＡＳＣＡＬＶＯＣ２０１２对网络性能做了测试，实验结果表明，基于鲸鱼优化算法的ＦａｓｔｅｒＲ⁃ＣＮＮ网络性能明显优于标准ＦａｓｔｅｒＲ⁃ＣＮＮ网络。

２ＦａｓｔｅｒＲ⁃ＣＮＮ网络与鲸鱼优化算法

２．１ＦａｓｔｅｒＲ⁃ＣＮＮ网络架构

ＦａｓｔｅｒＲ⁃ＣＮＮ是目标检测领域中比较先进的一种网络结构，其架构主要包括卷积层、ＲＰＮ网络、ＲＯＩ池化和全连接层。其中，卷积层用于提取图像的特征，ＲＰＮ网络用于生成候选区域，ＲＯＩ池化用于对候选区域进行特征提取，全连接层用于对候选区域进行分类和回归。ＦａｓｔｅｒＲ⁃ＣＮＮ的基本架构如图１所示。

（１）卷积层。

本文的ＦａｓｔｅｒＲ⁃ＣＮＮ使用了深度卷积神经网络来提取图像的特征。常用的卷积神经网络有ＶＧＧ［６］、ＲｅｓＮｅｔ、Ｉｎｃｅｐｔｉｏｎ等，这些网络可以提取不同层次的特征。本文将ＲｅｓＮｅｔ卷积神经网络作为特征提取器。

（２）ＲＰＮ网络。

ＲＰＮ是ＦａｓｔｅｒＲ⁃ＣＮＮ中的一个关键模块，其作用是生成候选区域，即物体可能出现的位置。

本文刊登于《计算机应用文摘》2023年15期

龙源期刊网正版版权

计算机应用文摘

2023年15期

查看本期目录

更多文章来自