CNN经典网络模型架构学习之VGGNet

date

Sep 9, 2025

slug

2025-09-09-the-classical-CNN-network-VGGNet

status

Published

VGGNet的网络架构简介

VGG：Visual Geometry Group。VGGNet最初的设计理念是通过加大卷积神经网络的深度，来提升模型的工作性能指标。VGGNet在2014年的ImageNet的图像识别和分类竞赛（ILSVRC）中得到了第二名（GoogleNet是当年竞赛的第一名），top-5 accuracy指标（模型预测出来的概率最高的前5个类别中，是否包含了真实的标签）达到了92.7%，在后续的一些其他模型中，VGGNet的网络结构也往往被用于backbone部分进行图像的特征识别。

VGGNet的网络架构中比较典型的VGG16，VGG19以及VGG34模型，其中的数字表示其模型架构分别包含有16个、19个以及34个参数层（即卷积层和全连接层）。

下图是VGG16的网络架构图：

以上VGG16的整个网络架构中，包含了13个卷积层，5个池化层，以及3个全连接层，其中的参数层（即卷积层和全连接层）共计16个。

模型的输入的分辨率为224x224的RGB三通道图像数据，最终的输出为针对1000个图像分类类别的预测概率（因为VGG16模型的设计是对ImageNet数据集进行预测，该数据集有1000个分类）。

从整个网络架构的设计上讲，仍然是标准的卷积神经网络。整个网络结构分为两个部分：前半部分是卷积层和池化层组成的图像特征提取部分，后半部分则是由全连接层组成的图像分类部分。因此，网络结构与CNN经典网络模型架构学习之LeNet以及CNN经典网络模型架构学习之AlexNet所总结的LeNet以及AlexNet没有本质上的差别，只不过层次更多而已。但因为层次相比较LeNet和AlexNet的层数加深了很多，VGG16的参数数量达到了138M。

VGG19 相比 VGG16 多了 3 个卷积层，在以上的conv3、conv4、conv5部分各加了一个卷积层，其余部分（包括卷积核尺寸、通道数、池化策略、全连接层结构）完全相同。

在VGGNet的原始论文中，作者共提供了从A到E共6种网络配置。其中VGG16对应的是配置D，而VGG19对应的则是配置E。