在不使用计算量很大的滑动窗口的情况下对任意尺寸的图像进行图像分类。将ResNet-18框架需要的224×224尺寸图像输入改为任意尺寸的图像输入。

搭建CNN网络来完成验证码识别这一任务。项目中用到的验证码都是用captcha库来生成的。

这次我们用卷积神经网络来解决一个猫、狗的分类问题,这是一个典型的二分类问题。

2014年NiNNet用较少参数就取得了Alexnet的效果,开启了对卷积结构的探索。受此启发,GoogLeNet引入了一种能够产生稠密的数据的网络结构,既能增加神经网络表现,又能保证计算资源的使用效率。GoogLeNet及其后续系列模型表明了把图像不同尺度的信息进行融合可以得到图像更好的表征。

VGGNet在2014年的ImageNet比赛中取得了很好的成绩,展示出网络的深度是算法优良性能的关键部分。为了使网络建设得更深,2015年的ResNet引入了直连思想,提出了一种残差学习结构。

LeNet可以说是CNN的开端,麻雀虽小,但五脏俱全,卷积层、池化层、全连接层,这些都是现代CNN网络的基本组件。而AlexNet是另一个具有历史意义的网络结构,它的成功表示了深度学习重回历史舞台。
0%