目标检测方法可以帮助我们绘制某些确定实体的边框,但人类对场景的理解能以像素级的精细程度对每一个实体进行检测并标记精确的边界。我们已经开始发展自动驾驶汽车和智能机器人,这些都需要深入理解周围环境,因此精确分割实体变得越来越重要。

使用Kaggle.com上的一个包含了3类蔬菜共373个已标注了目标边框的小型数据集完成目标检测的入门。

IoU又名交并比,是一种计算不同图像相互重叠比例的算法,时常被用于深度学习领域的目标检测或语义分割任务中。

图像识别解决了是什么的问题,目标检测解决了在哪里的问题。简单来说就是在图像识别的基础上,以包围盒(bounding box)的形式把物体框出来。

人们常说神经网络的解释性不强,即神经网络模型是一个黑盒,它学到的经验很难用人类可以理解的方式呈现(反例是树模型,可解释性强)。这种说法不完全正确,卷积神经网络学习到的经验就非常适合可视化,因为很大程度上它们是视觉概念的表示。
0%