一.RCNN: 1.首先通过选择性搜索,对待检测的图片进行搜索出2000个候选窗口. 2.把这2k个候选窗口的图片都缩放到227*227,然后分别输入CNN中,每个候选窗台提取出一个特征向量,也就是说利用CNN进行提取特征向量. 3.把上面每个候选窗口的对应特征向量,利用SVM算法进行分类识别. 可以看到R-CNN计算量肯定很大,因为2k个候选窗口都要输入到CNN中,分别进行特征提取,计算量肯定不是一般的大. 二.SPPnet: 1.首先通过选择性搜索,对待检测的图片进行搜索出2000个候选窗口…