训练的时候当然随机剪裁,但测试的时候有技巧:
- 单纯将测试图像resize到某个尺度(例如256xN),选择其中centor crop(即图像正中间区域,比如224x224),作为CNN的输入,去评估该模型
Multiple Crop的话具体形式有多种,可自行指定,比如: - 10个crops: 取(左上,左下,右上,右下,正中)以及它们的水平翻转。这10个crops在CNN下的预测输出取平均作为最终预测结果。
- 144个crops:这个略复杂,以ImageNet为例:
1、首先将图像resize到4个尺度(比如256xN,320xN,384xN,480xN)
2、每个尺度上去取(最左,正中,最右)3个位置的正方形区域
对每个正方形区域,取上述的10个224x224的crops,则得到4x3x10=120个crops
3、对上述正方形区域直接resize到224x224,以及做水平翻转,则又得到4x3x2=24个crops
总共加起来得到120+24=144个crops,所有crops的预测输出的平均作为整个模型对当前测试图像的输出