首先,神经网络里经常用到的格式一般为三种PIL,Numpy,Tensor,而Tensor是基本的数据类型,在显示Tensor类型的图像时要转换为另外两种类型,而dataset输入格式一般要求为PIL类型(因为我用要使用resize等函数,要求变量为PIL)。所以在显示图像的时候就需要先把自己的数据转换为PIL,在转换为Tensor,特别是用GPU训练时候,要注意关于使用 GPU 有一个点,在我们想把 GPU tensor 转换成 Numpy 变量的时候,需要先将 tensor 转换到 CPU 中去,因为 Numpy 是 CPU-only 的。
所以网上的一些例子不一定完全符合自己的课题,所以要用GPU的话,就直接在GPU上调试会比较方便,会省去很多麻烦。
#导入你需要的库
import torch
import torchvision
import torchvision.transforms as transforms
import matplotlib.pyplot as plt
import numpy as np
#将图像转换为Tensortransform1=transforms.Compose([transforms.ToPILImage(),#不转换为PIL会报错transforms.Resize(256),transforms.Ra ndomResizedCrop(224),transforms.ToTensor(),transforms.Normalize([0.5,0.5,0.5],[0.5,0.5,0.5])])train_set=#自己定义的dataset
#dataloader载入自己的dataset
train_loader=DataLoader(dataset=train_set,batch_size=batch_size,shuffle=True)def imshow(img):img = img / 2 + 0.5 # 去标准化npimg = img.numpy() #转换为numpy格式(在CPU上)plt.imshow(np.transpose(npimg, (1, 2, 0)))plt.show()
#Pytorch中使用的数据格式与plt.imshow()函数的格式不一致Pytorch中为[Channels, H, W]而#plt.imshow()中则是[H, W, Channels]# 随机选取图像
dataiter = iter(trainloader)
images, labels = dataiter.next()
imshow(torchvision.utils.make_grid(images))
# 标签输出
print(' '.join('%5s' % classes[labels[j]] for j in range(4)))
TypeError: img should be PIL Image. Got <class ‘numpy.ndarray’>
当我们在使用
transforms.RandomHorizontalFlip(p=0.5),
transforms.RandomVerticalFlip(p=0.5),
transforms.Resize((224,224)) 等函数的时候,这时候会报错:
TypeError: img should be PIL Image. Got <class 'numpy.ndarray'>
所以我们要在转换中先转换为PIL格式。
transforms.ToPILImage()