问题描述
我已经将数据分成测试集和训练集到不同的文件夹中。 现在我需要加载患者数据。 每个患者有 8 个图像。
def load_dataset(root_dir, split):
"""
load the data set numpy arrays saved by the preprocessing script
:param root_dir: path to input data
:param split: defines whether to load the training or test set
:return: data: dictionary containing one dictionary ({'data', 'seg', 'pid'}) per patient
"""
in_dir = os.path.join(root_dir, split)
data_paths = [os.path.join(in_dir, f) for f in os.listdir(in_dir)]
data_and_seg_arr = [np.load(ii, mmap_mode='r') for ii in data_paths]
pids = [ii.split('/')[-1].split('.')[0] for ii in data_paths]
data = OrderedDict()
for ix, pid in enumerate(pids):
data[pid] = {'data': data_and_seg_arr[ix][..., 0], 'seg': data_and_seg_arr[ix][..., 1], 'pid': pid}
return data
但是,错误说:
File "/home/zhe/Research/Seg/heart_seg/data_loader.py", line 61, in load_dataset
data_and_seg_arr = [np.load(ii, mmap_mode='r') for ii in data_paths]
File "/home/zhe/Research/Seg/heart_seg/data_loader.py", line 61, in <listcomp>
data_and_seg_arr = [np.load(ii, mmap_mode='r') for ii in data_paths]
File "/home/zhe/anaconda3/envs/tf_env/lib/python3.6/site-packages/numpy/lib/npyio.py", line 372, in load
fid = open(file, "rb")
IsADirectoryError: [Errno 21] Is a directory: './data/preprocessed_data/train/Patient009969'
它已经是一个文件名,而不是一个目录。 谢谢!
1楼
似乎./data/preprocessed_data/train/Patient009969
是一个目录,而不是一个文件。
os.listdir()
返回文件和目录。
也许尝试使用os.walk()
代替。
它将文件和目录分开处理,并且可以在子目录中递归以迭代方式查找更多文件:
data_paths = [os.path.join(pth, f)
for pth, dirs, files in os.walk(in_dir) for f in files]
2楼
你的路径中有文件和目录吗?
os.listdir
将列出文件和目录,因此当您尝试使用np.load
打开目录时,它会给出该错误。
您可以仅过滤文件以避免错误:
data_paths = [os.path.join(in_dir, f) for f in os.listdir(in_dir)]
data_paths = [i for i in data_paths if os.path.isfile(i)]
或者全部在一行中:
data_paths = [i for i in (os.path.join(in_dir, f) for f in os.listdir(in_dir)) if os.path.isfile(i)]
3楼
我遇到了同样的问题,但我通过将路径从Data/Train_Data/myDataset/(my images)
更改为Data/Train_Data/(my images)
,其中脚本 python 与 Data 位于同一路径中。
希望这有帮助。