文章目录
- 1. os.walk()
-
- 1.1 说明
- 1.2 先看一看`os.walk`的用法
- 2. 应用:删除某文件夹下除了 wav 后缀的其它文件
- 进阶
代码在:0901_getDataOfAidatatang_200zh
1. os.walk()
1.1 说明
文件目录如下:
目的:想要保留子文件中所有的wav
后缀的音频文件。
思路:删除所有其它非wav
后缀的文件。
1.2 先看一看os.walk
的用法
data_path = '/Users/robin/Desktop/aidatatang_200zh'lst = ['metadata', 'trn', 'txt'] # 需要删除的后缀文件
for root, dirs, files in os.walk(data_path):print(root)print()
- root 的结果:
/Users/robin/Desktop/aidatatang_200zh
/Users/robin/Desktop/aidatatang_200zh/voiceprint
/Users/robin/Desktop/aidatatang_200zh/voiceprint/corpus
/Users/robin/Desktop/aidatatang_200zh/voiceprint/corpus/train
/Users/robin/Desktop/aidatatang_200zh/voiceprint/corpus/train/G0002
可以看到 os.walk 返回的第一个值 root
是每一次向下游走的目录路径
- dirs 的结果:
['voiceprint']
['corpus']
['train']
['G0002']
[]
dirs
是 os.walk 返回值(元组)的第二个值,其表示的是每一个目录层级的文件夹名称
- files 的结果:
['.DS_Store']
['.DS_Store']
['.DS_Store']
['.DS_Store']
['T0055G0002S0002.txt', 'T0055G0002S0001.trn', 'T0055G0002S0001.wav', 'T0055G0002S0002.trn', 'T0055G0002S0001.txt', 'T0055G0002S0002.wav', '.DS_Store', 'T0055G0002S0002.metadata', 'T0055G0002S0001.metadata']
files
是返回值的第三个值,表示的是每一个目录层级下所有的文件的名称('.DS_Store'
是Mac的隐藏文件)
2. 应用:删除某文件夹下除了 wav 后缀的其它文件
import os data_path = '/Users/robin/Desktop/aidatatang_200zh'lst = ['metadata', 'trn', 'txt'] # 需要删除的后缀文件
for root, dirs, files in os.walk(data_path):for file in files:if file[16:] in lst: # 也可以用类似 if(name.endswith("txt")): 的多个if循环来判断print(file[16:])
# print(os.path.join(root, file)) # 目录路径 + 文件名 = 文件完整地址os.remove(os.path.join(root, file))
进阶
- 如何分别获取多级文件的名称
for dirpath,dirnames,filenames in os.walk(path):subdirname=dirpath.split('\\')[-1]dirclassname=dirpath.split('\\')[-3]noname=dirpath.split('\\')[-2]for filename in filenames:if len(filename)==0:pass
-
如何指定文件夹?
-
如何指定遍历的顺序?——topdown参数
还有最简单的固定遍历顺序的方法,使用sorted()
,比如,for file in sorted(files)
-
如何指定一定层级的文件夹?(指定遍历深度)
添加链接描述
参考:
- python备份多级目录文件到另外一个目录下