当前位置: 代码迷 >> 综合 >> Python 文件之 os.walk()
  详细解决方案

Python 文件之 os.walk()

热度:90   发布时间:2023-12-15 05:22:02.0

文章目录

  • 1. os.walk()
    • 1.1 说明
    • 1.2 先看一看`os.walk`的用法
  • 2. 应用:删除某文件夹下除了 wav 后缀的其它文件
  • 进阶

代码在:0901_getDataOfAidatatang_200zh

1. os.walk()

1.1 说明

文件目录如下:
目的:想要保留子文件中所有的wav后缀的音频文件。
思路:删除所有其它非wav后缀的文件。
在这里插入图片描述

1.2 先看一看os.walk的用法

data_path = '/Users/robin/Desktop/aidatatang_200zh'lst = ['metadata', 'trn', 'txt']  # 需要删除的后缀文件
for root, dirs, files in os.walk(data_path):print(root)print()
  • root 的结果:
/Users/robin/Desktop/aidatatang_200zh
/Users/robin/Desktop/aidatatang_200zh/voiceprint
/Users/robin/Desktop/aidatatang_200zh/voiceprint/corpus
/Users/robin/Desktop/aidatatang_200zh/voiceprint/corpus/train
/Users/robin/Desktop/aidatatang_200zh/voiceprint/corpus/train/G0002

可以看到 os.walk 返回的第一个值 root 是每一次向下游走的目录路径

  • dirs 的结果:
['voiceprint']
['corpus']
['train']
['G0002']
[]

dirs 是 os.walk 返回值(元组)的第二个值,其表示的是每一个目录层级的文件夹名称

  • files 的结果:
['.DS_Store']
['.DS_Store']
['.DS_Store']
['.DS_Store']
['T0055G0002S0002.txt', 'T0055G0002S0001.trn', 'T0055G0002S0001.wav', 'T0055G0002S0002.trn', 'T0055G0002S0001.txt', 'T0055G0002S0002.wav', '.DS_Store', 'T0055G0002S0002.metadata', 'T0055G0002S0001.metadata']

files 是返回值的第三个值,表示的是每一个目录层级下所有的文件的名称'.DS_Store'是Mac的隐藏文件)

2. 应用:删除某文件夹下除了 wav 后缀的其它文件

import os data_path = '/Users/robin/Desktop/aidatatang_200zh'lst = ['metadata', 'trn', 'txt']  # 需要删除的后缀文件
for root, dirs, files in os.walk(data_path):for file in files:if file[16:] in lst:    # 也可以用类似 if(name.endswith("txt")): 的多个if循环来判断print(file[16:])
# print(os.path.join(root, file)) # 目录路径 + 文件名 = 文件完整地址os.remove(os.path.join(root, file))

进阶

  1. 如何分别获取多级文件的名称
for dirpath,dirnames,filenames in os.walk(path):subdirname=dirpath.split('\\')[-1]dirclassname=dirpath.split('\\')[-3]noname=dirpath.split('\\')[-2]for filename in filenames:if len(filename)==0:pass 
  1. 如何指定文件夹?

  2. 如何指定遍历的顺序?——topdown参数在这里插入图片描述
    还有最简单的固定遍历顺序的方法,使用sorted(),比如,for file in sorted(files)

  3. 如何指定一定层级的文件夹?(指定遍历深度)
    添加链接描述

参考:

  1. python备份多级目录文件到另外一个目录下