问题:使用Kaldi提取音频特征时候发生报错
出现报错:** split_data.sh: warning, #lines is (utt2spk,feats.scp) is (502,500); you can ** use utils/fix_data_dir.sh data_test to fix this.
排除和解决
首先就是怀疑文件命名有问题
果然,在本地仔细排查,发现了两个命名有些“不合群”的音频问题;
可是修改之后依旧报错,再仔细检查还是没有其他发现;
后来发现在Linux服务器上查看文件非常的方便,直接看起排列是否整齐即可,
所以挨个说话人文件夹进行排查,结果发现了神奇的一幕:
直接使用mv命令
进行修改:mv 000000guoyingyu3002_1?????????.wav 000000guoyi ngyu3002_1.wav
;
成功解决了问题!