文章目录
- 前言
- 一、文章内容介绍
- 二、文章总结
前言
原文连接-2015
一、文章内容介绍
- 文章提出了一种使用卷积神经网络来进行端到端的语音感情特征提取模型
- 文章使用的原始的频谱特征使用PCA进行特征提纯后作为原始的输入数据,文章认为使用MFCC等较高级的特征会导致一些感情信息的丢失。
- 模型结构如下:
- 实验结果
二、文章总结
- 文章创新点:端到端模型,CNN提取特征
- 模型优势:
- 端到端模型简化模型的训练过程
- 直接用CNN提取全局特征
- 模型劣势:
- 效果40%
- 只用CNN进行全局特征的提取没有考虑语音的时序特征
- 这个文章是端到端模型应用在感情识别的开端,效果虽然差,也是一个开端有里程碑意义