当前位置: 代码迷 >> 综合 >> 17Compact Graph Architecture for Speech Emotion Recognition
  详细解决方案

17Compact Graph Architecture for Speech Emotion Recognition

热度:43   发布时间:2023-11-24 10:05:13.0

文章目录

  • 前言
  • 一、文章内容
  • 二、文章总结
  • 三、相关代码


前言

原文地址—2020

一、文章内容

  • 文章想法:

    • CNN进行特征提取没有反应出频谱图的动态特征
    • RNN特征提取的话过于复杂
    • 使用图神经网络的图谱神经网络(spectralGCNs)进行音频特征提取
  • 输入数据

  • 文章模型:
    在这里插入图片描述

  • 训练方式

  • 模型输出:

  • 实验结果:
    在这里插入图片描述

  • 文章结论

二、文章总结

  • 文章novel和优势:
    • 使用图神经网络进行特征的提取分类,找个工作在音频处理领域都是少见的只有一个基于注意力机制的图神经来做过小镜头音频分类工作
  • 同其他文章比较的劣势:
    • 没有在原始的频谱图基础上进行特征提取,而是用了一些加工处理的特征来作为学习输入,对原始特征的保留不是很完整

三、相关代码

  • 图神经网络综述
  相关解决方案