当前位置: 代码迷 >> 综合 >> 11SPEECH EMOTION RECOGNITION WITH MULTISCALE AREA ATTENTION AND DATA AUGMENTATION
  详细解决方案

11SPEECH EMOTION RECOGNITION WITH MULTISCALE AREA ATTENTION AND DATA AUGMENTATION

热度:47   发布时间:2023-11-24 10:08:22.0

文章目录

  • 前言
  • 一、文章内容
  • 二、文章总结
  • 三、相关代码


前言

原文地址—2021

一、文章内容

  • 文章想法:

    • 提出了模型里融合一种多尺度的注意力机制有效提高了模型的识别能力
  • 输入数据:

    • logMel spectrogram
  • 文章模型:
    在这里插入图片描述
    在这里插入图片描述

  • 训练方式:

    • 五倍交叉验证
  • 模型输出

  • 实验结果:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  • 文章结论

二、文章总结

  • 文章novel和优势:
    • 多尺度的区域注意力机制
    • 区域注意力机制可以融合不同粒度的特征信息,有更好的学习效果,传统注意力机制总是固定的尺度大小进行注意力学习的
    • 数据增强
  • 同其他文章比较的劣势:

三、相关代码

  • 文章代码地址
  • area attention文章地址
  • area attention代码实现
  相关解决方案