当前位置: 代码迷 >> 综合 >> 31Seen and Unseen emotional style transfer for voice conversion with a new emotional speech dataset
  详细解决方案

31Seen and Unseen emotional style transfer for voice conversion with a new emotional speech dataset

热度:53   发布时间:2023-11-24 09:55:39.0

文章目录

  • 前言
  • 一、文章内容
  • 二、文章总结
  • 三、相关代码


前言

原文地址—2020

一、文章内容

  • 文章想法:

    • 整了个新的数据集实现感情风格转换
    • 使用了一个变异自编码器这么一个模型进行感情风格变换
    • 干净的声音本身划分为三部分,内容、个人的特征、其他的语音语调等,文章就是在保证语言内容和个人特征不变的情况下改变其他的语音语调信息来改变感情的表达状态
    • 模型能够实现感情的随意转换,不是特定的1:1转换
    • 实现了声音特征的分离和合并,为语音的识别,说话人识别,感情识别,语音合成提高了一种方案
  • 输入数据

  • 文章模型:
    在这里插入图片描述

  • 训练方式

  • 模型输出

  • 实验结果

  • 文章结论

二、文章总结

  • 文章novel和优势:
    • 进行语音成分分解学习其中的感情特征等信息
    • 利用对抗生成自动学习有用的感情信息
  • 同其他文章比较的劣势:
    • 感情识别的时候单独使用了一个模块进行感情分类,进行了预训练,这个模块本身精确度不是很高影响结果
    • 提取纯语音内容特征的和感情无关特征的时候会方法不是很纯会影响效果

三、相关代码

  相关解决方案