语音识别
项目名称:智能手表语音识别系统
**项目描述:**儿童智能监控语音识别手表,可以实现人机沟通,紧急呼救报警等功能。
**职责描述:**1.使用scipy,numpy,读取和绘制音频数据
2.使用傅里叶解析算法进行音频滤波
3.使用正弦算法进行音频合成
4.使用梅尔频率倒谱系数算法提取音频特征;
5.创建隐马尔科夫模型用该模型的score值比较,进行语音识别。
项目3 土地变更县级外业调查软件的语音识别系统
项目描述:
在土地变更的县级外业调查阶段,一般处于冬季,气候寒冷,本项目的语音识别模块可识别操作人员语音语义,帮助操作人员完成相关操作。
项目职责:
数据预处理,读取音频数据,使用梅尔频率倒谱系数算法提取音频特征;
模型构建,使用马尔科夫模型为每个训练样本创建模型保存其主要特征;
将测试数据与每个样本的模型进行皮氏距离得分比较,得分最高的即为其类别。
项目效果:
通过本模型的应用,使得外业设备的操作更简便,提高了调查的时间效率。
项目名称:机车运行语音识别系统
项目描述:创建语音识别器,可识别操作人员语音语义,完成机车运行相关操作。
职责描述:1、使用scipy.io.wavfile,numpy,matplotlib 读取和绘制音频数据;
2、使用快速傅里叶变换进行音频滤波,将信号映射到频域
3、使用正弦算法进行音频合成
4、使用梅尔频率倒谱系数算法提取音频特征;
5、创建隐马尔科夫模型用该模型的score 值比较,进行语音识别。
应用市场的语音搜索
开发方案: linux+python3.6.4+keras
负责模块:语音识别,语义提取
项目描述:在应用市场里面添加语音搜索功能,提高用户体验
? 1)使用keras构建神经网络(cnn+lstm+ctc)
? 2)处理采集音频并进行分段输入到训练好的模型,汇总得到的文本信息,
? 使用已训练好的HMM模型对语义进行提取,然后直接调用后台的搜索接口
? 3)根据用户模型对搜索到的应用进行排序后传给前端来展示
项目2:智能家电语音识别
项目简介:智能家电语音识别系统,能够识别人的语音,与人交互
个人职责:
\1. 数据集采集、创建模型、训练、测试等
\2. 音频合成
所用技术:
\1. 通过傅里叶变换,将声音信号从时间域映射到频率域
\2. 通过梅尔频率倒谱系数(MFCC)生成能量矩阵
\3. 创建隐马尔可夫模型,根据模型的score值比较,寻找最优预测模型
\4. 音频合成利用反向傅里叶变换即将音符从频率域映射到时间域
项目1:2017.04 – 2018.04 19课堂在线教育直播平台
**项目描述:**19课堂直播课抛开传统的面对面授课模式,借用互联网通过视频,音频打造一个更加开放的以学生为中心的老师在线教学、学生及时互动的教学形式。不受地域限制,保证学员能够随时随地听课。主要模块包括:用户登录注册、直播教学、推荐课程、浏览用户数据统计分析等。
**个人职责:**优化19课堂在线教育直播平台包括增加语音识别模块,浏览用户及评论信息数据的统计分析。
**所用技术:**1.利用自适应滤波法,将直播中的语音降噪处理,形成纯净的语音信号;
2.对语音信号中的有声片段和无声片段进行分割,再针对有声片段的语音特征进行识别;
3.利用pandas,numpy对浏览用户及其评论信息数据进行预处理,分析用户特征和评论倾向,预测用户喜好;
4.利用matplotlib形成数据可视化,获得分析结果。
项目名称:服务语音机器人
项目简介:
智能语音机器人通过对客户点对点问答的形式来精准快速的捕捉客户需求并给出
合理的答复,来辅助人工电话客服以更加经济高效的方式为客户提供服务,人工
电话客服能够集中精力为客户提供更高价值的服务,从而实现电话客服精准服务
化高了客户的体验度并节约了运营成本
**个人职责:**数据处理、音频特征矩阵的获取、建立语音识别模型
所用技术:
1、利用scipy.io.wavfile,numpy,matplotlib.pyplot读取和绘制音频数据
2、使用numpy.fft (快速傅里叶变换)进行音频滤波,将信号映射到频域并进行降噪处理
3、使用python_speech_features.mfcc获取梅尔频率倒谱系数(MFCC)矩阵 提取音频特征
4、创建隐马尔科夫模型hmmlearn.hmm. GaussianHMM,运用该模型的score值比较,进行语
音识别
项目2: 语音控制无人机视频取证2 个月
项目描述: 在一些取证较为困难的地方(地势)或不方便人员现场取证(偷拍取证)这
些因素极大影响办案效率,语音控制无人机视频取证可以很方便的解决这些
问题,不仅简单易用,在保护办案人员人身安全的前提下,提高办案效率
职责描述: 1 使用scipy.io.wavfile 的read 读取音频文件,得到采样率和每个采样点的值
2 通过语音特征提取器python_speech_features 的MFCC 处理,返回MFCC
矩阵(梅尔频率倒谱矩阵)
3 使用hmmlearn.hmm 的GaussianHmm 构建隐马模型
4 将mfcc 交给模型训练,最后对训练好的模型验证音频mfcc 的得分(score)
智能家电语音识别 5个月
项目介绍:识别简单的语音指令,如开关灯、音乐播放等
个人职责:数据集划分、建模、训练、测试等
所用技术:1. 通过wavfile读取音频文件,并拆分输入与标签
- 通过python_speech_features中梅尔频率倒谱系数(MFCC)方法生成能量矩阵
- 创建隐马尔可夫(GaussianHMM)模型,根据模型的score值比较,寻找最优预测模型
四、项目名称:儿童智能语音小助理
项目简介:可以识别用户的语音并提供相应的服务
个人职责:负责创建语音识别器,达到语义识别的目的。
所用技术:
1.使用scipy.io.wavfile,numpy,matplotlib.pyplot 读取和绘制音频数据;
2.使用numpy.fft (傅里叶解析算法)进行音频滤波;
3.使用正弦算法进行音频合成;
4.使用python_speech_features.mfcc(梅尔频率倒谱系数算法) 提取音频特征;
5.创建隐马尔科夫模型hmmlearn.hmm. GaussianHMM,运用该模型的score 值
比较,进行语音识别。
二、项目名称:智能客服系统
项目简介:通过用户输入的问题自动进行语义分析为客户寻找相似的问题和答案
个人职责:参与对语义分析模型的建立
所用技术:
1.负责对客户提出的问题进行词干的提取和语义的识别
2.建立词袋矩阵对特征值进行提取
3.建立词频逆文档矩阵来对模型进行语义分析,利用聚类对其进行语义识别
一、项目名称:智能在线天气系统
项目简介:此系统可以识别用户的语音命令并提供给用户相应的天气信息服务
个人职责:将识别的语句进行语素分解、词干提取、词性还原,并建立模型来识别语句的
内容。
所用技术:
1.利用nltk 工具将语音识别的语句进行语句分析;
2.建立词袋模型及词频逆文档频率(TF-IDF)矩阵对文本进行特征提取
3.建立模型对语句语义进行分类识别
项目名称 音乐播放器 智能输入语音识别系统
-
应用环境
-
Linux + Python + Pycharm + Numpy + Sklearn + Scipy
负责模块 -
数据预处理 语音 识别 + 语义提取
项目描述
项目描述 ::
将收集来的语音数据,通过将收集来的语音数据,通过梅尔频率倒谱系数梅尔频率倒谱系数获取语音内容密切相关的获取语音内容密切相关的1313个特殊频率所个特殊频率所对应的能对应的能
量分布
量分布,,作为声音的特征,将声音的特征通过由作为声音的特征,将声音的特征通过由隐马尔可夫学习模型识别器隐马尔可夫学习模型识别器所构建的语音识别模型,获所构建的语音识别模型,获取语音中的相关语义,使用不同的音频对模型进行训练和调试,形成取语音中的相关语义,使用不同的音频对模型进行训练和调试,形成相关的语义袋。相关的语义袋。当用户再次传入当用户再次传入语语音通过模型的识别语音音通过模型的识别语音获取语义获取语义,再利用,再利用朴素贝叶斯中的多项式核模型朴素贝叶斯中的多项式核模型,对所获取的语义进行匹配,将,对所获取的语义进行匹配,将正确结果返回给用户正确结果返回给用户
项目职责
项目职责::
- 获通过梅尔频率倒谱系数获取声音的特征获通过梅尔频率倒谱系数获取声音的特征,并利用不同的语音模型进行调试,并利用不同的语音模型进行调试
- 通过通过JiebaJieba分词器构建语义袋,并对新输入的语义进行整合分词器构建语义袋,并对新输入的语义进行整合
项目
项目三: 摹考官(NLP+语音识别)
项目描述:随着公司上市,服务提升,公考人员课程之后的模拟面试需求剧增,人工模拟面试已不能满足需求,
故需研发一款模拟面试的语音识别系统,旨在提高效率,智能做出点评;
职责描述:语句文本的处理,读取音频数据及预处理,建立模型,优化模型,完成语音识别的功能;
所用技术:1、使用结巴分词进行中文分词和词性标注;
2、忽略停用词并获取词袋模型和词向量;
3、获取TF-IDF,并基于多项分布的朴素贝叶斯进行文本分类和Topic 提取;
4、使用Scipy.io.wavfile,Numpy,OS 等模块,读取音频数据;
5、使用同维卷积做滤波;
6、使用FFT 得出梅尔频率倒谱系数(MFCC)矩阵;
7、基于MFCC 矩阵循环创建GaussianHMM 模型,对比模型得分,并用得分最高模型做测试。