语音之家

 找回密码
 立即注册
搜索
热搜: 算法 软件 硬件
查看: 26|回复: 0

声纹识别简介

[复制链接]

13

主题

14

帖子

118

积分

注册会员

Rank: 2

积分
118
发表于 2019-8-7 17:59:08 | 显示全部楼层 |阅读模式
声音就是一段波,声纹就是携带了信息的声波频谱。

声纹工作流程大致如下:

提取语音,预处理,提取特征
利用训练好的模型,计算该语音对应的声纹模型或者声纹特征
最后进行相似度打分,得到结果

特征可以采用ASR采用的MFCC和FBANK(参看语音识别-特征提取篇)

模型方面的演进

GMM-UBM(通用背景模型下的高斯混合模型)
JFA (Joint Factor Analysis)
GMM-UBM i-vector
DNN i-vector (2014年微软Yun Lei等人提的)
d-vector

打分方面:

SVM(早期与GMM-UBM一起使用最为后端分类器)
Cosine Distance (最简单)
PLDA (降低维度)

随着神经网络的发展和训练数据的庞大,谷歌、微软和百度等公司使用end-to-end的方法来集成这三个步骤, 也取得了一定的成果。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|yuyinbbs.cn

GMT+8, 2019-8-21 13:37 , Processed in 0.046588 second(s), 18 queries .

快速回复 返回顶部 返回列表