引用本文:
【打印本页】   【HTML】   【下载PDF全文】   查看/发表评论  【EndNote】   【RefMan】   【BibTex】
←前一篇|后一篇→ 过刊浏览    高级检索
本文已被:浏览 1271次   下载 22 本文二维码信息
码上扫一扫!
分享到: 微信 更多
一种基于预测谱偏移的自适应高斯混合模型在语音转换中的应用
沈惠玲,万永菁
作者单位E-mail
沈惠玲 华东理工大学信息科学与工程学院, 上海 200237  
万永菁 华东理工大学信息科学与工程学院, 上海 200237 wanyongjing@ecust.edu.cn 
摘要:
基于高斯混合模型(GMM)的语音帧谱包络转换算法容易导致转换后的语音谱包络过平滑、语音细节特征受损。通过对GMM中协方差的准确性与谱包络过平滑现象的研究,提出了一种基于预测谱偏移的自适应GMM建模方法。该方法采用平滑加权算法对目标谱的偏移进行建模,并根据语音帧信息自适应调节预测谱偏移项的比例系数,结合高斯混合模型共同实现对谱包络的转换。实验结果表明,该建模方法能够有效抑制转换后语音谱包络的失真现象,提高转换后语音的清晰度、自然度和可懂度。
关键词:  语音转换  高斯混合模型  预测谱偏移  自适应
DOI:10.14135/j.cnki.1006-3080.2017.04.014
分类号:TN912
基金项目:
An Adaptive Gaussian Mixed Model Based on Predictive Spectral Shift and Its Application in Voice Conversion
SHEN Hui-ling,WAN Yong-jing
Abstract:
Voice conversion algorithm based on Gaussian mixture model (GMM) may result in the over-smoothing of spectral envelop and the damage of speech feature.By analyzing the relationship between covariance's accuracy and over-smoothed phenomena,this paper proposes an adaptive GMM conversion algorithm based on spectral shift,which uses the weighted average algorithm to predict the converted spectral shift.Both the proposed spectral shift and the GMM are adopted to realize the appropriate converted spectral sequence.Moreover,the spectral shift proportion and GMM correlation are adaptively adjusted by using the spectral parameter.The experiment results show that the proposed algorithm can effectively alleviate the over-smoothing and improve the clearness naturalness and intelligibility of converted voice.
Key words:  voice conversion  Gaussian mixed model  predictive spectral shift  adaptive

地址:上海市梅陇路130号华东理工大学研究生楼1015室 邮编:200237

电话:021-64253812 传真:021-64253812 电子信箱: ecustxbb@ecust.edu.cn