基于汉语视频三音素的可视语音合成PDF -管理资源网

首页 > 资料专栏 > 经营 > 运营治理 > 其他资料 > 基于汉语视频三音素的可视语音合成PDF

基于汉语视频三音素的可视语音合成PDF

灰色咖啡: V 实名认证

内容提供者

联系反馈

热门搜索

汉语

资料大小：325KB(压缩后)
文档格式：PDF（5页）
资料语言：中文版/英文版/日文版
解压密码：m448
更新时间：2023/9/14(发布于云南)

类型：积分资料
积分：10分 (VIP无积分限制)
推荐：免费申请

下载地址

文档软件 | 转换工具

==>> 点击下载文档

相关下载

推荐资料

文本描述

http://www.elecfans 电子发烧友 http://bbs.elecfans 电子技术论坛第 31卷第 12期 2009年 12月电子与信息学报 Vol.31No.12 Dec..2009 Journal of Electronics & Information Technology 基于汉语视频三音素的可视语音合成赵晖唐朝京 (国防科技大学电子科学与工程学院长沙 410073) 摘要：为了合成具有真实感的视频序列，该文提出一种基于汉语视频三音素的可视语音合成方法。根据汉语的发音规律和音素与视素的对应关系，该文提出“视频三音素”的概念。在此基础上，建立隐马尔可夫(HMM)训练与合成模型，在训练过程中使用了视频音频联合特征，并加入了动态特征。在合成过程中，连接视频三音素 HMM模型形成句子 HMM，并从中提取特征参数，合成可视语音。从主观和客观评估结果来看，合成视频的真实感强，满意度较高。关键词：可视语音合成；视频三音素；隐马尔可夫模型；联合特征中图分类号：TP391.42文献标识码：A 文章编号：1009-5896(2009)12-3010-05 Visual Speech Synthesis Algorithm Based on Chinese Visual Triphone Zhao Hui Tang Chao-jing (College of Electronic Science and Engineering, National University of Defense Technology, Changsha 410073, China) Abstract: In order to synthesize real video sequence, a visual speech synthesis algorithm based on Chinese visual triphone is proposed. According to Chinese pronunciation principle and the relationship between phoneme and viseme, conception of ‘visual triphone’ is presented. Hidden Markov Model(HMM) is established based on visual triphones. In the training stage, com