基于多流多状态动态贝叶斯网络的音视频连续语音识别.pdf 文库研发埠

官方微信

扫一扫，随时随地

获得最新文档

基于多流多状态动态贝叶斯网络的音视频连续语音识别.pdf

(0个评分)

文集编号: 20140312009513

我要下载收藏文档需 0 学分

文档介绍

音和唇部运动的异步性是多模态融合语音识别的关键问题，该文首先引入一个多流异步动态贝叶斯网络(MS—ADBN)模型，在词的级别上描述了音频流和视频流的异步性，音视频流都采用了词一音素的层次结构。而多流多状态异步DBN(MM—ADBN)模型是MS．ADBN模型的扩展，音视频流都采用了词．音素一状态的层次结构。本上，MS—ADBN是一个整词模型，而MM．ADBN模型是一个音素模型，适用于大词汇量连续语音识别。实验结果表明：基于连续音视频数据库，在纯净语音环境下，MM-ADBN比MS—ADBN模型和多流HMM识别

文档标签: 控制科学与技术

贡献者

王贺勇八品司务

分享文档236 联系TA

热门下载

研发埠文库周报

订阅

官方微信

获得最新文档

基于多流多状态动态贝叶斯网络的音视频连续语音识别.pdf

文档介绍

该用户还分享了