近年来,随着计算机网络技术、数字电视技术和通信技术日益成熟,极大地推动了多媒体产业的兴起,多媒体技术之间的信息融合越来越受到人们的重视,数字娱乐也逐渐体现了良好的发展前景。本文主要工作是针对卡通人脸动画的视觉语音相结合的研究,提出了一种综合语音和文本的驱动卡通人脸动画的多媒体技术,同时结合数字娱乐发展方向进行了实际应用的设计和探索。(1)提出了一种由语音和文本共同驱动的卡通人脸动画方法。首先建立卡通人脸音节-视位参数库,并对音节-视位参数进行非监督聚类分析,获得32种人脸视位基本类型,然后基于文本信息进行音节切分,获得准确的时长参数。结合视位的基本类型和语音时长参数,可以对输入的语音/文本进行连续动画拼接。本文提出的方法经过用100条从影视作品中收集的具有娱乐效果的语音/文本进行测试,结果表明可以克服单独的语音驱动或文本驱动的不足,取得更好的卡通人脸动画效果。(2)我们将这种语音和文本联合驱动方法应用于移动娱乐,设计了一套以用户娱乐、个性化需求为模式中心的多平台的用户个性化定制卡通动画合成及其点播系统。该系统具有C/S与B/S两种软件体系结构,分别实现了用户手机端和浏览器端上传配套的语音/文本、图片定制卡通动画以及点播功能。
本文来源: https://www.lw50.cn/article/a8632b74833a10b7b0cc7dbc.html