语音识别技术以语言为研究对象,涉及生理学、语言学、计算机及信号处理等多个领域,是语言信号处理的一个重要研究方向,在智能控制、多媒体、人机对话等方面有着极其广泛的应用前景。 1 语音识别技术 语音识别技术首先要提取语音特征参量,也就是从语言信号中提取语音识别的有用信息。语音特 征参量的提取要考虑单词选定位置的基音、鼻辅音的频谱、元音的频谱、擦音的频谱等要素。语音识别技术也必须有模式匹配及模型训练技术,其中主要包括动态时 间规整技术、HMM模型和人工神经网络。时间规整是把一个单词内的时变特征变为一致的过程,在时间规整过程中,作为单词的时间轴要不均匀的扭曲或弯曲,使 其行征为模型特征对正,该技术是一种有力的矫正措施,对提高系统的识别精度极为有效。人工神经网络是一个自适应非线性动力学系统,模拟人体大脑活动的基本 原理,具有学习、技艺、判断、对比和概括等能力。另外,语音识别单元的选取也是语音识别的重要一步,语言识别单元有单词、音节和音素。对于汉语而言,主要 选取音节单元,因为汉语是单音节结构的语言,而英语是多音节的语言,汉语约有400个音节,数量相对较少,便于识别。
|