语言信号处理

来自中文百科,文化平台
跳转至: 导航搜索

  语言信号处理汉语拼音:Yuyan Xinhao Chuli;英语:Speech Signal Processing),数字信号处理的分支学科。研究语言的发音过程,语言信号的传送过程和统计特征、语言的自动识别和机器合成以及语言的感知特性等。语言信号处理大都采用数字计算机技术,所以又称为语言数字处理。语言信号处理的研究起源于对发音器官的模拟,即建立发音过程的数字模拟系统,亦即声道数字模型的研究。利用这一模型,可对语言信号进行分析与合成,借以发展各种通信频带压缩技术和保密通信的新体制。在语言分析合成的基础上,研制出了各种语言自动识别装置,赋予计算机以听觉功能。语言的信息主要包含在语言信号的参数之中。因此,准确而迅速地提取语言信号的参数是进行语言信号处理的关键。常用的语言信号参数有:共振峰频率、音调和嗓音噪声的判别等。这类参数仅反映发音过程的一些平均特性,而实际语言的发音变化相当迅速,需用非平稳的随机过程来描述。因此,20世纪80年代以来,研究语言信号动态的非平稳的参数分析方法得到迅速发展。

  语言信号处理的研究成果可直接应用于各个领域。在工业中,话控技术可提高生产的自动化水平。工业机器人具有听说能力后,可显著提高生产效率。国防部门利用语言处理,能实现高保密通信,同时还可实现指挥员直接口呼命令。公安部门可利用发音特征的鉴别对作案人进行鉴定。文教部门可借助语言合成,实现人机语音对讲式的计算机辅助教学。医疗部门可通过语言信号处理对聋哑病人进行病情诊断。