语言信号处理

　　语言信号处理（汉语拼音：Yuyan Xinhao Chuli；英语：Speech Signal Processing），数字信号处理的分支学科。研究语言的发音过程，语言信号的传送过程和统计特征、语言的自动识别和机器合成以及语言的感知特性等。语言信号处理大都采用数字计算机技术，所以又称为语言数字处理。语言信号处理的研究起源于对发音器官的模拟，即建立发音过程的数字模拟系统，亦即声道数字模型的研究。利用这一模型，可对语言信号进行分析与合成，借以发展各种通信频带压缩技术和保密通信的新体制。在语言分析合成的基础上，研制出了各种语言自动识别装置，赋予计算机以听觉功能。语言的信息主要包含在语言信号的参数之中。因此，准确而迅速地提取语言信号的参数是进行语言信号处理的关键。常用的语言信号参数有：共振峰频率、音调和嗓音噪声的判别等。这类参数仅反映发音过程的一些平均特性，而实际语言的发音变化相当迅速，需用非平稳的随机过程来描述。因此，20世纪80年代以来，研究语言信号动态的非平稳的参数分析方法得到迅速发展。

　　语言信号处理的研究成果可直接应用于各个领域。在工业中，话控技术可提高生产的自动化水平。工业机器人具有听说能力后，可显著提高生产效率。国防部门利用语言处理，能实现高保密通信，同时还可实现指挥员直接口呼命令。公安部门可利用发音特征的鉴别对作案人进行鉴定。文教部门可借助语言合成，实现人机语音对讲式的计算机辅助教学。医疗部门可通过语言信号处理对聋哑病人进行病情诊断。

语言信号处理

导航菜单

个人工具

名字空间

变种

查看

操作

搜索

导航

工具箱