语图:用语图仪画出来的频谱图,称为语图。语图通常分为窄带语图和宽带语图。窄带语图指用窄带滤波器做出的声谱图,宽带语图指用宽带滤波器做出的声谱图。二者都是三维的:横轴表示时间,纵轴表示频率,第三维用灰度(或彩色)表示某一时刻某一频率分量的振幅。
共振峰:在特定的频率区域聚集大量声能的语音表现,称为共振峰。
1.2.3 语音信号数字化和预处理
为了将原始的模拟语音信号转化为数字信号,必须经过采样和量化两个步骤。由奈奎斯特采样定理知,当采样频率大于信号的2倍带宽时,在采样过程中不会丢失信息,且从采样信号中可以精确地重构原始信号波形。采样频率通常为8KHz~10Hz左右。若信号带宽未知,则需加入抗混叠滤波器,即采用预滤波来限制信号带宽,防止产生混叠。滤波器上下截止频率设为fH和fL。对于电话语音编码器而言,要求fH=3400Hz, fL=60~100Hz, fs=8KHz.。对于语音识别系统而言,用于电话用户时要求技术指标与语音编码器相同,如果对于更高的要求场合,则fH=4500Hz或8000Hz, fL=60Hz,fs=10KHz或20KHz。
语音分析是语音信号处理的前提和基础。分析的目的是提取需要的信息和获取特征参数。主要采用的方法则是,短时分析方法。虽然语音信号是一时变信号,但其具有短时平稳性,即在10~30ms时间段内相对平稳。