传统的声源方向估计大体上可分为三类:基于可控波束形成器的算法、基于高分辨率谱估计的算法、基于声音到达时间差(Time Difference of Arrival,TDOA)的算法。
到达时延差(TDOA)估计,是基于一维平面利用不同声源的角度不同导致到达麦克风时间不同来估计声源方向的。但是对于空间声源及有噪声和干扰存在的情况下,该方法估计并不能很好的分离声源且存在估计模糊,取而代之的是传统的波束形成方法。传统的波束形成方法可以实现增强期望信号,削弱干扰及噪声信号的功能,它将麦克风阵列的各个传感器的输出加权,最终得到能量加权值进行空间波束法估计。这种波束形成方法虽然操作简单,易于实现,但是为了达到良好的分离性能,就需要有大量的麦克风阵元,而且会受到瑞利限的限制。如同雷达的扫描波束一样,当两个信源同时位于麦克风阵列的波束宽度之内时,便不能区分出两个声源信号,因此也不是较佳方案。基于高分辨率谱估计的算法,是求各路声音信号相关矩阵的空间谱,利用其中的空间信息来估计声源的位置。
为了能更好的得到目标信号的角度信息,64231
基于加权的分析也随之兴起,如1976年,Knapp和Cater就共同发表了一篇 “广义相关法时延估计”(The Generalized Correlation Method for Estimation of Time Delay)的著名论文,其在广义相关时延估计的理论基础上集合了多种基于相关的加权时延估计方法。在低的混响条件下,SNR加权的归一化互相关(GCC)法和ML-类型加权法广为应用,初步克服了噪声和混响对语音分析的影响。到1996年,Silverman和Brandstein开始将阵列信号处理技术应用于声源定位中,用于测量说话人的位置并对其进行实时跟踪[17,18]。论文网而随着语音处理领域技术的提高及科技必须提高的要求,摆脱频率的束缚,有效估计信源方位提出了必须改进的要求,互谱功率相位法(CSP)可以减少对频率的依赖,依据互相关函数的峰值的明显化来分离各个源。但随着低信噪比中信源方位的研究日渐提上日程,我们已不能满足于互谱功率相位法,因此提出了一种改进方法,基于互功率谱相位和信源频率的时延估计方法,解决了噪声和混响对信源估计影响严重的难题。
综合看,对声源定位的研究主要在国外的发展较为迅速,国内的发展相对迟缓了些。从发展方向来看,目前的声源定位多用于军事领域,如战场目标音的识别,,声探测的预警系统,飞机探测系统等。因此声音定位的研究有着重大及深远的意义。