5.2工作展望…38
致谢…40
参考文献…41
1 绪论
1.1 研究背景及意义 麦克风是信号与处理领域中语音信号采集的重要设备,在工程实践中,人们发现单一的麦克风采集音频信号的能力非常局限,并且实际的工作环境中通常存在多个声源和室内混响效应,使得单一麦克风采集到信号的信噪比非常低,效果差。基于此,人们研究发明了麦克风阵列,指将一组麦克风按照一定几何位置摆放而构建的阵列,可以通过阵列信号处理的方法,如波束形成,来抑制环境噪声和室内混响,得到纯净的语音具有很强的空间选择性[4][12][14]。基于麦克风阵列的声源测向是指利用麦克风阵列拾取声音信号,通过对多路声音信号进行分析与处理,继而在空间域中定位出一个或多个声源的位置。 自从罗格斯大学的弗拉纳根教授和布朗大学的西尔弗曼教授创造性地将阵列信号处理的方法引入到语音处理领域中,麦克风阵列信号处理已经成为了国内外新的研究热点[4][17]。利用麦克风阵列估算声源空间信息进行声源定位具有广泛的应用,例如通信、声呐、视频会议等等。在现实生活中,声音传到人两只耳朵的时间不同,人脑根据两只耳朵接收到的声音信息来判断声源的方位。类似人耳的听觉系统,利用麦克风阵列采集音频信号,获取声音到达麦克风阵列阵元的时间差,我们通过构建到达时间差的函数进行声源测向。根据麦克风阵列采集到的时延信息,利用短时傅立叶变换从时域变换到频域, 再通过阵列信号处理结合空域,构建关于时域、频域、空域的函数,我们称之为麦克风阵列角度谱。 麦克风阵列角度谱原理是声源测向的主要原理之一,其本质是关于到达时间差的方法研究。在理想环境中,周围无障碍物和较大的环境噪声干扰,我们认为声源发出信号后是直接传播到麦克风阵列的接收端,且麦克风阵列只接收到来自声源的直达声。在该模式下,阵列角度谱测向原理具有较好的表现效果。 然而,在实际的生活应用中,例如在楼宇安防、医疗护理等声频监控应用场合,楼内走道复杂的结构对声音的传播路径有着很大的影响。当声源发出声音时,楼道地板、墙壁、天花板对声波进行反射,使得声音经过一次或者多次的反射后才到达麦克风阵列接收端,且麦克风阵列接收端除了接收到来自声源的直达声之外,还接收到经过地板、墙壁、天花板反射的声波。这些麦克风阵列接收到的反射声对角度谱声源测向的性能有着较大的影响。与此同时,不同的麦克风阵元结构对应着不同的几何模型,麦克风阵元间距也是阵列角度谱测向原理中一个重要的元素。 在上述背景下,本文研究了声源测向中麦克风阵列角度谱原理,探究了楼道结构和麦克风阵列阵元间距对角度谱原理的影响。基于麦克风阵列的声源测向技术在生活中和工程上都得到了广泛的应用, 具有广阔的应用前景。 本课题的研究顺应着信息科技的发展,研究环境、结构对角度谱的影响有利于明确角度谱算法的影响因子,从实际出发验证实际环境中算法的性能,为今后的算法改进提供了参考,为针对不同的环境模型研究出不同的算法提供了借鉴,有利于推动声源测向技术中定位精度的改进,具有较大的价值和实际意义。
1.2 国内外研究状况 在过去的几年里,空间声源测向技术在科学领域得到了国内外越来越多人的关注。目前基于麦克风阵列的声源测向技术主要可分为三大类[5][9][11][12]:第一类是基于最大输出功率的可控波束形成技术。该类方法对麦克风阵列接收到的语音信号进行滤波、加权、求和等处理,波束的最大输出功率方向就是声源的方位;第二类方法基于高分辨率谱估计的定位技术。该类方法通过求解出麦克风阵元信号间的相关矩阵来定位出方位角,从而确定声源的方位;第三类方法是基于到达时间差(TDOA)技术。该类方法首先求出声音到达不同位置麦克风的时间差,再通过该时间差求解出声音到达不同位置麦克风的距离差,最后利用几何知识确定出声源的方位。 基于信号波达时间差(TDOA)的声源测向方法我们称为时延估计算法。时延估计理论和技术最初是被应用在水下目标声源的探测中,并随着现在信息技术的发展和应用得到了快速的发展,并且在许多不同的领域中中得到了广泛而实际的应用[7][17]。 1976 年,Knapp 等提出了广义互相关时延估计算法,该算法将相关分析和加权时延估计都统一到了广义互相关时延估计理论的框架下,同时提出了克拉美罗下界[16][17],也即是时延估计的性能下界,把时延估计理论推向了新的高潮。1981 年,Theriault 等人提出了一种避免偏差的被动定位算法,Rodriguez 等人将时延估计应用在生物学上,Reed 等人提出了自适应滤波 LMS时延估计算法。 20 世纪90年代的时候,随着时域和频域分析理论技术的不断发展,学者们在基于时域和频域的方面上提出了一些更为精确的时延估计算法,大大提高了时延估计算法的的精度[3][13][17]。 基于时延估计的算法中,目前比较广泛应用的主要有三类[1][2]:第一类,也是较简单的一类,计算混合信号每个频域的波达时延,定位直方图的谱峰。这种方法仅限于用在间距小的双耳麦克风,在宽间距麦克风下,由于空间混叠的存在,波达时延的计算准确性降低;第二类是运用聚类算法计算估计每个声源的频域和相关的波达时差。这类方法适用于任何间距的麦克风阵列,但是对聚类参数和波达时差参数的初始值非常敏感。第三类方法建立关于波达时延的函数,获得信号的角度谱,并在每个频域点进行累积。通过判断角度谱的谱峰估计声源的方位,此类方法适用于任何间距的麦克风,同时不需要相关参数的初始值。 构建麦克风阵列信号到达时间差函数的时延估计算法原理进行声源测向,我们称为麦克风阵列角度谱算法原理。角度谱算法原理也得到了越来越多的完善,其目的主要是提高空间信号方位的估计准确度,角度分辨力和提高算法的运算速度,其优秀的性能也使得它的应用越来越广。现阶段该领域有两个比较主要的研究空隙[1][6][8][9],一个是目前提出的研究方法中只有比较少量的角度谱实验评估方法;二是与麦克风阵列角度谱表现性能相关的麦克风间距、混响时间、声源个数等影响因子对角度谱有着什么样的影响目前被人们所知道的较少。