摘要 声源定位是语音信号处理技术中一个基础且重要的功能。双耳的声源定位问题在实际情况中较为复杂,例如语音中会存在混响和白噪声。本文对以往基于 ITD(Interaural Time Difference)的定位算法做了改进,并在此基础上提出了迭代的定位算法。 经典的 GCC 方法得到的 ITD 的值总体幅值较小且相邻声源角度的 ITD 值非常接近,容易引起误判。本文对互相关函数进行三次样条插值,得到了单位为 us 的 ITD 值。经过改进之后的 ITD 测量值更接近理论值,并在后续的仿真实验中表现出了更好的性能。 本文提出了一种迭代的声源定位方法。该方法将语音分离与声源定位相结合,首先根据空间线索对混合语音中的多个声源进行定位,将首次定位的结果用于实现不同声源数据流的重构;随后对各个重构之后的语音信号重新估计声源方位。49146
毕业论文关键词 定位 迭代 耳间时间差
Title Sound Source Localization based on Iteration Method Abstract Sound source localization is fundamental in speech signal processing technique. Binaural solution becomes difficult when facing noise and reverberation. This thesis improves conventional localization method based on ITD (Interaural Time Difference) estimation and proposes an iteration method for localization. Conventional ITD values from classic GCC method differs little between adjacent source directions,which is easily causing mistakes. This thesis employs cubic spline interpolation in calculating cross correlation function and obtains more ideal ITD estimated values, which perform better in simulation experiments. In this thesis we propose an iteration method for localization, which combines speech separation and source localization. Simply speaking, we firstly estimate locations of multiple sources from mixed speech, and then separate the mixed speech according to the sources` locations; secondly we re-estimate source locations from the separated speeches.
Keywords localization iteration Interaural Time Difference
目录
第一章绪论1
1.1双耳声源定位技术的研究背景和意义1
1.2声源定位技术的研究现状..1
1.3论文主要研究内容..2
1.4论文组织结构.2
第二章双耳声源定位理论5
2.1人类听觉基础.5
2.1.1人耳听觉的基础结构..5
2.1.2空间听觉.5
2.2双耳声源定位线索..7
2.2.1耳间时间差7
2.2.2耳间强度差8
2.2.3双耳互相关函数.9
2.3双耳语音信号的采集..10
2.3.1与头相关传递函数.10
2.3.2双耳信号的计算机模拟..11
2.3.3人工头采集双耳信号12
2.4基于双耳空间定位的语音分离概述..13
2.4.1原有的语音定位分离算法.13
2.4.2迭代的语音分离算法14
2.4.3实验与性能评估算法15
2.5本章小结.16
第三章基于ITD的双耳声源定位17
3.1双耳空间线索提取17
3.1.1预处理17
3.1.2特征提取..18
3.2基于ITD的声源定位原理..19
3.3对ITD定位方法的改进21
3.4定位效果的评估.24
3.5本章小结.25
第四章定位与分离的迭代方法..27
4.1迭代结构.27
4.2混合语音的初步定位..27
4.3分离方法.27
4.4重定位与重分离方法..29
4.5评估结果.29
4.6本章小结.31
第五章总结与展望.33
- 上一篇:NRF51822+Bluetooth无线手套键盘的设计
- 下一篇:STC89C52单片机智能门禁系统的设计+电路图
-
-
-
-
-
-
-
杂拟谷盗体内共生菌沃尔...
酸性水汽提装置总汽提塔设计+CAD图纸
大众媒体对公共政策制定的影响
乳业同业并购式全产业链...
河岸冲刷和泥沙淤积的监测国内外研究现状
中考体育项目与体育教学合理结合的研究
十二层带中心支撑钢结构...
当代大学生慈善意识研究+文献综述
java+mysql车辆管理系统的设计+源代码
电站锅炉暖风器设计任务书