1.2 本论文的结构安排
1.2.1 论文目的
本文希望通过对于一种新的有别于传统的基频检测算法进行实践体会,在自己的研究能力下验证该方法的实际可行性并进行相应分析。
1.2.2 论文内容
本文首先介绍了传统算法并对其优缺点进行简述,接着介绍了本文所提出的EEMD算法,然后通过大量的实践仿真得到相应的结果并对其进行分析,最后是结论及其他部分。
1.2.3 论文安排
第一章是绪论,简单介绍语音与基频的相关知识并对本文的结构安排进行一个简述。由于本文中需要跟传统的算法来进行一些比对,故将传统算法等部分单独列在第二章的独立内容而不是作为背景介绍。第三章则是本文的算法介绍,包括EEMD算法及其前身EMD算法。第四章则是仿真结果展示以及相应图解与小结。第四章之后则是结论与致谢等其他论文相关内容
2. 传统的语音基频检测的算法概述
由于语音信号是非平稳的,因此语音信号处理也必须是短时的,即在一个短的时间窗内处理语音信号。窗口长度取决于语音信号的特征,通常来说至少要包括两个基音周期。
语音基频提取在语音信号处理领域上有着非常多的实际应用,如语音分离、语音合成等。对于汉语的语音识别来说,在不考虑韵律的情况下会发现当前主流语音识别技术没有用到基频。而基频作为韵律的重要部分,势必会在语音识别系统中添加韵律信息的过程中起到极为重要的作用。而如何加入韵律信息也是汉语语音识别系统的重要研究方向。
根据处理域的不同,我们将基频提取算法主要分为时域算法类、频域算法类以及统计算法类三大种。下面将分类详细介绍。
2.1 时域算法类
因为语音信号的时域波形代表了其随时间变化的声音激励的变化,基频提取的最基本方法就是通过观察语音信号的波形并从波形中检测提取基频
2.1.1 时域的事件发生率检测文献综述
基音频率提取方法中的一些方法是试图通过观察语音信号的波形重复自己的频率来估计基频。这些方法的理论依据是建立在对语音信号的短时周期性的假设上,即语音信号是周期的情况下,会存在随着时间不断重复地出现的事件发生。统计该类事件在单位时间内发生的次数即可估计出基频。类似的事件如下
1)过零率
简单地讲,过零率就是单位时间内波形通过零点的次数。对于过零率检测一度因为其结果的不准确而不被认可,随着进一步的研究而得到了认可与流行。使用过零率的一个重要目的就是提取基频,研究者曾经认为过零率与波形在单位时间内重复的次数有直接关系。但是不久人们就发现了以这样的思路使用过零率提取基频的方法有问题[6]。如果信号的能量都集中在基频附近,那么一个周期内它将两次穿过零。但是如果信号包含了高频能量,在一个周期内它穿过零的次数将大于2。所以如果使用过零率检测基频,要先滤掉高频成分。确定滤波器的截止频率,既要尽可能多地去掉高频成分,又要防止基频被滤掉。另一个可能的使用过零率提取基频的方法是先识别出过零率的模式,然后基于信号的模式估计基频。