20世纪60年代中期的时候研究人员们陆续发现了许多关于数字信号处理的理论和算法,如数字模拟滤波器,时域频域的分析,快速傅立叶变换(FFT)等算法和技术是语音信号数字处理的理论和技术基础。在时代飞速发展的影响下,促进了信息科学技术的飞速发展,并且带动了信号处理技术也取得了长足的进展:进入70年代之后,线性预测技术(LPC)这个概念被提出,它主要用于语音信号的信息压缩和特征提取的,并且在语音信号处理领域里已经成为了最强有力的工具,并且在各个领域中都得到了广泛地使用如:合成、分析,并且在输入语音与参考样本之间时间匹配的动态规划方法中得到应用;80年代初矢量量化(VQ)开始应用在语音信号处理中,它是新的一种基于聚类分析的高效数据压缩技术—;80年代语音处理技术的另一项重大的发展就是通过隐马尔可夫模型(HMM)描述语音信号过程,这一项伟大的发现加快了语音信号处理研究的速度,并且成为了所有研究的基石。近年来在语音信号处理的各项课题的研发下极大的促进了人工神经网络(ANN)的研究,并且取得了巨大的成果,而它的成果也在语音信号处理的技术中得到应用。42308
近三十年来,语音识别技术发展的十分迅速,渐渐的从实验室里的理论研究走向了市场方向并且形成了许多的新兴产品。许多领域都对语音识别技术高度的重视并且开展了研发如:电子信息工程、信息处理、自动控制等。并且研发出了许多种类的语音信号识别系统并且展现了它们各种的用途,语音信号处理技术已经展示了它技术上的优势和强大的可持续研发性。在日常生活中我们也经常能接触到各种各样的语音识别软件如:win7语音识别、Android系统下的Voice Actions、Nuance、IBM公司的viavoice、苹果手机上的siri以及国内科大讯飞的讯飞语音识别产品等。我们国家一直密切关注着语音信号处理技术的发展与进展,在很多科研院所和企业花费了大量的人才与资金,都是为了对语音信号处理这门技术进行研究开发,可以看到这门技术的多么重要,多么值得我们去研究。 论文网
在前面介绍的各种产品中,他们都有一个共同的特点,虽然对于将文字转化为语音方面都表现的十分优秀,但对于将语音转化为文字时却表现的并不像预期里那么好了。就像Voice Actions,它对语音能进行非常精确的识别,它在对语音识别这一块无疑是十分优秀的,但是它与微软和IBM等公司是的同样的语音识别引擎,它对于所要识别的语音有着严格的要求,只有按照固定的格式与语法结构的语音才能被识别,不然将识别不出你所说的语音。但在苹果手机找不到这个问题,它的Siri是目前为止比较优秀的一种语音识别系统,运用它的语音识别系统时我们可以不用刻意去注意语法结构,即使有时你思维模式不是十分清晰甚至有些混乱的情况下,系统也会结合上下文的意思去理解你想要表达的含义,它还会利用人工智能来分析你的语句,来发现你所要表达的含义,并且能够在多数情况下理解我们的意思。
随着语音信号的高速发展,如今,在中小词汇数量非特定的人的语音信号识别系统和特定人的语音信号识别系统中的识别精确度已经达到了将近100%,这些技术已经完全能够满足许多应用的需求。伴随着大规模集成电路技术的发展,甚至在一块小小的芯片中也能看到语音识别系统的影子,它被安装在了几乎现在的每一部电话、每一部手机当中,正是因为有了它的辅助才能使手机拥有了语音搜索、语音拨号等功能。有些查询系统还开发出了新的功能,人们只需要通过电话网络就可以查询到订房信息、旅游信息、股票信息等。这些方便的功能让大部分使用的人们都感到相当的满意。