摘要说话人识别是指通过说话人的语音来自动识别说话人的身份,说话人识别是语音识别的一种特殊方式,其目的不是识别语音内容,而是识别说话人是谁。本论文中,将主要介绍说话人识别系统。通过采用VQ(Vector Quantization,矢量量化)算法,对说话人的识别进行了探究与仿真实验,实现了在MATLAB软件环境下说话人的语音识别。63605
本文通过分析说话人识别基本原理与系统结构,考察现有的说话人识别技术 选择了vq算法对说话人识别进行仿真,VQ算法基于LBG算法的思想,首先解决了矢量量化码书生成的问题,设计一个好的码本;其次是解决了未知矢量量化的问题。最后是判决逻辑,识别结果输出,实现了MATLAB软件环境下说话人语音识别。
毕业论文关键词:语音识别, 说话人识别, VQ, MATLAB, LBG算法
毕业设计说明书(论文)外文摘要
Abstract Speaker Recognition is defined by the speaker's voice to automatically identify the speaker's identity. Speaker recognition is a kind of special way of Voice-identifications . Its purpose is not recognized speech content, but identify who is the speaker. The paper is going to introduce speaker recognition. In this paper,VQ arithmetic is adapted to study and be simulation experiment.The identification of speaker, and speech recognition for speaker is realized by using MATLAB.
This paper analyzes the basic principles of speaker recognition system architecture,Investigate the existing speaker recognition technology. This paper,VQ arithmetic is adapted to be simulation experiment VQ arithmetic based on the method of LBG has solved the problems that set up good codebook of vector Quantization and quantization unknown vector. After compared ,the output of recognition is putout.Then the identification of speaker, and Speech recognition for speaker is realized by using MATLAB.
Key words: Voice-Identification , Speaker-recognition, VQ, MATLAB, LBG- arithmetic
目 录
1 引言 1
2 说话人识别技术的概述 3
2.1 说话人识别的原理 4
2.2说话人识别的方法 6
3 系统中VQ算法实现 7
3.1 VQ算法原理 7
3.2 VQ算法实现 12
3.2.1 VQ算法简介 12
3.2.2 程序运行流程 12
3.2.3 运行结果 14
4 实验结果及分析 15
总结 18
致谢 19
参考文献 20
附录A:源主程序 21
附录B: 对信号s1和s2经过各种变换后的图形 22
1. 引言
说话人识别属于生物识别技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。说话人识别和语音识别的区别在于,它不注重包含在语音信号中的文字符号以及语义内容信息,而是着眼于包含在语音信号中的个人特征,提取说话人的这些个人信息特征,以达到识别说话人的目的。
1.2 说话人识别的应用前景
说话人识别可以用于说话人身份未知,而说话人的身份问题又很重要的场合。用语音来鉴别说话人的身份有着许多独特的优点,如语音是人的固有特征,不会丢失或遗忘;语音信号的采集方便,系统设备成本低;另外利用电话网络还可以实现远程客户服务等。
通过说话人识别技术,可以利用认本身的生物特性进行身份鉴别,例如为公安部门进行语音验证,为一般用户提供防盗门开启功能等。在互联网应用及通信领域,说话人识别技术可以应用于诸如语音拨号、电话银行、电话购物、数据库访问、信息服务、语音E-mail、安全控制、计算机远程登陆等领域。在呼叫中心应用上,说话人识别技术同样可以提供更加个性化的人机交互界面。当顾客以电话方式对呼叫中心进行请求时,系统能够根据话音判断出顾客的身份,从而提供更个性化、更贴心的服务。另外,在军事领域,可以用于战场上的侦听,以辨认出敌方的指挥员。在医疗领域,可以用于患者的确认等等。