未来发展趋势
未来的语音市场主要从两个主要的方向发展,第一是关于语音技术的新发展,第二就是对于新的语音技术与旧的语音技术的新应用,下面就来说说语音信号的未来发展。
1、技术新发展
1)微软公司研究出了近二十年来语音信号识别方面杰出的突破:深层神经网络模式(DNN),在这个模式下,语音识别产生的错误降低了30%,这一突破可以说我目前语音识别技术最快的进步。当然除此之外为了提高声学模型的准确率,机器学习领域也被引入到了语音识别的研究当中,还有带RBM预训练的多层神经网络也被投入到语音识别的研究中去了,但他们都有同样的一个目的那就是提高语音识别的准确率。
2)现在基于有限状态机(WFST)的解码网络已经被许多主流的语音识别器所运用,它融合了语言模型,词典和声学共享音字集,统一集成了一个庞大的解码器,当所有的数据都集成在了一个网络中,那么它在解码的时候不需要再借助外界的数据,全部可以从本地的数据库中获得,大大的提高的解码的速度,为语音识别的研究分析与实际应用打下基础。
3)在科技和经济的双重高速发展下,电脑和手机已经不再是什么新鲜的东西了,已经被广泛地普及,信息流通的非常快,人们可以从很多途径获得语音资料,在网上已有的语音资料都可以成为语音识别分析的资源,以这些资源为基础甚至可以构建一个大规模的声学模型,在语音识别中需要分析许多不同的人的语音才能提高识别的准确度,而这一大笔语音资源将会成为推动语音处理技术进步的源动力。
2、技术新应用
最近语音技术的应用特别火热,特别是在手机上的各种语音应用,如讯飞语音识别、语音对话机器人、语音搜索、互动工具等应用被一一开发,许多公司都花费大量的人力、财力来对这方面进行研究与应用,通过对语音交互这种新兴应用的好奇与便利可以让他们更迅速的吸引到客户群体。
现在整个语音技术市场的规模已经非常大了,预计已经超过了30亿美元,并且近几年都连续增长,可以看出语音市场这个方面十分被看好,不止是电信行业(VoIP等)获得高速增长,特别是移动应用领域比如说:手机、学习机、平板电脑等各种关于语音的应用不断出现,让这些领域都呈现出了爆发式增长。下面列举几个近几年十分火热的语音产品/软件,它们也标志着大势所趋。
1、电信行业:电话银行系统
近年来在国外兴起了一种叫作电话银行系统的高新技术,它通过电话与客户紧密的联系在一起,使人们足不出户就能得到同样的服务,无论你何时何地,你只要拨打电话银行的号码,就能得到它所提供的服务,它是银行步入现代化经营的基础,通过它能够提高银行的服务质量,让人们更加轻松,不用再等那么多时间,然后增加客户,获得更好的经济效益,形成一个良性循环。
2、移动应用领域:Siri
苹果公司的一项语音控制功能的应用可以说是最近几年最优秀的语音应用,它的名字叫做Siri。通过Siri可以令苹果旗下的iPhone4S变身为一台微型的智能化机器人,Siri可实现许多功能如:手机读短信、手机语音报时、手机介绍餐厅、手机语音导航、用手机询问天气等功能。最主要的是Siri能支持自然语言输入,让你解放你的双手,并且系统还自带了许多强大的功能,而且它还能够不断学习各种不同的新的声音和语调,用来达到可以提供对话式的应答这一目的。
3、生活领域:由设计师思必驰设计的一款手机导游就是一个非常好的应用,它将会减少你许多出行旅游是的麻烦。它可以预先将每一个景区的地图存在里面,然后带领你从售票处到各个景点一一观赏。也预先存下了每个景点背后的故事,你可以先了解之后再凭个人喜好到不同的地方观赏。