确保措施:
大多数语音识别系统分配分数来假设为基层来行使目的。这些分数不提供或不充分表明他们是否有一个假设是正确的,只是因为这些假设优于其他。当我们按任务要求开始行动时,我们需要更好的方法来评估假设的绝对正确性。
超纲词汇:
系统设计使用一套特定的单词,但系统的用户可能不知道哪些词是属于词汇系统中的。这导致了某些自然条件下,超纲词汇占据了一定的百分比。系统必须有一些方法来检测超纲的词汇,否则最终将会从词汇单词映射到未知的单词,导致发生错误。
自发演讲:
系统部署的行为是一个真正处理各种常见的自发讲话的现象,如填充停顿,错误的开始,犹豫,在讲话中的不合语法的结构和其他没有发现的行为。 在飞机任务上的发展,意着在这一领域中的进展,但仍有许多工作要做。
韵律是指在一些片段或字组上加以扩大的声学结构。通过音量、语调和节奏来表达文字识别和用户意图的重要信息(例如,讽刺、愤怒)。目前的系统并不能识别韵律的结构。 如何把韵律信息整合到识别系统中来是一个尚未解决的关键性问题。
建模动态:
假设一个系统的输入,他们一般被视为独立的被帧序列。但据了解,对于文字和音素知觉线索的性质,其所需要整合的功能,反映了音节的动态,这是动态性的变动整合。如何做动态模型识别系统,并将其纳入到语音识别系统中来仍是个未解决的问题。