文中配图来源于抖音。应受访者要求文中七七、南岸为化名。
近年来人工智能技术快速发展比较引人注目的包括智能语音技术、计算机视觉技术和自动语音识别技术等。其中自动语音识别简称语音识别是重要的组成部分。
其主要目标是把语音信号转变为相应的文字从而让机器具有听觉功能能够直接接收人的口语命令实现人机自然的交互。
语音识别是门交叉学科所涉及的领域有音频信号处理、声学、语言学、模式识别、人工智能等。
其应用领域也非常广涉及工业、军事、通信、消费电子等多个领域。在高度信息化的今天语音识别技术及其应用已成为信息社会不可或缺的基础设施。 语音识别过程是个复杂的过程但其最终的任务归结为:找到对应观察序列的最可能的词序列。
主流的语音识别系统理论是建立在统计模式识别基础之上的在统计模 特立尼达和多巴哥电话号码列表 型框架下可以用贝叶斯公式来描述语音识别问题。
根据贝叶斯决策理论我们的任务就是找到个最有的单词序列使得它在语音观察序列上的后验概率最大即: 上式中|是声学模型概率它描述的是段语音信号对应的声学特征和单词序列的相似程度。
是语言模型概率它描述的是单词序列可能出现的概率。 寻找最优的单词序列即在所有可能的单词序列候选中寻找使其声学模型和语言模型的概率乘积|最大。这中间包含个问题:第是如何遍历所有可能的单词序列;第二是如何计算声学模型概率。