智能论文笔记

A baseline model for computationally inexpensive speech recognition for Kazakh using the Coqui STT framework

Ilnar Salimzianov

分类：自然语言处理 | 机器学习

2021-07-19

移动设备正在转换人们与计算机交互的方式，以及对应用程序的语音接口更重要。最近发布的自动语音识别系统非常准确，但通常需要强大的机械（专业图形处理单元）推断，这使得它们在商品设备上运行不切实际，特别是在流模式下运行。通过对（Khassanov等人，2021）的基线哈萨克斯坦模型的推理时间（Khassanov等，2021）的推理时间留下了深刻的印象，我们训练了一个新的基线声学模型（在与上述纸上相同的数据集上）和三种语言模型用于COQUI STT框架。结果看起来很有希望，但进一步训练和参数扫描的时期，或者是限制ASR系统必须支持的词汇，以达到生产水平精度。

translated by 谷歌翻译

相关文章
笔记