虽然英语虚拟助手已经实现了令人兴奋的表现,但具有巨大的培训资源,但非英语扬声器的需求并没有满足。截至2021年12月,Alexa是世界上最受欢迎的智能扬声器之一,能够支持9种不同的语言[1],而世界上有数千种语言,其中91人被超过1000万人所说根据2019年发布的统计数据[2]。但是,培训以其他语言的虚拟助手比英语更困难,特别是对于那些低资源语言而言。缺乏高质量的培训数据限制了模型的性能,导致用户满意度差。因此,我们使用与Bitod [5]相同的数据集生成管道和端到端对话系统体系结构设计了用于多语言任务的对话系统的高效且有效的培训解决方案,该系统为Bitod [5]采用了一些关键设计选择,以实现简约的自然语言使用正式对话状态的设计代替自然语言输入。这减少了较弱的自然语言模型所带来的错误的空间,并确保模型可以正确提取执行对话状态跟踪所需的基本槽值(DST)。我们的目标是减少每次转弯编码的自然语言量,以及我们调查的关键参数是将作为模型历史源的转弯(h)的数量。我们首先探索转折点,其中越来越多的H开始产生限制返回整体性能。然后,我们检查一个小型H错误是否错误的示例可以在模式下对模型进行分类,以便执行几次射门。最后,将探讨这种方法的局限性,以及是否存在这种方法无法解决的某种类型的例子。
translated by 谷歌翻译