没有发言者标签的培训扬声器 - 识别和强大的发言者验证系统仍然挑战和值得探索。在这项研究中,我们提出了一种有效的自我监督的学习框架和一种新的正规化策略,以促进自我监督的发言者代表学习。不同于基于对比的自我监督的学习方法,所提出的自我监督正则化(SSREG)专注于正数据对潜在的潜在表示之间的相似性。我们还探讨了替代在线数据增强策略对时域和频域的有效性。凭借我们强大的在线数据增强策略,所提出的SSREG显示了自我监督学习的潜力,而不使用负对对,它可以显着提高自我监督扬声器表示学习与简单的暹罗网络架构的表现。 VOXECEB数据集的综合实验表明,我们提出的自我监督方法通过增加有效的自我监督正则化和胜过其他以前的作品来获得23.4%的相对改善。
translated by 谷歌翻译