鉴于对计算资源的限制(例如,模型大小,跑步内存)的限制,不断学习新课程而没有灾难性遗忘是一个具有挑战性的问题。为了解决这个问题,我们提出了一种简单有效的持续学习方法。我们的方法通过测量按样本分类不确定性来选择培训的历史数据。具体而言,我们通过观察数据的分类概率如何与添加到分类器嵌入中的平行扰动相比如何波动来测量不确定性。通过这种方式,与将扰动添加到原始数据相比,计算成本可以大大降低。 DCASE 2019任务1和ESC-50数据集的实验结果表明,我们所提出的方法优于基准的分类准确性和计算效率的基线连续学习方法,表明我们的方法可以有效,可以逐步学习新的课程,而无需用于灾难性环境的灾难性遗忘问题声音分类。
translated by 谷歌翻译
该技术报告描述了surreyaudioteam22s Dcase 2022 ASC任务1,低复杂性声学场景分类(ASC)。该任务有两个规则,(a)ASC框架应具有最大128K参数,并且(b)每个推理最多应有3000万次多功能操作(MAC)。在本报告中,我们为ASC提供了遵循该任务规则的ASC的低复杂系统。
translated by 谷歌翻译
本文提出了用于声学场景分类(ASC)的低复杂框架。与手工设计的功能相比,大多数旨在ASC设计的框架使用卷积神经网络(CNN)。但是,CNN由于其尺寸较大和计算复杂性而渴望资源。因此,CNN难以在资源约束设备上部署。本文解决了减少CNN中计算复杂性和内存需求的问题。我们提出了一个低复杂性CNN体系结构,并应用修剪和量化以进一步减少参数和内存。然后,我们提出了一个合奏框架,该框架结合了各种低复杂性CNN,以提高整体性能。对拟议框架进行的实验评估是对关注ASC的公开DCASE 2022任务1进行的。所提出的合奏框架的参数约为60k,需要19m的多功能操作,并且与Dcase 2022 Task 1基线网络相比,该性能提高了约2-4个百分点。
translated by 谷歌翻译
本文介绍了一个学会通过听示例来唱新音乐的系统。它从输入音乐中提取排序规则,并使用这些规则来生成新的曲调,这些曲调由人声合成器演唱。我们开发了一种表示音乐作品规则作为量子电路的方法。我们声称这种音乐规则是量子本地的:它们在量子状态的幅度中自然可以编码。为了评估一条规则以生成后续事件,系统会动态构建相应的量子电路并测量它。在简短讨论了我们一直在实验的人声合成方法之后,本文通过一个实践示例介绍了我们的新颖生成音乐方法。本文展示了一些实验,并以讨论利用系统的创造潜力进行了讨论。
translated by 谷歌翻译
新磁共振(MR)成像方式可以量化血流动力学,但需要长时间的采集时间,妨碍其广泛用于早期诊断心血管疾病。为了减少采集​​时间,常规使用来自未采样测量的重建方法,使得利用旨在提高图像可压缩性的表示。重建的解剖和血液动力学图像可能存在视觉伪影。尽管这些工件中的一些基本上是重建错误,因此欠采样的后果,其他人可能是由于测量噪声或采样频率的随机选择。另有说明,重建的图像变为随机变量,并且其偏差和其协方差都可以导致视觉伪影;后者会导致可能误解的空间相关性以用于视觉信息。虽然前者的性质已经在文献中已经研究过,但后者尚未得到关注。在这项研究中,我们研究了从重建过程产生的随机扰动的理论特性,并对模拟和主动脉瘤进行了许多数值实验。我们的结果表明,当基于$ \ ell_1 $ -norm最小化的高斯欠采样模式与恢复算法组合时,相关长度保持限制为2到三个像素。然而,对于其他欠采样模式,相关长度可以显着增加,较高的欠采样因子(即8倍或16倍压缩)和不同的重建方法。
translated by 谷歌翻译
深度生成模型的最新进展导致了3D形状合成的巨大进展。虽然现有模型能够合成表示为体素,点云或隐式功能的形状,但这些方法仅间接强制执行最终3D形状表面的合理性。在这里,我们提出了一种直接将对抗训练施加到物体表面的3D形状合成框架(Surfgen)。我们的方法使用可分解的球面投影层来捕获并表示隐式3D发生器的显式零IsoSurface作为在单元球上定义的功能。通过在对手设置中用球形CNN处理3D对象表面的球形表示,我们的发电机可以更好地学习自然形状表面的统计数据。我们在大规模形状数据集中评估我们的模型,并证明了端到端训练的模型能够产生具有不同拓扑的高保真3D形状。
translated by 谷歌翻译
本文介绍了一种基于AutoEncoder的无监督方法,用于使用机器产生的声音在工业机器中识别异常。使用声音信号的Log-MelspectRoge表示训练所提出的框架。在分类中,我们的假设是,为异常机器计算的重建误差大于正常机器的重建误差,因为只用于训练AutoEncoder的普通机器声音。选择阈值以区分正常和异常的机器。然而,阈值变化为周围条件不同。为了选择适当的阈值,无论周围如何,我们都会提出一个场景分类框架,可以对底层周围分类。因此,无论周围如何,都可以自适应地选择阈值。实验评估是在工业机器的MIMII数据集上进行,即风扇,泵,阀门和滑轨。我们的实验分析表明,利用自适应阈值,性能显着改善,因为仅使用针对给定周围的固定阈值获得的。
translated by 谷歌翻译