鉴于最近深度学习的发展激增,本文提供了对音频信号处理的最新深度学习技术的回顾。语音,音乐和环境声音处理被并排考虑,以指出领域之间的相似点和不同点,突出一般方法,问题,关键参考和区域之间相互交流的可能性。回顾了主要特征表示(特别是log-mel光谱和原始波形)和deeplearning模型,包括卷积神经网络,长期短期记忆体系结构的变体,以及更多音频特定的神经网络模型。随后,涵盖了突出的深度学习应用领域,即音频识别(自动语音识别,音乐信息检索,环境声音检测,定位和跟踪)和合成与转换(源分离,音频增强,语音,声音和音乐合成的生成模型)。最后,确定了应用于音频信号处理的深度学习的关键问题和未来问题。
translated by 谷歌翻译
临床诊断决策和基于人群的研究通常依赖于嘈杂且不完整的多模态数据。最近,一些工作提出了几何深度学习方法来解决疾病分类,通过将患者建模为图中的节点,以及多模态特征的图形信号处理。这些方法中的许多方法受到假设模态和特征完整性以及转换推理的限制,转导推理需要对每个新测试样本重新训练整个模型。在这项工作中,我们提出了一种新颖的基于感应图的方法,可以推广到样本外的患者,尽管缺少整个病房的特征。我们提出了多模态图融合,它是经过端到端的节点级分类训练。我们在简化的MNIST玩具数据集上展示了该方法的基本工作原理。在医学数据实验中,我们的方法在多模态疾病分类中优于单一静态图方法。
translated by 谷歌翻译
最近,几何深度学习(GDL)被引入作为计算机辅助疾病分类的新型和多样化框架。 GDL使用患者的信息(例如年龄和性别)来模拟agraph结构中的患者群组关系。利用来自图形信号处理的概念来学习多模态特征的最佳映射,例如,从图像到疾病等级。到目前为止,相关研究已经考虑了在预处理步骤中提取的图像特征。我们假设这种方法可以防止网络优化特征表示,从而在图形网络中实现最佳性能。我们提出了一种新的网络体系结构,该体系结构利用归纳的端到端学习方法进行疾病分类,其中来自CNN和图的过滤器被联合训练。我们针对最先进的感应图网络验证了这种架构,并证明了在改进的MNIST玩具数据集上的显着改进的分类核心,以及在胸部X射线图像数据集上具有更高稳定性的可比较的分类结果。另外,我们解释了图形的结构信息如何影响图像过滤器和特征学习。
translated by 谷歌翻译
深度计算机视觉系统容易受到难以察觉和精心制作的噪音的影响,这引发了人们对其决策稳健性的质疑。我们退后一步,从正交方向处理这个问题。我们建议通过利用属性来使黑盒神经网络能够证明它们对于清洁和对抗性例子的合理性,即。物体的视觉辨别属性。我们基于他们的类相关性对属性进行排名,即,当输入被视觉上轻微扰动时分类决策如何改变,以及图像相关性,即属性可以如何很好地定位在干净和扰动的图像上。我们提出了使用三个基准数据集上的预测属性进行属性预测,对抗性示例生成,对抗性稳健学习以及定性和定量分析的综合实验。
translated by 谷歌翻译
神经网络在各种实际应用中的应用正在改变AI在实践中的应用方式。通过API提供的预训练神经网络模型或使用客户数据定​​制训练预构建的神经网络架构的能力使得开发人员对AI的消耗更加简单,并且导致这些复杂AI模型的广泛采用。虽然针对某些场景存在预构建的网络模型,但为了尝试满足每个应用程序独有的约束,AI团队需要关注开发自定义神经网络架构,以满足精度和内存占用之间的关系,以实现其独特用例的严格限制。然而,只有一小部分数据科学团队拥有从划痕创建神经网络所需的技能和经验,而且需求远远超过供应。在本文中,我们介绍了NeuNetS:一种用于自定义神经网络设计的自动化神经网络综合引擎,可作为IBM的OpenScale产品的一部分提供.NeuNetS可用于文本和图像域,并且可以在很短的时间内为特定任务构建神经网络今天需要humaneffort,并且精确度与人工设计的AI模型类似。
translated by 谷歌翻译
在这项工作中,我们报告了结合IEEE国际生物医学成像研讨会(ISBI)2016和国际医学影像计算机辅助干预会议(MICCAI)2017年组织的肝肿瘤分割基准(LITS)的设置和结果。将24种有效的最先进的肝脏和肝脏肿瘤分段算法应用于一组131个计算机断层扫描(CT)体积,具有不同类型的肿瘤对比度水平(高强度/低强度),组织异常(转移瘤)大小和不同程度的病变。已提交的算法已在70个未公开的卷上进行了测试。该数据集是与七家医院和研究机构合作创建的,由三位独立的放射科医师手动审查。我们发现没有一种算法对肝脏和肿瘤表现最佳。最佳肝脏分割算法的Dice评分为0.96(MICCAI),而对于肿瘤分割,最佳算法评估为0.67(ISBI)和0.70(MICCAI)。 LITS图像数据和手动注释继续通过在线评估系统公开提供,作为持续的基准测试资源。
translated by 谷歌翻译
是否优先于进化游戏中的缺陷进行合作,可以通过任何合作者和叛逃者的任何安排的结构系数来指定在任何被建模为规则图的网络上。我们研究了这些结构系数如何与社交困境博弈中的两难强度的缩放相关联。结果表明,一些图表允许合作者和叛逃者的某些安排具有特别大的结构系数。此外,这些大系数意味着特定大部分的丰富参数平面跨越了赌博意图和避免风险的两难强度。
translated by 谷歌翻译
量子误差校正被广泛认为是容错量子计算的关键。然而,确定最适合的unknownerror通道或特定实验室设置的编码是非常具有挑战性的。在这里,我们提出了一个强化学习框架,用于优化和容错性地适应量子纠错码。我们考虑一个强化学习者,其任务是修改量子存储器,直到达到所需的逻辑错误率。使用具有70个物理量子比特的表面码量子存储器的有效模拟,我们证明了对于各种感兴趣的误差模型,这种强化学习者可以根据物理量子位的数量来确定近似最优解。此外,我们表明,一个任务的代理能够将他们的经验转移到类似的任务。这种转移学习的能力展示了强化学习的内在优势和我们的优化方法的适用性,无论是在离线模拟还是在实验室条件下在线。
translated by 谷歌翻译
数据科学需要耗时的迭代手动活动。特别是,数据选择,预处理,转换和挖掘等活动高度依赖于迭代的试错过程,这些过程可以通过提供有关变更影响的快速反馈来显着提高。渐进式数据科学的理论是以渐进的方式计算变化的结果,快速返回结果的第一近似值并允许迭代细化直到收敛到最终结果。使用户能够与中间结果进行交互,可以及早发现错误或次优的选择,对管道修改的指导定义及其快速评估。在本文中,我们讨论了数据科学管道不同步骤中出现的渐进性挑战。我们将描述管道每个步骤的变化如何影响后续步骤,并概述为什么渐进式数据科学将有助于提高流程的效率。计算由变化引起的结果的渐进近似会产生许多研究挑战,特别是如果在管道的早期阶段进行改变的话。我们讨论了这些挑战,并概述了迈向渐进的第一步,我们认为,这最终将有助于显着加速整个数据科学过程。
translated by 谷歌翻译
诸如深度神经网络之类的分类器已经被证明是对高维输入空间问题的对抗性扰动是脆弱的。虽然对抗性训练提高了图像分类器对这种对抗性扰动的鲁棒性,但它使得它们对不可忽略的输入部分的扰动敏感。在这项工作中,我们展示了对抗性训练在防止普遍扰动方面更有效,其中相同的扰动需要在许多输入上欺骗分类器。此外,我们研究了针对通用扰动的稳健性和无干扰数据的性能之间的权衡,并提出了对抗训练的延伸,以更优雅地处理这种权衡。我们提出了图像分类和语义分割的结果,以便欺骗模型硬化的普遍扰动有趣的训练变得清晰可见,并显示出目标的模式。
translated by 谷歌翻译