计算机辅助诊断通常需要分析放射学扫描内的感兴趣区域(ROI),并且ROI可以是器官或子机构。虽然深入学习算法具有优于其他方法的能力,但它们依赖于大量注释数据的可用性。通过解决这一限制的需要,这里提出了一种基于监督和半监督学习的多个器官的定位和检测的方法。它借鉴了作者在CT图像中定位胸椎和腰椎区域的工作者。该方法生成六个感兴趣的器官的边界框,然后将其融合到单个边界框。使用受监督和半监督学习(SSL)在CT图像中的脾脏,左和右肾定位的实验结果证明了与其他状态相比,以更小的数据集和更少的注释来解决数据限制的能力。最新方法。使用三种不同的标记和未标记的数据(即30:70,35:65,40:60)评估SSL性能,分别为腰椎,脾脏左和右肾的每种。结果表明,SSL提供了可行的替代方案,特别是在医学成像中,难以获得注释数据。
translated by 谷歌翻译
在本文中,我们考虑了使用嘈杂的中间量子量子(NISQ)设备的几种用于量子计算机视觉的算法,并将它们基于对其经典对应物的真正问题进行基准测试。具体而言,我们考虑了两种方法:基于通用门的量子计算机上的量子支持向量机(QSVM),以及Qubost在量子退火器上。量子视觉系统是针对图像不平衡数据集进行基准测试的,其目的是检测制成的汽车件中的缺陷。我们看到,量子算法以几种方式优于其经典对应物,QBoost允许使用当今的量子退火器分析更大的问题。还讨论了数据预处理,包括降低维度和对比度增强,以及Qboost中的超参数调整。据我们所知,这是量子计算机视觉系统的首次实施,用于制造生产线中的工业相关性问题。
translated by 谷歌翻译
利用梯度泄漏以重建据称为私人培训数据,梯度反演攻击是神经网络协作学习的无处不在威胁。为了防止梯度泄漏而不会遭受模型绩效严重损失的情况,最近的工作提出了一个基于变化模型作为任意模型体系结构的扩展的隐私增强模块(预编码)。在这项工作中,我们研究了预言对梯度反转攻击的影响,以揭示其基本的工作原理。我们表明,各变化建模会引起预科及其随后的层梯度的随机性,从而阻止梯度攻击的收敛性。通过在攻击优化期间有目的地省略那些随机梯度,我们制定了一种可以禁用Precode隐私保护效果的攻击。为了确保对这种有针对性攻击的隐私保护,我们将部分扰动(PPP)提出,作为变异建模和部分梯度扰动的战略组合。我们对四个开创性模型架构和两个图像分类数据集进行了广泛的实证研究。我们发现所有架构都容易梯度泄漏,可以通过PPP预防。因此,我们表明我们的方法需要较小的梯度扰动才能有效地保留隐私而不会损害模型性能。
translated by 谷歌翻译
当通过玻璃等半充实介质进行成像时,通常可以在捕获的图像中找到另一个场景的反射。它降低了图像的质量并影响其后续分析。在本文中,提出了一种新的深层神经网络方法来解决成像中的反射问题。传统的反射删除方法不仅需要长时间的计算时间来解决不同的优化功能,而且不能保证其性能。由于如今的成像设备可以轻松获得数组摄像机,因此我们首先在本文中建议使用卷积神经网络(CNN)采用基于多图像的深度估计方法。提出的网络避免了由于图像中的反射而引起的深度歧义问题,并直接估计沿图像边缘的深度。然后,它们被用来将边缘分类为属于背景或反射的边缘。由于具有相似深度值的边缘在分类中易于误差,因此将它们从反射删除过程中删除。我们建议使用生成的对抗网络(GAN)来再生删除的背景边缘。最后,估计的背景边缘图被馈送到另一个自动编码器网络,以帮助从原始图像中提取背景。实验结果表明,与最先进的方法相比,提出的反射去除算法在定量和定性上取得了出色的性能。与使用传统优化方法相比,所提出的算法还显示出比现有方法相比的速度要快得多。
translated by 谷歌翻译
由摩尔定律驱动的计算系统性能的改善已改变了社会。由于这种硬件驱动的收益放缓,对于软件开发人员而言,专注于开发过程中的性能和效率变得更加重要。尽管几项研究表明了这种提高的代码效率的潜力(例如,与硬件相比,2倍更好的世代改进),但在实践中解锁这些收益是充满挑战的。关于算法复杂性以及硬件编码模式的相互作用的推理对于普通程序员来说可能是具有挑战性的,尤其是当与围绕开发速度和多人发展的务实约束结合使用时。本文旨在解决这个问题。我们分析了Google Code JAM竞争中的大型竞争编程数据集,并发现有效的代码确实很少见,中位数和第90%的解决方案之间的运行时间差异为2倍。我们建议使用机器学习以提示的形式自动提供规范反馈,以指导程序员编写高性能代码。为了自动从数据集中学习这些提示,我们提出了一种新颖的离散变异自动编码器,其中每个离散的潜在变量代表了不同的代码编辑类别,从而提高了性能。我们表明,此方法代表代码效率的多模式空间比序列到序列基线更好地编辑,并生成更有效的解决方案的分布。
translated by 谷歌翻译
本文涉及分割中的伪标记。我们的贡献是四倍。首先,我们提出了伪标签的新表述,作为一种预期最大化(EM)算法,用于清晰的统计解释。其次,我们纯粹基于原始伪标记,即Segpl,提出了一种半监督的医学图像分割方法。我们证明,SEGPL是针对针对2D多级MRI MRI脑肿瘤分段任务和3D二进制CT肺部肺血管分段任务的半监督分割的最新一致性正则方法的竞争方法。与先前方法相比,SEGPL的简单性允许更少的计算成本。第三,我们证明了SEGPL的有效性可能源于其稳健性抵抗分布噪声和对抗性攻击。最后,在EM框架下,我们通过变异推理引入了SEGPL的概率概括,该推论学习了训练期间伪标记的动态阈值。我们表明,具有变异推理的SEGPL可以通过金标准方法深度集合在同步时执行不确定性估计。
translated by 谷歌翻译
准确地估算主要山区盆地中的积雪对于水资源经理来说至关重要,以便做出影响当地和全球经济,野生动植物和公共政策的决策。目前,此估计需要多个配备LIDAR的飞机飞行或原位测量值,两者均昂贵,稀疏和对可访问区域有偏见。在本文中,我们证明了来自多个,公开可用的卫星和天气数据源的空间和时间信息的融合,可以估算关键山区的积雪。我们的多源模型的表现优于单源估计值5.0英寸RMSE,并且优于稀疏的原位测量值的估计值1.2英寸RMSE。
translated by 谷歌翻译
在本章中,提出了用于获得与任务相关的,多分辨率的,环境抽象的问题的整数线性编程公式,用于资源受限的自主剂。该公式从信息理论信号压缩(特别是信息瓶颈(IB)方法)中利用概念来提出抽象问题,作为在多分辨率树的空间上的最佳编码器搜索。抽象以与任务相关的方式出现,作为代理信息处理约束的函数。我们详细介绍我们的配方,并展示如何以共同的主题统一信号压缩的层次结构结构,信号编码器和信息理论方法。提出了一个讨论来描述我们配方的好处和缺点的讨论,以及详细的解释,如何在为资源受限的自主系统生成抽象的背景下解释我们的方法。结果表明,在多分辨率树空间中所得的信息理论抽象问题可以作为整数线性编程(ILP)问题进行配合。我们在许多示例上演示了这种方法,并提供了与现有方法相比,详细说明所提出框架的差异的讨论。最后,我们考虑了ILP问题的线性程序放松,从而证明可以通过求解凸程序来获得多分辨率信息理论树抽象。
translated by 谷歌翻译
诊断将音频流划分为基于扬声器的声音。包括入学步骤的实时诊断系统应限制入学培训样本,以减少用户交互时间。尽管对少数样品的培训产生的性能较差,但我们表明,使用年代自我训练方法可以大大提高准确性。我们研究了训练时间和分类性能之间的权衡,发现1秒足以达到超过95%的精度。我们从6种不同的语言中评估了700个音频对话文件约10分钟,并证明平均诊断错误率低至10%。
translated by 谷歌翻译
许多用于反问题和数据同化的现代算法都依赖于集成Kalman更新,以将先前的预测与观察到的数据融为一体。合奏Kalman方法通常具有小的合奏尺寸,这在生成每个粒子成本高昂的应用中至关重要。本文对合奏Kalman更新进行了非反应分析,该分析严格地解释了为什么由于快速衰减或近似稀疏性而导致先前的协方差具有适度的有效尺寸,那么小合奏的大小就足够了。我们在统一的框架中介绍了我们的理论,比较了使用扰动观测值,平方根滤波和本地化的集合卡尔曼更新的几个实现。作为我们分析的一部分,我们为可能具有独立感兴趣的大约稀疏矩阵开发了新的无维度协方差估计界限。
translated by 谷歌翻译