通过将机器学习算法应用于“大数据”,可以在manydomains中看到图像处理能力的快速发展。然而,在医学图像分析领域,由于大规模,注释良好的数据集的可用性有限,部分进展受到限制。造成这种情况的主要原因之一是与生产大量高质量元数据相关的高成本。最近,人们越来越关注为此目的应用众包;这种技术已经被证明可以有效地创建从计算机视觉到物理学的各个学科的大规模数据集。尽管这种方法越来越受欢迎,但还没有全面的文献综述为研究人员提供指导,以考虑在他们自己的医学成像分析中使用众包方法。在本次调查中,我们回顾了将众包应用于2018年7月之前发布的医学图像分析的研究。我们确定了常见的方法,挑战和考虑因素,为采用这种方法的研究人员提供了实用指南。最后,我们将讨论这一新兴领域的未来发展机遇。
translated by 谷歌翻译
我们专注于从输入RGB视频数据估计人手震颤频率的问题。估计视频中的震颤对于非侵入性监测,分析和诊断患有运动障碍(例如帕金森病)的患者非常重要。我们考虑手抖动估计的两种方法:(a)拉格朗日方法,我们在视频中检测手的每一帧,并估计沿着轨迹的震颤频率; (b)欧拉方法,我们首先定位手,随后沿着手的运动轨迹移除大运动,并且我们使用随时间编码的视频信息作为强度值或相位信息来估计震颤频率。我们估计新的人类震颤数据集TIM-Tremor上的手抖动,其中包含静态任务以及涉及手的较大运动的多个更动态的任务。该数据集具有55个震颤患者,共同记录:来自受影响的手的相关地面实况加速度计数据,RGB视频数据和对准的深度数据。
translated by 谷歌翻译
在监督学习任务中很好地推广依赖于正确地将训练数据扩展到输入空间的大区域。实现此目的的一种方式是将预测约束为已知不相关的输入上的不变的变换(例如,翻译)。通常,这是通过数据增强来完成的,其中通过将手工制作的变换应用于输入来扩大训练集。我们认为,不变性应该被合并到模型结构中,并使用边际可能性来学习,这正确地奖励了不变模型的复杂性降低。我们用高斯过程模型证明了这一点,因为它们可以很容易地估计它们的边际可能性。我们的主要贡献是高斯过程的变分推理方案,其中包含由采样过程描述的不变性。我们通过反向传播来学习采样过程,以最大化边缘似然。
translated by 谷歌翻译
概率生成模型可用于压缩,去噪,修复,纹理合成,半监督学习,无监督特征学习和其他任务。鉴于这种广泛的应用,这些模型的制定,培训和评估方式存在很多异质性并不令人惊讶。因此,模型之间的直接比较通常很困难。本文回顾了与生成模型的评估和解释相关的大多数已知但经常未被认可的属性,重点是图像模型。特别地,我们显示当前最常用的标准的三个 - 平均对数似然,Parzen窗口估计和样本的视觉保真度 - 在数据高维时在很大程度上彼此独立。因此,关于一个标准的良好性能不一定意味着与其他标准相关的良好性能。我们的结果表明,从一个标准到另一个标准的推断是不合理的,并且生成模型需要直接针对它们预期的应用进行评估。此外,我们提供了证明Parzen窗口估计通常应该被避免的示例。
translated by 谷歌翻译
在进化计算领域,最具挑战性的主题之一是算法选择。了解使用哪种启发式优化问题是获得高质量解决方案的关键。我们的目标是通过迈向自适应CAM-ES算法选择方法的第一步来扩展这个研究主题。我们建立在van Rijn \ textit {et al。} [PPSN'18]所做的理论工作的基础上,其中在模块化CMA-ES框架的背景下量化了不同CMA-ES变体之间切换的可能性。我们在这项工作中证明了他们提出的方法不是很可靠,因为实现建议的自适应配置并不会影响预测的性能增益。我们提出了一种经过修改的方法,可以更好地拟合预测性能和实际性能。自适应CMA-ES方法在BBOB基准测试的24个测试功能中有18个获得性能提升,稳定优势高达23%。对模块激活的分析表明哪些模块对于优化24个基准问题中的每一个的不同阶段最为关键。模块激活还表明,当包括(B)IPOP模块时,可以获得额外的增益,我们已将其排除在当前的工作之外。
translated by 谷歌翻译
今天拍摄的绝大多数照片都是通过手机拍摄的。虽然他们的质量正在迅速增长,但由于物理限制和成本限制,手机相机难以与DSLR相机进行质量比较。这激励我们计算增强这些图像。我们对Ignatov等人的研究结果进行了扩展,他们能够将紧凑型移动摄像机的图像转换为质量与DSLR相机拍摄的高分辨率照片相当的图像。然而,所采用的神经模型需要大量的计算资源,并且不足以在移动设备上运行。我们在之前的工作基础上,探索不同的网络架构,旨在提高图像质量和速度。凭借高效的网络架构,它以低空间分辨率完成大部分处理,我们获得了比基线高得多的平均意见得分(MOS),同时在消费级CPU上将计算速度提高了6.3倍。这表明使用未来的手机硬件进行基于神经网络的照片增强的有希望的方向。
translated by 谷歌翻译
信息理论贝叶斯对鲁索和范罗伊的后悔束缚了对先前不确定性的遗憾依赖性。然而,这种依赖性是熵,随着动作数量的增加,它可以变得任意大。我们建立了新的界限,而不是依赖于速率 - 失真的概念。在其他方面,这使我们能够通过信息理论论证恢复近似线性强盗的最佳界限。我们还提供了一个物流强盗的约束,它可以显着提高以前最好的可用性,尽管这个界限取决于我们只能通过计算量化的信息理论统计量。
translated by 谷歌翻译
从图像中自动消除雨水效果有许多应用,例如自动驾驶,无人机驾驶和照片编辑,并且仍然吸引了许多人的注意力。传统方法使用启发式手工制作各种先验,以从图像中移除或分离雨效果。最近提出了基于端到端深度学习的去除方法以提供更大的灵活性和有效性。然而,当遇到大雨的图像时,它们往往不会获得良好的视觉效果。大雨带来了不仅有雨的条纹,还有由于微小雨滴积聚而产生的雾状效应。与以往的去除方法不同,在本文中,我们使用新的雨模型来模拟雨水图像,不仅可以去除雨水条纹,还可以消除类似雾霾的效果。在我们的模型的指导下,我们设计了一个双分支网络来容忍其参数。然后,联合训练SPP结构以改进我们模型的结果,以便灵活地控制去除雾状效果的程度。此外,提出了一种可以定位雨天像素的子网,以指导我们的网络训练。在几个数据集上的广泛实验表明,我们的方法在目标评估和视觉质量方面都优于最先进的技术。
translated by 谷歌翻译
我们考虑使用成对比较来搜索一组项目的问题。我们的目标是通过询问表格“来自货币对中哪一项$(i,j)$更类似于t?”的oracle问题来定位目标项目$ t $。我们假设盲目设置,没有项目功能可用于指导搜索过程;只有oracle看到这些特征才能产生答案。这个问题的先前方法要么采取无噪音的答案,要么在项目数量上表现不佳,这两者都排除了实际的应用。在本文中,我们提出了一个新的可扩展学习框架,称为learn2search,尽管答案中存在噪声,但仍对一组项目执行基于比较的有效搜索。项目存在于一个特征空间中,我们为oracle提供了一个概率模型,比较目标$ t $的$ i $和$ j $项目。我们的算法保持其对项目空间的表示,它基于过去的搜索逐渐学习。我们评估了Learning2search在合成和现实世界数据上的表现,并表明它学习搜索越来越高效,随着时间的推移匹配一个方案的性能与访问theitem功能。
translated by 谷歌翻译
We propose to learn a hierarchical prior in the context of variational autoencoders to avoid over-regularisation resulting from a standard normal prior distribution. To incentivise an informative latent representation of the data by learning a rich hierarchical prior, we formulate the objective function as the Lagrangian of a constrained-optimisation problem and propose an optimisation algorithm inspired by Taming VAEs. To validate our approach, we train our model on the static and binary MNIST, Fashion-MNIST, OMNIGLOT, CMU Graphics Lab Motion Capture, 3D Faces, and 3D Chairs datasets, obtaining results that are comparable to state-of-the-art. Furthermore, we introduce a graph-based interpolation method to show that the topology of the learned latent representation correspond to the topology of the data manifold.
translated by 谷歌翻译