与以前的工作不同,这种开放式数据采集包括专为机器学习应用和高锥角人工制品减少而设计的X射线锥束(CB)计算机断层扫描(CT)数据集。用实验室X射线设置扫描42个核桃,不仅提供来自单个物体的数据,而且提供具有自然变化的一类物体的数据。对于每个核桃,获得了三个不同源轨道上的CB投影,提供了具有不同锥角的CB数据,并且能够从可以用于监督学习的组合数据中计算无物质,高质量的地面实况图像。我们提供完整的图像重建管道:原始投影数据,扫描几何描述,使用开放软件的预处理和重建脚本,以及构建的体积。因此,数据集不仅可以用于高角度伪影减少,还可以用于其他任务的算法开发和评估,例如从有限或稀疏角度(低剂量)扫描,超分辨率或分割的图像重建。
translated by 谷歌翻译
We propose to learn a hierarchical prior in the context of variational autoencoders to avoid over-regularisation resulting from a standard normal prior distribution. To incentivise an informative latent representation of the data by learning a rich hierarchical prior, we formulate the objective function as the Lagrangian of a constrained-optimisation problem and propose an optimisation algorithm inspired by Taming VAEs. To validate our approach, we train our model on the static and binary MNIST, Fashion-MNIST, OMNIGLOT, CMU Graphics Lab Motion Capture, 3D Faces, and 3D Chairs datasets, obtaining results that are comparable to state-of-the-art. Furthermore, we introduce a graph-based interpolation method to show that the topology of the learned latent representation correspond to the topology of the data manifold.
translated by 谷歌翻译
由于最近在处理速度和数据采集和存储方面的进步,机器学习(ML)正在渗透我们生活的方方面面,并从根本上改变了许多领域的研究。无线通信是另一个成功的故事 - 在我们的生活中无处不在,从手持设备到可穿戴设备,智能家居和汽车。虽然近年来在为各种无线通信问题利用ML工具方面看到了一系列研究活动,但这些技术对实际通信系统和标准的影响还有待观察。在本文中,我们回顾了无线通信系统中ML的主要承诺和挑战,主要关注物理层。我们提出了ML技术在经典方法方面取得的一些最令人瞩目的近期成就,并指出了有希望的研究方向,其中ML可能在不久的将来产生最大的影响。我们还强调了在无线网络边缘设计物理层技术以实现分布式ML的重要问题,这进一步强调了理解和连接ML与无线通信中的基本概念的需要。
translated by 谷歌翻译
颅骨剥离被定义为从全头磁共振图像〜(MRI)分割脑组织的任务。它是神经图像处理管道中的关键组件。下游可变形配准和全脑分割性能高度依赖于准确的颅骨剥离。由于该年龄段头部和大脑的显着大小和形状可变性,因此对于婴儿〜(年龄范围0-18个月)头部MRI图像来说,刀片剥离是一项特别具有挑战性的任务。范围。随着时间的推移,婴儿脑组织的发育也会改变$ T_1 $加权图像的对比度,这使得一致的人们难以接受任务。用于成人脑部MRIsullstripping的现有工具不具备处理这些变化的能力,并且需要专门的婴儿MRI头部剥离算法。在本文中,我们描述了asupervised skullstripping算法,该算法利用三个训练的完全卷积神经网络〜(CNN),每个神经网络分别在轴向,冠状和矢状视图中分割2D $ T_1 $加权的视图。三个视图中的三个概率分割是线性融合和阈值化以产生最终的大脑掩模。我们将我们的方法与现有成人和婴儿颅骨剥离算法进行了比较,并且基于骰子重叠度量〜(平均骰子为0.97)和手动标记的背景真实数据集显示出显着的改善。在多个未标记的数据集上进行标签融合实验表明,我们的方法是一致的,故障模式较少。此外,我们的方法计算速度非常快,在NVidia P40 / P100 / Quadro 4000 GPU上运行时间为30秒。
translated by 谷歌翻译
广泛的机器学习问题被公式化为对某些参数空间上的凸损失函数的期望的最小化。由于感兴趣的数据的概率分布通常是未知的,因此它是从训练集中估计的,这可能导致不良的样本外性能。在这项工作中,我们通过使用已经在风险度量的定量融资中开发的框架来为这个问题带来新的见解。我们表明原始的最小 - 最大问题可以在适当的假设下重新构造为凸最小化问题。我们讨论了几个鲁棒公式的重要示例,特别是通过定义基于$ \ varphi $ -divergences和Wasserstein度量的模糊集。我们还提出了一种有效的算法来解决复杂凸约束中的相应凸优化问题。通过仿真实例,我们证明该算法在实际数据集上可以很好地扩展。
translated by 谷歌翻译
事件相机是新颖的,生物启发的视觉传感器,其像素在局部强度变化时输出异步和独立的时间戳尖峰,称为“事件”。在延迟,高动态范围(HDR)和时间分辨率方面,事件相机提供优于传统基于帧的相机的优势。最近,事件相机仅限于在强度通道中输出事件,然而,最近的进展导致了颜色事件的发展。相机,如Color-DAVIS346。在这项工作中,我们提出并发布第一个彩色事件相机数据集(CED),包含50分钟的彩色帧和事件。 CED具有各种各样的室内和室外场景,我们希望这将有助于推动基于事件的视觉研究。我们还提供了事件相机模拟器ESIM的扩展,可以模拟颜色事件。最后,我们对三种最先进的图像重建方法进行了评估,这些方法可用于将Color-DAVIS346转换为连续时间的HDR彩色摄像机,以便对事件流进行可视化,并用于下游视觉应用。
translated by 谷歌翻译
事件相机是新颖的传感器,以异步“事件”而不是强度帧的形式报告亮度变化。它们具有优于传统相机的显着优点:高时间分辨率,高动态范围和无运动模糊。由于事件摄像机的输出基本上与传统摄像机不同,因此普遍认为它们需要开发专门的算法以适应事件的特定性质。在这项工作中,我们采取不同的观点,并建议将现有的,成熟的计算机视觉技术应用于从eventdata重建的视频。我们提出了一种新颖的循环网络,用于从事件流中重建视频,并在大量模拟事件数据上进行训练。 Ourexperiments表明,我们的方法在图像质量方面超过了最先进的重建方法(> 20%)。我们进一步将现成的计算机视觉算法应用于从事件数据重建的视频,例如对象分类和视觉惯性测距,并显示该策略始终优于我们为事件数据专门设计的算法。我们相信,我们的方法打开了将事件相机的出色属性带入全新任务的门户。可以通过以下网址获得实验视频://youtu.be/IdYrC4cUO0I
translated by 谷歌翻译
对于我们提交到ZeroSpeech 2019挑战,我们将离散的变量神经网络应用于未标记的语音,并将发现的单元用于语音合成。无监督离散子字建模可用于婴儿语音类别学习的研究或需要符号输入的低资源语言技术。我们使用具有中间离散化的自动编码器(AE)架构。我们通过调整AE的解码器来训练扬声器身份,从而将声学单元发现与扬声器建模分离。在测试时,对来自未见扬声器的语音进行单元发现,然后以已知目标扬声器为条件进行单元解码,以获得重建的滤波器组。该输出被馈送到神经调节器以合成目标讲话者的语音中的语音。对于离散化,分类变量自动编码器(CatVAE),矢量量化VAE(VQ-VAE)和直通估计在两种语言的不同压缩级别进行比较。我们的最终模型使用卷积编码,VQ-VAE分散,反卷积解码和FFTNet声码器。我们表明,耦合扬声器调节本质上改善了离散声学表示,与挑战基线相比产生了竞争性合成质量。
translated by 谷歌翻译
本文关注的是通过人工神经网络逼近偏微分方程的解。这里使用前馈神经网络来近似偏微分方程的解。将学习问题表述为最小二乘法,选择偏微分方程的残差作为损失函数,而采用多级Levenberg-Marquardt方法作为训练方法。此设置允许我们进一步了解多级方法的潜力。实际上,当最小二乘问题源于人工神经网络的训练时,受优化的变量与任何几何约束无关,并且标准插值和限制算子不能再使用。然后提出了由代数多重网格方法启发的启发式方法,以构建多级传输算子。数值实验表明,与标准的相应一级程序相比,新的多重开发方法对人工神经网络训练的效率有相关的结果。
translated by 谷歌翻译
作为行人和司机,人类通常巧妙地驾驶交通路口。尽管通常在这些交互中发现了不确定性,危险性和通信的非语言特征,但考虑到交互的总数,几乎没有碰撞。随着自动化技术在车辆中的作用越来越大,了解行人和驾驶员行为之间的关系变得越来越重要:行人如何看待车辆/驾驶员的行为以及行人如何做出交叉决定。已经广泛研究了到达时间(TTA)和行人间隙接受之间的关系(即,行人是否选择穿过时间窗口穿过)。然而,在非语言交流的背景下,车辆轨迹的动态性质尚未得到系统的探索。我们的工作提供了证据,证明轨迹动态,例如TTA的变化,可以成为司机和行人之间非语言交流的强大信号。此外,我们在模拟和现实世界的数据集中研究这些影响,这两个数据都比我们以前在文献中最好的知识所考虑的要大。
translated by 谷歌翻译