由于他们越来越多的可负担性,可移植性和360 {\ DEG}视野,全向360 {\ DEG}图像在计算机视觉,机器人和其他领域找到了许多有希望和激动人心的应用。用于存储,处理和可视化360 {\ DEG}图像的最常用格式是互连的投影(ERP)。然而,由360 {\ DEG}图像引入的非线性映射引入到ERP图像的失真仍然是一种屏障,其容纳作为传统透视图像的易于用作易用的屏障。当估计360 {\ DEG}光流时,这尤其相关,因为需要适当地减去失真。在本文中,我们提出了一种基于切线图像的360 {\ DEG}光学流量。我们的方法利用GNOMONIC投影将ERP图像局部转换为透视图像,并且通过投影将ERP图像均匀地对准CUBEMAP和常规ICOSAHEDRON顶点来逐步地进行逐步改进估计的360 {\ DEG}流场。我们的实验表明了我们所提出的方法的益处,这些方法都是定量和定性的。
translated by 谷歌翻译
360 {\ DEG}相机可以在单次拍摄中捕获完整的环境,这使得在许多计算机视觉任务中制作360 {\ DEG}图像诱人。然而,单眼深度估计仍然是360 {\ DEG}数据的挑战,特别是对于2K(2048 $ \倍1024美元)的高分辨率,这对于新颖的综合和虚拟现实应用很重要。基于CNN的基于CNN的方法不支持由于GPU存储器有限而导致的这种高分辨率。在这项工作中,我们提出了一种灵活的框架,用于使用切线图像的高分辨率360 {\ DEG}图像的单眼深度估计框架。我们将360 {\ DEG}输入图像投影到一组切线,产生透视图,这适用于最新,最准确的最先进的透视单眼深度估计器。我们使用可变形的多尺度对准再次重新组合各个深度估计,然后通过梯度域混合来提高视差估计的一致性。结果是具有高细节水平的密集,高分辨率360 {\ DEG}深度图,也适用于现有方法不支持的户外场景。
translated by 谷歌翻译
通常承认,巨额(培训)数据的可用性是人工智能(AI)最近进步的最重要因素之一。但是,数据集通常用于狭窄的AI子区域中的特定任务,并且没有统一的方式来管理和访问它们。这不仅在培训或部署机器学习模型时创造了不必要的开销,但也限制了对数据的理解,这对于以数据为中心的AI非常重要。在本文中,我们向不同数据集的统一框架展示了我们的愿景,以便可以轻松地集成和查询,例如,使用标准查询语言。我们在持续的工作中展示了这一点,为计算机愿景中的数据集创建了一个框架,并在不同的场景中显示了它的优势。我们的演示可在https://vision.semkg.org中获得。
translated by 谷歌翻译
近几十年来,Camera-IMU(惯性测量单元)传感器融合已经过度研究。已经提出了具有自校准的运动估计的许多可观察性分析和融合方案。然而,它一直不确定是否在一般运动下观察到相机和IMU内在参数。为了回答这个问题,我们首先证明,对于全球快门Camera-IMU系统,所有内在和外在参数都可以观察到未知的地标。鉴于此,滚动快门(RS)相机的时间偏移和读出时间也证明是可观察到的。接下来,为了验证该分析并解决静止期间结构无轨滤波器的漂移问题,我们开发了一种基于关键帧的滑动窗滤波器(KSWF),用于测量和自校准,它适用于单眼RS摄像机或立体声RS摄像机。虽然关键帧概念广泛用于基于视觉的传感器融合,但对于我们的知识,KSWF是支持自我校准的首先。我们的模拟和实际数据测试验证了,可以使用不同运动的机会主义地标的观察来完全校准相机-IMU系统。实际数据测试确认了先前的典故,即保持状态矢量的地标可以弥补静止漂移,并显示基于关键帧的方案是替代治疗方法。
translated by 谷歌翻译
卷积神经网络(CNNS)在许多实际应用中成功了。但是,它们的高计算和存储要求通常使它们难以在资源受限的设备上部署。为了解决这个问题,已经提出了许多修剪算法用于CNN,但大多数人不能将CNNS提交给合理的水平。在本文中,我们提出了一种基于递归最小二乘(RLS)优化的训练和修剪CNN的新颖算法。在为某些时期培训CNN之后,我们的算法组合了逆输入自相关矩阵和权重矩阵,以按层评估和修剪不重要的输入通道或节点层。然后,我们的算法将继续培训修剪的网络,并且在修剪的网络恢复旧网络的完整性能之前,不会进行下一次修剪。此外,对于CNN,所提出的算法可用于前馈神经网络(FNN)。在MNIST,CIFAR-10和SVHN数据集上的三个实验表明,我们的算法可以实现更合理的修剪,并且具有比其他四个流行的修剪算法更高的学习效率。
translated by 谷歌翻译
总变化(TV)正则化已经提高了用于图像处理任务的各种变分模型。我们提出了与电视正则化的早期文献中的倒扩散过程与电视正常化相结合,并表明所得到的增强电视最小化模型对于降低对比度的损失特别有效,这通常由使用电视正常化的模型遇到。我们从嘈杂的额相测量中建立了增强电视模型的稳定重建保证;考虑非自适应线性测量和可变密度采样的傅里叶测量。特别地,在一些较弱的受限制的等距特性条件下,增强的电视最小化模型被示出为比各种基于电视的模型具有更严格的重建误差界限,用于噪声水平很大并且测量量有限。增强电视模型的优点也通过初步实验进行了数值验证,通过一些合成,自然和医学图像的重建。
translated by 谷歌翻译
时间序列数据收集之间的因果发现可以帮助诊断症状的原因,并希望在发生故障之前防止故障。然而,可靠的因果发现可能非常具有挑战性,特别是当数据采集率变化(即,不均匀的数据采样)时,或在存在丢失的数据点(例如,稀疏数据采样)时。为了解决这些问题,我们提出了一个由两个部分组成的新系统,第一部分填充了具有高斯进程回归的缺失数据,第二部分利用了回声状态网络,即储层计算机(即,用于混沌的类型系统建模)对于因果发现。我们评估我们提出的系统对其他三个现成的因果发现算法的性能,即结构期望 - 最大化,子采样的线性自动回归绝对系数,以及使用田纳西州伊斯曼的传染媒介自回归的多变量格兰杰因果关系化学数据集;我们报告了它们对应的Matthews相关系数(MCC)和接收器操作特征曲线(ROC),并表明所提出的系统优于现有的算法,展示了我们在缺失条目中发现复杂系统中的因果关系的可行性。
translated by 谷歌翻译
开放式识别通过将测试样本分类为来自训练或“未知”的已知类之一来概括分类任务。作为一种新的癌症药物鸡尾酒,不断发现改善治疗,预测癌症治疗可以在开放式识别问题方面自然地配制。由于在训练期间建模未知样品,因此从医疗开放式学习中的先前工作的直接实现产生了缺点。因此,我们重新确定问题方法,并应用最近的现有高斯混合变分性AutoEncoder模型,其实现了图像数据集的最新结果,乳腺癌患者数据。与最近的方法相比,我们不仅获得了更准确和稳健的分类结果,平均F1增加了24.5%,但我们还在部署到临床环境方面重新审视开放式识别。
translated by 谷歌翻译
垂直协作学习系统也被称为垂直联合学习(VFL)系统最近成为一个概念,以处理在许多个人来源上分布的数据,而无需集中它。多个参与者以隐私保留方式基于其本地数据协作培训模型。迄今为止,VFL已成为一项事实上的解决方案,以便在组织之间安全地学习模型,允许在不影响任何个人组织的隐私的情况下共享知识。尽管VFL系统的发展繁荣发展,但我们发现参与者的某些投入,名叫对抗的主导投入(ADIS),可以将联合推断占主持旨在的意志的方向,并迫使其他(受害者)参与者进行可忽略不计的捐款,失败奖励通常提供他们在合作学习情景中的贡献的重要性。通过首先在典型的VFL系统中证明其存在,我们对ADI进行了系统研究。然后,我们提出基于梯度的方法来综合各种格式的ADI并利用公共VFL系统。我们进一步推出了Greybox Fuzz测试,以“受害者”参与者的弹性分数为指导,以扰乱对抗控制的输入,并以隐私保存方式系统地探索VFL攻击表面。我们对临界参数和环境在合成ADIS中的影响进行了深入的研究。我们的研究揭示了新的VFL攻击机会,在违反之前促进了未知威胁的识别,并建立了更安全的VFL系统。
translated by 谷歌翻译
无监督的聚类算法可以有效降低高维未标记数据的维度,从而减少数据处理的时间和空间复杂性。然而,传统的聚类算法需要预先设置类别数量的上限,深入学习聚类算法将属于本地最佳问题。为了解决这些问题,提出了一种基于自律学习(SDL)模型的概率空间聚类算法。该算法基于向量之间的高斯概率分布,并使用概率刻度和概率空间距离的最大概率值作为距离测量判断,然后根据分布特性确定每个样本的类别数据集本身。该算法在实验室进行了智能和安全汽车(LISA)交通灯数据集的实验室,精度率为99.03%,召回率为91%,实现效果。
translated by 谷歌翻译