我们提出极端视图合成,当输入图像的数量很小时,新视图外推的解决方案。在这种背景下,闭塞和深度不确定性是两个最紧迫的问题,并且随着外推程度的增加而恶化。最先进的方法通过平均显式几何约束或学习先验来解决这个问题。我们的关键见解是,只有对深度不确定性和图像先验进行建模才能解决极端情况。我们首先为新视图生成深度概率体积并合成所搜索图像的估计。然后,我们使用学习者与深度不确定性相结合来改进它。我们的方法是第一个显示高达30倍的基线放大倍数的视觉上令人满意的结果。
translated by 谷歌翻译
从时间对图像中估计动态场景中的3D运动是许多场景理解问题中的核心任务。在现实世界的应用中,动态场景通常由移动摄像机捕获(即,平移,倾斜或手持),增加了任务复杂性,因为从不同视点观察场景。主要的挑战是从场景运动消除相机运动的歧义,即使成功估计2D图像对应,随着观察到的残骸量减少,这变得更加困难。与其他最先进的3D场景流估计方法相比,本文提出了从大量动态场景数据中以无监督的方式对场景的刚性进行“学习”,并直接从两个刚性掩模中提取刚性掩模。具有深度的连续图像。通过学到的网络,我们展示了如何使用计算的2D光流和推断的刚性掩模有效地估计相机运动和投射的流动。对刚性网络进行训练和测试,我们还提供了一个新的半合成动态场景数据集(具有真实背景的合成前景对象)和评估分割,它们考虑了观察到的非刚性像素的百分比。通过我们的评估,我们展示了所提出的框架优于现有的最先进的场景流量估计方法,具有挑战性的动态范围。
translated by 谷歌翻译
源自网络的数据表现出不规则的支持,其中每个数据元素通过由网络确定的任意成对关系相关联。图形神经网络(GNN)已经成为利用这种潜在支持的特殊性的信息处理体系结构。 GNN中非线性的使用,加上滤波器是从数据中学习的,这一事实引发了数学挑战,这些挑战阻碍了理论结果的发展,从而可以深入了解GNN具有显着性能的原因。在这项工作中,我们证明了稳定性,它表明数据支持的微小变化导致GNN输出的小(有限)变化。更具体地说,我们证明了在一个图上计算的GNN输出差异的界限,或者与GNN的图形和设计参数之间的差异成正比,只要训练过的滤波器是积分Lipschitz。我们利用这个结果来提供一些关于非线性在获得稳定和选择性的架构中的关键效应的见解,如果仅使用线性滤波器则无法实现这一壮举。
translated by 谷歌翻译
再生核Hilbert空间(RKHS)是成功用于信号处理,统计和机器学习的许多非参数工具的关键元素。在这项工作中,我们的目标是解决经典的基于RHSHS的技术的三个问题。首先,它们需要先验地知道RKHS,这在许多应用中是不现实的。此外,RKHS的选择会影响解决方案的形状和平滑度,从而影响其性能。其次,RKHS无法应对异质程度的平滑,即功能在其域的某些部分是平滑的但在其他部分中变化很快。 。最后,评估这些方法的解决方案的计算复杂性随着数据点的数量而增长,使得这些技术对于许多应用是不可行的。尽管已经使用内核学习,局部核适应和稀疏性来解决这些问题,但是这些方法中的许多方法都是计算密集型的或者放弃了最优化保证。我们通过利用RKHS中功能的新颖整体表示来解决这些问题,这些功能允许在每个中心使用任意中心和不同的内核。为了解决复杂性问题,我们将函数估计问题写成稀疏函数程序,从而明确地最小化表示的支持,从而导致低复杂性解决方案。尽管它们具有非凸性和无限维度,但我们展示了这些问题可以通过平均而有效地解决,并且我们在模拟和实际数据中说明了这种新方法。
translated by 谷歌翻译
在高分辨率卫星图像中分割云是一项艰巨而具有挑战性的任务,因为卫星可以捕获多种类型的地理区域和云。因此,它需要自动化和优化,特别是那些定期处理大量卫星图像的人,例如政府机构。从这个意义上讲,这项工作的贡献是:我们提供了CloudPeru2数据集,包括22,400个512x512像素的图像及其各自的手绘云遮罩,以及使用卷积神经的云端对端分割方法的建议网络(CNN)基于Deeplab v3 +架构。测试结果的准确度达到96.62%,精度达到96.46%,特异度达到98.53%,灵敏度达到96.72%,优于对比方法。
translated by 谷歌翻译
车载Ad-hoc网络(VANET)可以有效地检测交通拥堵,但是检测是不够的,因为拥塞可以进一步分类为重复和非重复拥塞(NRC)。特别是,城市网络中的NRC主要是由事故,工作区,特殊事件和不利天气引起的。我们提出了一个框架,使用VANET在异构城市道路网络上对其组件进行实时分布式分类。我们提出了建立在对空间和时间度量测量的理解的基础上的模型,并对从科隆真实案例研究扩展的合成数据进行了培训。我们的性能评估显示确定性分类树(CT)的预测准确度为87.63 \%,NaiveBayesian分类器(NB)为88.83 \%,随机森林(RF)为89.51 \%,热泵技术为89.17 \%。该框架可以通过制定有效的拥堵缓解策略来帮助运输机构减少城市拥堵,了解拥堵的根本原因。
translated by 谷歌翻译
最初,机器人的开发旨在使我们的生活更轻松,为人类执行重复或危险的任务。尽管他们能够执行这些任务,但是通过执行智能动物或人类更新的更复杂任务,最新一代机器人的设计更进一步。为此,灵感需要从生物学例子中进行测试。例如,昆虫能够最佳地解决复杂的环境导航问题,并且许多研究人员已经开始模仿这些昆虫的行为。最近对神经形态学工程的兴趣促使我们使用类似类似于节肢动物的机器人,在神经机器人中呈现实时的,神经形态的,基于尖峰的中央模式生成器。 Spiking神经网络是在SpiNNaker上设计和实现的。该网络模拟了一个复杂的,可在线更改的Central PatternGenerator,它为六足机器人运动生成三个步态。可配置硬件用于管理机器人的电机和与Spiking神经网络的实时通信接口。实时测量确认模拟结果,并且运动测试表明,神经痛可以在没有任何平衡损失或增加延迟的情况下执行步态。
translated by 谷歌翻译
$ \ mathcal {G} ^ 0 $分布广泛用于单极化SAR图像建模,因为它可以准确地表征具有不同纹理程度的区域。它由三个参数索引:外观的数量(可以估计整个图像),比例参数和纹理参数。本文提出了一个比较来自$ \ mathcal {G} ^ 0 $分布的样本的新建议。使用测地距离(GD)作为模型之间不相似性的度量。目标是使用$ \ mathcal {G} ^ 0 $分布的局部参数(比例和纹理)量化来自SAR数据的样本对之间的差异。我们提出了三个基于GD的测试,它结合了〜\ cite {GeodesicDistanceGI0JSTARS}中提供的测试,我们使用置换方法估计它们的概率分布。
translated by 谷歌翻译
我们讨论\ emph {跨语言文本量化}(CLTQ),执行文本量化的任务(即估计所有类的相对频率$ p_ {c}(D)$ $ c \ in \ mathcal {C} $ in当训练文档可用于源语言$ \ mathcal {S} $但不能用于需要执行量化的目标语言$ \ mathcal {T} $时,一组$ D $ of unlabelleddocuments)。 CLTQ从未在文献中讨论过;我们通过将最先进的量化方法与能够生成所涉及的源文档和目标文档的跨语言矢量表示的方法相结合来建立二元案例的基线结果。我们提出了在公开可用的数据集中获得的跨语言情感分类的实验结果;结果表明,所提出的方法可以以惊人的准确度执行CLTQ。
translated by 谷歌翻译
传统上,信号分类是需要先前的信号知识的过程。人类专家决定从信号中提取哪些特征,并用作分类系统的输入。这种要求可以使专家错过信号的重要未知信息,而不包括在特征中。本文提出了一种新的方法,可以自动分析信号并提取特征而无需任何人参与。因此,不需要关于要分类的信号的先前知识。所提出的方法基于遗传编程,并且为了测试该方法,它已经应用于与癫痫有关的众所周知的EEG数据库,癫痫是数百万人遭受的疾病。如结果部分所示,获得了高分类精度
translated by 谷歌翻译