为了解决深度生成模型学习中的挑战(例如,变分自动编码器的瑕疵和训练生成对抗网络的不稳定性,我们提出了一种新的深度生成模型,名为Wasserstein-Wasserstein自动编码器(WWAE)。我们制定了WWAE的最小化目标分布和生成的分布之间的惩罚最佳传输。通过注意到潜在代码Z的先前$ P_Z $和聚合后验$ Q_Z $可以被高斯人很好地捕获,所提出的WWAE利用方形的Wasserstein的封闭形式 - 因此,WWAE不会受到采样负担的影响,并且通过利用重新参数化技巧在计算上是有效的。数值结果在多个基准数据集上进行了评估,包括MNIST,时尚-MNIST和CelebA表明WWAE学习得更好。结构比VAE和生成更好的视觉质量和更高的样本r FID得分超过VAE和GAN。
translated by 谷歌翻译
我们提出了一个通用框架来通过概率空间上的\ textbf {V} ariational \ textbf {Gr} adient Fl \ textbf {ow}(VGrow)学习深层生成模型。渐近收敛到目标分布的演化分布由向量场控制,向量场是它们之间的$ f $ - 发散的第一个变化的负梯度。我们通过残差映射的无限时间组合证明了演化分布与前向分布一致,残差映射是沿矢量场的特征映射的扰动。矢量场取决于前推分布的密度比和目标分布,这可以从二元分类问题中一致地学习。我们提出的VGrow方法与其他流行方法(如VAE,GAN和基于流的方法)的连接已在此框架中建立,获得了深层生成学习的新见解。我们还评估了几个常用的差异,包括Kullback-Leibler,Jensen-Shannon,Jeffrey分歧以及我们新发现的`logD'分歧,它作为logD-trick GAN的目标函数。基准数据集的实验结果表明,VGrow可以稳定,有效的方式生成高保真图像,通过最先进的GAN实现竞争性能。
translated by 谷歌翻译
我们提出了一种半光滑牛顿算法用于LASSO和Enet的路径优化(SNAP)稀疏,高维线性回归。 SNAP源自基于牛顿衍生物的合适的KKT条件制剂。它通过主动和连续寻求热循环的解决方案的支持来有效地解决半光滑KKT方程。在路径中的每个结处,SNAP超线性地收敛于Enet标准并且实现LASSO标准的最佳局部收敛,即,SNAP以一次步骤收敛,每次迭代以两次矩阵向量乘法为代价。在设计矩阵的某些规律性条件和目标回归系数的非零元素的最小幅度下,我们表明SNAP以与回归系数相同的符号击中解决方案,并且在有限步骤中以高概率实现了锐化估计误差。 SNAP的计算复杂度显示与每次迭代的LARS和坐标下降算法的计算复杂度相同。仿真研究和实际数据分析支持我们的理论结果,并证明SNAP比LARS更精确,更准确,并协调下降算法。
translated by 谷歌翻译
在自动驾驶车辆上逐渐出现了多个激光雷达,用于扩展视野和密集测量。然而,缺乏精确校准会对其局部化和感知系统中的潜在应用产生负面影响。在本文中,我们提出了一种新颖的系统,它能够实现自动多LiDAR校准,无需任何校准目标,先前的环境信息和外部参数的初始值。我们的方法首先是通过对齐每个传感器的估计运动进行自动初始化的手眼校准。然后通过最小化从点 - 平面对应构造的acost函数,使用基于外观的方法来细化所得到的参数。模拟和真实数据集的实验结果证明了我们的校准方法的可靠性和准确性。对于移动平台,所提出的方法可以校准多个LiDAR系统,其旋转和平移误差分别小于0.04 [rad]和0.1 [m]。
translated by 谷歌翻译
最近推出的Tsetlin Machine(TM)在几个基准测试中提供了具有竞争力的模式分类准确性,在命题逻辑中构成了具有易于解释的连接条款的模式。在本文中,我们通过引入一种新型的TMs,即回归Tsetlin机器(RTM)来超越模式分类。简而言之,我们修改TM的内部推理机制,以便将输入模式转换为单连续输出,而不是转换为不同的类别。我们通过以下方式实现这一目标:(1)使用TM的连接条款来捕获任意复杂的模式; (2)通过新颖的投票和规范化机制将这些模式映射到连续输出; (3)采用反馈方案更新TM条款,以尽量减少回归误差。反馈方案使用新的激活概率函数来稳定更新,同时整个系统收敛到准确的输入 - 输出映射。使用具有和不具有噪声的六个不同的人工数据集来评估所提出的方法的性能。将RTM的性能与Classical Tsetlin Machine(CTM)和MulticlassTsetlin Machine(MTM)进行比较。我们的实证结果表明,RTM获得了噪声和无噪声数据集的最佳训练和测试结果,条款数量较少。反过来,这使用更少的计算资源转化为更高的回归准确度。
translated by 谷歌翻译
在本文中,我们使用一个时间演化图,它包含一系列的图快照,可以模拟许多真实世界的网络。我们在时间演化图中研究路径分类问题,该图在现实世界场景中具有许多应用,例如,预测电信网络中的路径故障并预测在不久的将来交通网络中的路径拥塞。为了捕捉时间依赖性和图形结构动力学,我们设计了一种名为Long Short-TermMemory R-GCN(LRGCN)的新型深度神经网络。 LRGCN将时间相邻图快照之间的时间依赖性视为与内存的特殊关系,并使用关系GCN来共同处理时间内和时间间关系。我们还提出了一种名为\ underline {s} elf- \ underline {a} ttentive \ underline {p} ath \ underline {e} mbedding(SAPE)的新路径表示方法,用于将任意长度的路径嵌入到固定长度的向量中。通过对加利福尼亚实际电信网络和交通网络的实验,我们证明了LRGCN在路径故障预测中对其他竞争方法的优越性,并证明了SAPE在路径表示上的有效性。
translated by 谷歌翻译
在传统的域适应中,关键的假设是存在完全标记的域(源),其包含与另一个未标记或几乎不标记的域(靶)相同的标记空间。但是,在现实世界中,经常存在这样的应用场景,其中两个域都被部分标记,并且并非所有类都在这两个域之间共享。因此,让部分标记的域彼此学习以在开放设置下对每个域中的未标记样本进行分类是有意义的。我们认为这个问题是弱监督的开放式域适应。为了解决这一实际问题,我们提出了协同分配协调(CDA)方法,该方法双边执行知识转移,并协同工作以对未标记数据进行分类并识别异常值样本。 Office基准测试和人员重新识别应用的广泛实验表明,我们的方法可以实现最先进的性能。
translated by 谷歌翻译
多个激光雷达普遍用于移动车辆,以提供宽视图以增强定位和感知系统的性能。然而,由于扫描点中的特征对应性不能总是提供足够的约束,因此多个激光雷达的精确校准是具有挑战性的。为了解决这个问题,现有方法需要场景中的固定校准目标或仅依赖于其他传感器。在本文中,我们提出了一种新方法,可以实现自动激光雷达校准而不受这些限制。在周围出现的三个线性独立的平面表面用于找到对应关系。开发了两个组件以确保找到外部参数:用于初始化的闭合形式和用于通过最小化非线性成本函数进行细化的优化器。仿真和实验结果证明了我们的校准方法的高精度,旋转和平移误差分别小于0.05rad和0.1m。
translated by 谷歌翻译
最近提出了光学衍射神经网络(DNN)的概念,其通过级联相位掩模架构来实现。与光学计算机一样,该系统可以以全光学方式执行机器学习任务,例如数字数字识别。然而,该系统只能在非相干光照下工作,实际实验中的精度要求相当高。本文提出了一种基于单像素成像(MLSPI)的光学机器学习框架。 MLSPI系统可以执行与DNN相同的线性模式识别任务。此外,它可以在不相干的照明条件下工作,具有较低的实验复杂性和可编程的可编程性。
translated by 谷歌翻译
裂缝是最常见的道路窘境之一,可能造成道路安全危害。通常,裂缝检测由经过认证的检查员或结构工程师执行。然而,这项任务耗时,主观和劳动密集。在本文中,我们提出了一种基于深度学习和自适应图像分割的新型道路裂缝检测算法。首先,训练陡峭的卷积神经网络以确定图像是否包含裂缝。然后使用双边滤波对包含裂缝的图像进行平滑处理,这极大地减少了噪声像素的数量。最后,我们利用自适应阈值法从路面提取裂缝。实验结果表明,我们的网络可以对图像进行99.92%的精度分类,利用我们提出的阈值算法可以从图像中成功提取裂缝。
translated by 谷歌翻译