未经授权远程访问来自网络摄像机的流式视频的风险突显了对更强大的隐私保护的需求。为此,我们模拟了一个无镜头编码孔径(CA)相机作为外观编码器,即第一层隐私保护。我们的目标是从编码孔径视频中进行人类动作识别,其编码孔径掩模未知并且不需要重建。我们通过使用基于相位相关和对数极坐标变换的不可逆运动特征来插入第二层隐私保护。相位相关对转换进行编码,而对数极坐标变换对面内旋转和缩放进行编码。 Weshow翻译功能的关键属性是掩码不变的。该属性允许我们通过消除对特定掩模设计的依赖来简化分类器的训练。基于UCF和NTUdatasets子集的结果显示了我们系统的可行性。
translated by 谷歌翻译
本文提出了一种基于DeepLearning(DL)的自适应图像采样算法。自适应采样掩模生成网络与图像修复网络共同训练。在掩码生成网络中控制采样率,并且研究二值化策略以使采样掩码二进制。除了图像采样和重建应用,我们表明所提出的自适应采样算法能够加速光栅扫描过程,如X射线荧光(XRF)图像扫描过程。最近,由于X射线生成和检测技术的进步,XRF基于实验室的系统已经发展了轻量级和便携式仪器。然而,XRF图像的扫描时间通常很长,这是由于需要长时间曝光(例如,每点100美元×1毫秒)。我们提出了一种XRF图像修复方法来解决长扫描时间的问题,从而加快扫描过程,同时仍然保持重建高质量XRF图像的可能性。将所提出的自适应图像采样算法应用于扫描目标的RGB图像,以生成采样掩模。然后根据采样掩模驱动XRF扫描仪以扫描总图像像素的子集。最后,我们通过融合RGB图像来重新扫描扫描的XRF图像以重构整个扫描XRF图像。实验表明,所提出的自适应采样算法能够有效地对图像进行采样,并且比现有方法具有更好的重建精度。
translated by 谷歌翻译
最近的工作引入了一种简单的数值方法,用于求解具有深度神经网络(DNN)的偏微分方程(PDE)。本文对该方法进行了回顾和扩展,同时将其应用于分析数值偏微分方程和非线性分析中最基本的特征之一:irregularsolutions。首先,讨论,分析了可压缩欧拉方程的Sod激波管解决方案,然后与传统的有限元和有限体积方法进行了比较。扩展这些方法以考虑性能改进和同时参数空间探索。接下来,解决了可压缩磁流体动力学(MHD)的冲击解决方案,并将其用于利用实验数据来增强PDE系统的情况,该PDE系统不足以验证对观察/实验数据的验证。这是通过使用源项加强模型PDE系统并使用合成实验数据的监督训练来实现的。由此产生的PDE的DNN框架似乎表现出几乎非常简单的系统分型,大数据集的自然整合(无论是合成的实验),同时还能实现对整个参数空间的单遍探索。
translated by 谷歌翻译
这项工作解决了图像分类器的半监督学习问题。我们的主要观点是,半监督学习领域可以从快速发展的自我监督视觉表征学习领域中受益。统一这两种方法,我们提出了自我监督半监督学习($ S ^ 4L $)的框架,并用它来推动两种新的半监督图像分类方法。我们证明了这些方法与精心调整的基线和现有的半监督学习方法相比的有效性。然后我们证明$ S ^ 4L $和现有的半监督方法可以联合训练,在半监督的ILSVRC-2012上产生了一个新的最先进的结果,有10%的标签。
translated by 谷歌翻译
事实证明,半监督学习是利用未标记数据来减轻对大型标记数据集的依赖的有力范例。在这项工作中,我们统一了当前用于半监督学习的主要方法,产生了一种新算法MixMatch,它通过猜测低熵标签来处理数据增强的未标记示例,并使用MixUp混合标记和未标记数据。我们展示了MixMatch通过许多数据集和标记数据量的大数据获得最先进的结果。例如,在具有250个标签的CIFAR-10上,我们将错误率降低了4倍(从38%降至11%),在STL-10上降低了2倍。我们还演示了MixMatch如何帮助实现更好的准确性 - 隐私折衷以实现差异隐私。最后,我们进行了一项消融研究,以分辨出MixMatch的哪些组件对其成功最重要。
translated by 谷歌翻译
我们提出了一种技术,可以对存在不确定性的数据进行降维。我们的方法是传统的主成分分析(PCA)到多变量概率分布的推广。与非线性方法相比,线性降维技术具有以下优点:这种概率分布的特征在投影后保持完整。我们推导出协方差矩阵的表示,它尊重每个观测中的潜在不确定性,为我们的新方法不确定性感知PCA建立数学基础。除了我们的方法基于过采样的策略所获得的准确性和性能,我们的公式允许我们对数据的不确定性进行灵敏度分析。为此,我们提出将痕迹视为一种新颖的可视化,使我们能够更好地理解不确定性对所选主成分的影响。我们使用真实世界的数据集提供了我们的技术的多个例子,并展示了如何通过PCA以封闭形式拓展多变量正态分布。此外,我们讨论了我们方法的扩展和局限性。
translated by 谷歌翻译
大多数LiDAR测距算法通过以插值方式估计旋转和平移来估计两个连续帧之间的变换。在本文中,我们提出了解耦激光雷达测距仪(DeLiO),它首次将旋转估计与翻译估计完全解耦。具体地,通过从输入点云提取表面法线并在单位球上跟踪它们的特征图案来估计旋转。使用此旋转,点云未旋转,因此底层转换是纯转换,可以使用线云方法轻松估算。在KITTI数据集上进行评估,并将结果与​​现有技术进行比较。
translated by 谷歌翻译
我们提出了一种完全数据驱动的方法来计算包含大量非刚性物体的不同单眼视频序列的深度,例如人。为了学习非刚性场景的重建线索,我们引入了一个由立体视频刮片组成的新数据集。在野外。此数据集具有各种各样的场景类型,并具有大量非刚性对象,尤其是人。由此,我们计算视差图以用于监督我们的方法。我们提出了一种损失函数,即使在数据集中使用未知的相机内在函数和立体基线,我们也可以生成深度预测。我们通过使用depthsupervision(包括SINTEL和KITTI)评估现有视频数据集上的方法来验证大量Internetvideo的使用,并显示我们的方法更好地适应自然场景。
translated by 谷歌翻译
在强化学习中,有一种初步的方法,就预测方面的环境进行概念化。这种预测方法的核心在于可以根据对感觉,行为和时间的预测来构建词汇 - 将世界分类为使用仅仅预测表达世界所有方面的实体。这种本体构造对于机器知识的预测方法是不可或缺的,其中对象仅被描述为它们被感知的内容。在本文中,我们以强化学习方法为基础,研究了Pericean的理论模型,用一般价值函数的符号描述了Peirce的三类。使用Peircean符号学模型,我们证明单独的预测不足以构建本体论;然而,我们将预测确定为意义制定过程中不可或缺的一部分。此外,我们讨论预测性知识如何为符号学提供一个特别稳定的基础\ textemdash制作意义\ textemdash的过程,并提出一种可能的研究途径来设计使用预测构建语义和意义的算法方法。
translated by 谷歌翻译
我们提出了一种通过卷积神经网络对图像内容进行细粒度3D处理的新方法,我们将其称为可转换瓶颈网络(TBN)。它将给定的空间变换直接应用于ourencoder-bottleneck-decoder体系结构中的体积瓶颈。多视图监督鼓励网络学习在空间上解开瓶颈内的特征空间。可以使用任意空间变换来操纵所得到的空间结构。我们证明了TBNs对于新型合成的功效,在具有挑战性的基准上实现了最先进的结果。我们证明,为此任务培训的网络所产生的瓶颈包含有意义的空间结构,使我们能够直观地在3D中执行各种图像处理,远远超出训练期间的严格转换。这些操作包括非均匀缩放,非刚性扭曲以及组合来自不同图像的内容。最后,我们从瓶颈中提取显式3D结构,从单个输入图像执行令人印象深刻的3D重构。
translated by 谷歌翻译