未经授权远程访问来自网络摄像机的流式视频的风险突显了对更强大的隐私保护的需求。为此,我们模拟了一个无镜头编码孔径(CA)相机作为外观编码器,即第一层隐私保护。我们的目标是从编码孔径视频中进行人类动作识别,其编码孔径掩模未知并且不需要重建。我们通过使用基于相位相关和对数极坐标变换的不可逆运动特征来插入第二层隐私保护。相位相关对转换进行编码,而对数极坐标变换对面内旋转和缩放进行编码。 Weshow翻译功能的关键属性是掩码不变的。该属性允许我们通过消除对特定掩模设计的依赖来简化分类器的训练。基于UCF和NTUdatasets子集的结果显示了我们系统的可行性。
translated by 谷歌翻译
图像对齐任务需要精确的像素对应,这通常通过匹配局部特征描述符来恢复。这些描述符是通过对具有地面实况对应的现有数据集的监督学习而得到的。但是,创建此类数据集的成本通常是禁止的。在本文中,我们提出了一种新的方法来对齐由未知的二维单应性相关的两个图像,其中从图像的划痕中学习局部描述符并同时估计单应性。我们的关键点是,可以联合训练暹罗卷积神经网络,同时通过优化单损失函数迭代地更新单应性参数。我们的方法目前受到弱监督,因为inputimages需要大致对齐。我们已经使用这种方法来对齐不同模态的图像,例如RGB和近红外(NIR),而不使用任何先前标记的数据。然后,通过我们的方法自动对齐的图像用于训练概括为新图像的描述符。我们还评估了RGB图像的方法。在HPPatches基准测试中,我们的方法实现了与在受监督环境中离线训练的深度本地描述符相当的精确度。
translated by 谷歌翻译
如今,配备相机的无人机被用于探索大型场景并重建详细的3D地图。当场景中的自由空间近似已知时,离线计划员可以生成最佳计划以有效地探索场景。然而,为了探索未知的场景,规划者必须预测并最大限度地提高动态去向的有用性。传统上,这已经使用手工制作的实用功能实现。我们建议学习一种更好的函数来预测未来观点的有用性。我们的学习能力函数基于3D卷积神经网络。该网络作为输入提供新颖的体积场景表示,其隐式地捕获先前访问的视点并且推广到新场景。我们使用模拟深度相机评估我们在几个大型城市场景3D模型上的方法。我们表明,我们的方法在重建性能方面优于现有的效用测量,并且对传感器噪声具有鲁棒性。
translated by 谷歌翻译
We propose a single-shot approach for simultaneously detecting an object in an RGB image and predicting its 6D pose without requiring multiple stages or having to examine multiple hypotheses. Unlike a recently proposed single-shot technique for this task [11] that only predicts an approximate 6D pose that must then be refined, ours is accurate enough not to require additional post-processing. As a result , it is much faster-50 fps on a Titan X (Pascal) GPU-and more suitable for real-time processing. The key component of our method is a new CNN architecture inspired by [28, 29] that directly predicts the 2D image locations of the projected vertices of the object's 3D bounding box. The object's 6D pose is then estimated using a PnP algorithm. For single object and multiple object pose estimation on the LINEMOD and OCCLUSION datasets, our approach substantially outperforms other recent CNN-based approaches [11, 26] when they are all used without post-processing. During post-processing, a pose refinement step can be used to boost the accuracy of these two methods, but at 10 fps or less, they are much slower than our method.
translated by 谷歌翻译
我们提出了一种使用Wasserstein生成对抗网络从受雾霾影响的图像恢复清晰图像的方法。由于问题是条件限制的,以前的方法需要先前对自然图像或同一场景的多个图像。我们使用Wasserstein损失函数训练生成对抗网络,使用Wasserstein损失函数来容忍以受影响的图像为条件的清晰图像的概率分布,使用梯度实施来强制执行Lipschitz约束。该方法是数据自适应的,端到端的,并且不需要进一步处理或调整参数。我们还使用基于纹理的损失度量和L1损失来改善结果,并表明我们的结果优于当前的最新技术。
translated by 谷歌翻译
我们提出了一种自我监督的方法来训练卷积神经网络,用于从单眼内窥镜检查数据进行密集深度估计,而无需对解剖或阴影进行先验建模。我们的方法仅需要单视内窥镜视频和多视图立体方法,例如,运动的结构,以稀疏的方式进行学习。因此,我们的方法需要在训练和应用阶段进行手动标记或患者计算机断层扫描(CT)扫描。在使用CT scansas groundtruth的跨患者实验中,所提出的方法实现了亚毫米波均方误差。在最近针对体内窦内窥镜检查数据的自然视频设计的自我监督深度估计方法的比较研究中,我们证明了所提出的方法优于前一种方法的大幅度边缘。这项工作的源代码可在线公开获取:http://github.com/lppllppl920/EndoscopyDepthEstimation-Pytorch。
translated by 谷歌翻译
用于在线展示广告的活动的编排要求营销人员以webtraffic的特定属性的粒度预测受众大小,其特征在于所有属性的分类性质(例如,{US,Chrome,Mobile})。每个属性采用多个值,非常大的属性组合集使得估计任何特定属性组合的受众大小具有挑战性。我们修改了Eclat,一种频繁项集挖掘(FIM)算法,以适应分类变量。对于随后的频繁和不频繁的项目集,我们然后使用条件概率的时间序列分析来提供预测以帮助近似。基于受众数据的典型特征进行了广泛的模拟,以对我们修改的FIM方法进行压力测试。在两个真实的数据集中,与包括神经网络模型的基线进行比较表明,我们的方法降低了分类数据的FIM计算时间。在保留样本时,我们表明建议的预测方法优于这些基线。
translated by 谷歌翻译
本文提出了利萨如曲线上多智能体形成在线重构的轨迹规划策略。在我们早期的工作中,提出了具有恒定参数速度的多智能体形成,以便实现多个目标,例如重复无碰撞监视和保证该区域具有流氓目标检测和捕获能力的传感器覆盖。这项工作解决了在此背景下的地层重新配置问题。特别地,使用变化微积分来设计平滑参数轨迹。这些轨迹已经与简单的局部协作方案结合使用,以便在不同的Lissajous曲线之间实现无碰撞重新配置。提供了对所提方案的详细理论分析。这些监视和重新配置策略也通过MATLAB \ reg中的仿真验证,用于沿曲线执行参数运动的代理,以及用于四旋翼的软件在环仿真。此外,他们通过在运动捕捉环境中飞行的四旋翼飞行器实验验证。
translated by 谷歌翻译
广义零射击学习中的许多方法依赖于图像特征空间和类嵌入空间之间的跨模态映射。由于标记图像很少见,因此一个方向是通过生成图像或图像特征来增加数据集。然而,前者错过了细粒度的细节,后者需要学习与类嵌入相关的映射。在这项工作中,我们将特征生成更进一步,并提出了一个模型,其中图像特征和类嵌入的共享潜在空间是由模态特定的对齐变分自动编码器学习的。这使我们得到关于潜在特征中的图像和类的所需的判别信息,我们在其上训练softmax分类器。我们的方法的关键是我们将从图像和侧面信息中学习的分布对齐,以构建包含与看不见的类相关的基本多模态信息的潜在特征。我们在几个基准数据集上评估我们学到的潜在特征,即CUB,SUN,AWA1和AWA2,并建立了关于广义零射击以及少数射击学习的最新技术。此外,我们在ImageNet上的结果各种零点分割表明,我们的特征在大规模设置中得到了很好的推广。
translated by 谷歌翻译
1型糖尿病(T1D)的现代治疗使用称为人工胰腺(AP)的装置,其结合胰岛素泵和以闭环方式操作的连续葡萄糖监测器(CGM)来控制血糖水平。在实践中,AP的不良表现(频繁的高血糖或低血糖障碍)在人群水平上是常见的,许多T1D患者使用不受管制的开源软件修改现有AP系统上的算法。有趣的是,该组中的患者与之相比具有更好的结果。护理标准,但我们不了解任何AP系统的安全性,因为不良的结果是罕见的。在本文中,我们构建了个体患者的生理特征和饮食行为的生成模型。 Wethen将这些模型与经FDA批准用于临床前试验的T1D模拟器相结合。考虑到在计算机模拟患者结果的能力,我们利用罕见事件模拟理论的技术,以便有效地对特定患者的设备性能进行定量。 Weshow实时模拟速度提高了72,000美元加速,频率增加了2-10倍,我们能够采样与标准蒙特卡罗采样相关的不利条件。在实践中,我们的工具链能够估计低血糖事件的可能性,并且模拟量减少了大约一个数量级。
translated by 谷歌翻译