未经授权远程访问来自网络摄像机的流式视频的风险突显了对更强大的隐私保护的需求。为此,我们模拟了一个无镜头编码孔径(CA)相机作为外观编码器,即第一层隐私保护。我们的目标是从编码孔径视频中进行人类动作识别,其编码孔径掩模未知并且不需要重建。我们通过使用基于相位相关和对数极坐标变换的不可逆运动特征来插入第二层隐私保护。相位相关对转换进行编码,而对数极坐标变换对面内旋转和缩放进行编码。 Weshow翻译功能的关键属性是掩码不变的。该属性允许我们通过消除对特定掩模设计的依赖来简化分类器的训练。基于UCF和NTUdatasets子集的结果显示了我们系统的可行性。
translated by 谷歌翻译
放射成像提供有效的解剖学测量,这在疾病诊断和评估中是有用的。先前的研究表明,左室壁重塑可以提供预测心房纤颤的治疗结果的信息。然而,从医学图像分割左心房结构仍然是非常耗时的。神经网络的当前进展可以帮助创建自动分割模型,以减少临床医生的工作量。在这项初步研究中,我们提出了具有卷积神经网络的自动化,两阶段,三维U-Nets,用于左心房分割的挑战性任务。与以前的二维图像分割方法不同,我们使用3D U-Nets直接在3D中获得心腔。双3D U-Net结构包括第一个U-Net tocoarsely段和定位左心房,以及第二个U-Net,用于在更高分辨率下准确地分割左心房。此外,我们根据额外的距离信息引入一个轮廓损失来调整最终分割。我们将数据随机分成训练数据集(80个主题)和验证数据集(20个主题),以训练具有不同增强设置的多个模型。实验表明,验证数据集的平均Dice系数约为0.91-0.92,灵敏度约为0.90-0.94,特异性为0.99。与传统的Dice损失相比,通过Contour损失训练的模型通常提供具有相似Dicecoefficient的较小Hausdorff距离,并且在预测中具有较少的连通分量。最后,我们在集合预测中集成了几个训练模型来分割测试数据集。
translated by 谷歌翻译
最近,综合学习的进展提出了合成图像的训练模型,可以有效地降低人力和物质资源的成本。然而,由于与真实图像相比合成图像的不同分布,所期望的性能仍然不能实现。真实图像由多种形式的光取向组成,而合成图像由均匀的光取向组成。这些特征分别被认为是室外和室内场景的特征。解决这个问题,前一种方法学会了一种模型来改善合成图像的真实感。与以往的方法不同,本文采用净化真实图像的第一步。通过风格转移任务,将室外真实图像的分布转换为室内合成图像,从而减少光的影响。因此,本文提出了一种区域时间风格转移网络,其保留了输入图像(真实图像)的图像内容信息(例如,注视方向,瞳孔中心位置),同时推断了风格图像的风格信息(例如,图像颜色结构,语义特征)。合成图像)。此外,网络加速了模型的收敛速度,并适应多尺度图像。使用混合研究(定性和定量)方法进行实验,以证明在复杂方向上纯化真实图像的可能性。定性地,将所提出的方法与LPW数据集的一系列室内和室外场景中的可用方法进行比较。在定量计中,它通过在交叉数据集上训练凝视估计模型来评估纯化图像。结果显示,与原始实际图像相比,基线方法有显着改进。
translated by 谷歌翻译
目前用于人类活动识别(HAR)的金标准基于相机的使用。然而,相机系统的可扩展性差使得它们在追求在移动计算环境中更广泛地采用HAR的目标上是不切实际的。因此,研究人员反而依赖于可穿戴传感器,特别是惯性传感器。一种特别流行的可穿戴设备是智能手表,由于其集成的惯性和光学传感能力,在非突出的路径中实现更好的HAR具有很大的潜力。如果通常在智能手表或类似设备中找到的腕式光学传感器可以用作数据可用性识别的有用来源,本文试图通过确定来简化可穿戴方法。该方法有可能消除对惯性传感元件的需求,这又会降低智能手表和健身追踪器的成本和复杂性。这可能潜在地考虑到HAR的硬件要求,同时保留来自单个光学传感器的心率监测和活动捕获的功能。我们的方法依赖于基于适当缩放的光信号图来采用用于活动识别的机器视觉。我们采用这种方法,以便产生易于由非技术用户解释和解释的分类。更具体地,使用光电容积描记器信号时间序列的图像来重新训练最初在ImageNet数据库上训练的卷积神经网络的倒数第二层。然后,我们使用来自倒数第二层的2048维特征作为支持向量机的输入。实验结果的平均分类准确率为92.3%。该结果优于光学和惯性传感器的组合(78%)并且使用...来说明HAR系统的能力。
translated by 谷歌翻译
最近使用深度神经网络的研究已经显示出非凡的转换,特别是对于艺术和照片般逼真的图像。然而,使用全局特征相关的方法无法捕获小的,复杂的纹理并且保持艺术品的正确纹理尺度,并且基于局部补丁的方法在全局效果上是有缺陷的。在本文中,我们提出了一个新颖的特征金字塔融合神经网络,称为GLStyleNet,它通过最佳聚合VGG网络中的层来充分考虑多尺度和多级金字塔特征,并分层执行样式转移,具有多个不同的损失。我们提出的方法从损失函数约束和特征融合两个方面保留了图像的高频像素信息和低频构造信息。我们的方法不仅可以灵活地调整内容和风格之间的交易,还可以在全局和本地之间进行控制。与最先进的方法相比,我们的方法不仅可以传递大规模,明显的风格线索,还可以传递微妙,精致的方法,并且可以大大提高风格转换的质量。我们展示了我们的肖像风格转移,艺术风格转移,照片写实风格转移和中国古代绘画风格转移任务的方法的有效性。实验结果表明,我们的统一方法比以往最先进的方法提高了图像样式传递质量,同时也在一定程度上加速了整个过程。我们的代码可在https://github.com/EndyWon/GLStyleNet上获得。
translated by 谷歌翻译
代词通常在诸如中文之类的支持语言中被省略,通常导致在完成翻译的产生方面的重大挑战。最近,王等人。 (2018)提出了一种新的基于重构的方法来减轻神经机器翻译模型的下降代词(DP)翻译问题。在这项工作中,我们从两个角度改进了原始模型。首先,我们采用共享的重构,更好地利用编码器和解码器表示。其次,我们共同学习以端到端的方式翻译和预测DP,以避免从外部DP预测模型传播的错误。实验结果表明,该方法显着提高了翻译性能和DP预测准确性。
translated by 谷歌翻译
人工智能研究人员已经在大规模完美信息博弈中实现了人类智能,但在大规模不完全信息博弈(即战争)中实现(近似)最优结果(换句话说,近似纳什均衡)仍然是一个挑战。游戏,足球教练或商业策略)。神经虚拟自我游戏(NFSP)是一种有效的算法,可以在没有先验领域知识的情况下从自我游戏中学习不完全信息博弈的近似纳什均衡。然而,它依赖于深度Q网络,这是离线的,很难在网络游戏中收敛随着对手战略的改变,所以在搜索规模大,搜索深度大的游戏中,它无法接近纳什均衡。在本文中,我们提出了蒙特卡罗神经虚拟自我游戏(MC-NFSP),这种算法将蒙特卡罗树搜索与NFSP相结合,大大提高了大规模零和不完备信息游戏的性能。实验上,我们证明了提出的蒙特卡罗神经虚拟自我游戏可以收敛到具有大规模搜索深度的游戏中的近似纳什均衡,而神经虚拟自我游戏则不能。此外,我们开发了异步神经虚拟自我游戏(ANFSP)。它使用异步和并行架构来收集游戏体验。通过实验,我们证明了平行的演员 - 学习者对训练有进一步的加速和稳定作用。
translated by 谷歌翻译
使用交通摄像头作为传感器的城市交通优化正在推动最先进的多目标多摄像机(MTMC)跟踪。这项工作介绍了CityFlow,一个城市规模的交通摄像机数据集,包含超过3小时的同步40个摄像头的10个交叉点的高清视频,两个同步摄像头之间的最长距离为2.5公里。据我们所知,CityFlow是空间覆盖范围内最大规模的数据集内容,以及城市环境中的摄像机/视频数量。该数据集包含超过200K个带注释的边界框,可以覆盖各种场景,视角,车辆模型和urbantraffic流动条件。提供相机几何和校准信息以帮助进行时空分析。此外,该基准的子集可用于基于图像的车辆识别(ReID)的任务。我们对MT2跟踪,多目标单摄像机(MTSC)跟踪,对象检测以及基于图像的ReID在此数据集上进行了基线/最先进方法的广泛实验评估,分析了不同网络架构的影响,损失函数,时空模型及其在任务有效性方面的组合。评估服务器在2019AI城市挑战赛(https://www.aicitychallenge.org/)上发布我们的基准测试,允许研究人员对他们最新技术的表现进行比较。我们希望这个数据集可以催化该领域的研究,推动最先进的技术发展,并在现实世界中实现部署的流量优化。
translated by 谷歌翻译
在本文中,我们研究了无人机在没有传统规划和控制管道的情况下通过倾斜的狭窄间隙飞行的问题。为此,我们提出了一个端到端的政策网络,它模仿传统的管道,并使用强化学习进行微调。与以前使用运动原理规划动态可行轨迹并通过几何控制器跟踪生成轨迹的工作不同,我们提出的方法是一种端到端的方法,它将飞行场景作为输入并直接输出四旋翼的推力 - 姿态控制命令。我们的论文是:1)提出模仿加强的训练框架。 2)使用端到端策略网络在狭窄的空隙中飞行,表明基于学习的方法也可以像传统管道那样解决高度动态的控制问题(参见附件视频:https://www.youtube.com/watch ?v = jU1qRcLdjx0)。 3)提出使用多层感知器对最佳轨迹发生器进行鲁棒模拟。 4)展示如何强化学习可以提高模仿学习的表现,以及实现比基于模型的方法更高的表现的潜力。
translated by 谷歌翻译
在本文中,我们从RGB视频中解决了3D对象网格重建的问题。我们的方法结合了最佳的多视图几何和数据驱动方法进行三维重建,通过优化对象网格形成多视图光度一致性,同时用ashape先前约束网格变形。我们将其视为每个网面投影的分段图像对齐问题。我们的方法允许我们从光度误差更新形状参数,而无需任何深度或掩模信息。此外,我们展示了如何通过从虚拟角度进行光栅化来避免零光度梯度的简并性。我们使用我们的光度网格优化来展示合成和现实世界视频的3D对象网格重建结果,无论是网状生成网络还是传统的表面重建管道,无需繁重的手工处理,都无法实现。
translated by 谷歌翻译