未经授权远程访问来自网络摄像机的流式视频的风险突显了对更强大的隐私保护的需求。为此,我们模拟了一个无镜头编码孔径(CA)相机作为外观编码器,即第一层隐私保护。我们的目标是从编码孔径视频中进行人类动作识别,其编码孔径掩模未知并且不需要重建。我们通过使用基于相位相关和对数极坐标变换的不可逆运动特征来插入第二层隐私保护。相位相关对转换进行编码,而对数极坐标变换对面内旋转和缩放进行编码。 Weshow翻译功能的关键属性是掩码不变的。该属性允许我们通过消除对特定掩模设计的依赖来简化分类器的训练。基于UCF和NTUdatasets子集的结果显示了我们系统的可行性。
translated by 谷歌翻译
我们提出了一种强化学习方法,用于可个性化的移动相机的实时曝光控制。我们的方法基于MarkovDecision Process(MDP)。在相机取景器或实时预览模式中,给出当前帧,我们的系统预测曝光的变化,以优化图像质量,快速收敛和最小时间振荡之间的权衡。我们将曝光预测函数建模为完全卷积神经网络,可以通过高斯政策梯度以端到端的方式进行训练。因此,我们的系统可以将场景语义与曝光值相关联;它还可以扩展为个性化用户和设备的曝光调整。我们通过结合将语义与曝光相结合的自适应计量模块来提高学习性能。这种自适应计量模块推广了传统的点或矩阵计量技术。我们使用MIT FiveK和使用iPhone 7和Google Pixel捕获的owndatasets来验证我们的系统。实验结果表明,与通过本机摄像机控制实现的系统相比,我们的系统具有稳定的实时行为,同时提高了视觉质量。
translated by 谷歌翻译
We propose a new technique for visual attribute transfer across images thatmay have very different appearance but have perceptually similar semanticstructure. By visual attribute transfer, we mean transfer of visual information(such as color, tone, texture, and style) from one image to another. Forexample, one image could be that of a painting or a sketch while the other is aphoto of a real scene, and both depict the same type of scene. Our technique finds semantically-meaningful dense correspondences between twoinput images. To accomplish this, it adapts the notion of "image analogy" withfeatures extracted from a Deep Convolutional Neutral Network for matching; wecall our technique Deep Image Analogy. A coarse-to-fine strategy is used tocompute the nearest-neighbor field for generating the results. We validate theeffectiveness of our proposed method in a variety of cases, includingstyle/texture transfer, color/style swap, sketch/painting to photo, and timelapse.
translated by 谷歌翻译
时空图学习正成为图学研究中越来越重要的对象。许多应用领域涉及高度动态的图形,其中时间信息是至关重要的交通网络和金融交易图。尽管在学习结构化数据方面取得了不断进步,但仍然缺乏从时空结构中提取动态复杂特征的有效手段。特别地,诸如卷积网络或递归神经网络的传统模型不能短期或长期地揭示时间模式并且同时从时空图中探索局部或全局范围内的空间属性。为了解决这个问题,我们设计了一种新的多尺度架构,即时空U-Net(ST-UNet),用于图形结构的时间序列建模。在这个U形网络中,相应地提出了成对采样操作的空间域:池(ST-Pool)从其确定性分区中粗略地粗略化输入图,同时通过扩展的循环跳过连接抽象出多分辨率时间依赖性;基于下采样中的先前设置,解开(ST-Unpool)恢复时空图的原始结构并在图形序列中恢复规则间隔。时空预测任务的实验表明,我们的模型有效地捕获了多个尺度的综合特征,并在几个真实世界的数据集上实现了对主流方法的实质性改进。
translated by 谷歌翻译
关系提取的远程监督严重受到错误标记问题的困扰。为了在时间戳的新闻数据中缓解这个问题,考虑新的因素时间,并提出一个新的时间感知的监督框架(Time-DS)。 Time-DS由时间序列实例 - 流行度和两种策略组成。实例流行度是对时间和真实关系提及的强相关性进行编码。因此,实例流行度将是减少通过远程监督标签产生的噪声的有效线索。这两种策略,即硬过滤和课程学习,都是以Time-DS的方式实现更好的相关提取的实例流行度的方法。课程学习是利用实例流行度消除噪声影响的一种更复杂,更灵活的方式,从而获得更好的关系提取性能。我们收集的多源新闻语料库的实验表明,Time-DSachie关系提取有了显着的改进。
translated by 谷歌翻译
今天的机器人系统越来越多地转向计算上昂贵的模型,例如深度神经网络(DNN),用于定位,感知,计划和对象检测等任务。然而,资源受限的机器人,如低功率无人机,通常没有足够的机载计算资源或功率储备来可扩展地运行最准确的,最先进的网络计算模型。云机器人技术允许移动机器人将计算机卸载到集中式服务器,如果它们在本地不确定或想要运行更准确的计算密集型模型。然而,云机器人成为一个关键的,通常低估的成本:与云过度拥塞的无线网络通信可能导致延迟或数据丢失。实际上,通过拥塞网络从多个机器人发送高数据速率视频或LIDAR会导致实时应用程序的延迟过高,我们会通过实验测量。在本文中,我们制定了一个新的机器人卸载问题---机器人如何以及何时卸载传感任务,特别是如果它们不确定,在提高准确性的同时最大限度地降低云通信的成本?我们将卸载制定为机器人的顺序决策问题,并提出使用深度强化学习的解决方案。在使用最先进的视觉DNN的模拟和硬件实验中,我们的卸载策略将视觉任务性能提高了1.3-2.6倍的基准标记卸载策略,使机器人有可能显着超越其板载传感精度,但云通信成本有限。
translated by 谷歌翻译
探索性数据分析是知识发现的一个基本方面,旨在找到数据集的主要特征。维数减少(例如流形学习)通常用于将adataset中的要素数量减少到人类解释的可管理级别。尽管如此,大多数流氓学习技术并没有解释有关原始特征和数据集真实特征的任何信息。在本文中,我们提出了称为GP-MaL的流形学习的老化编程方法,它通过使用可解释的树来演变从高维空间到低维空间的功能映射。我们表明,GP-MaL具有竞争力,不存在流形学习算法,同时生成可以在无法看到的数据上进行解释和重复使用的模型。在该过程中发现了许多有希望的未来研究方向。
translated by 谷歌翻译
在本文中,我们开发了一种称为分层预测网络(HPNet)的分层网络模型,以了解时空记忆如何在视觉皮层层次结构中的循环电路中被学习和编码,以预测未来的视频帧。这种神经启发的模型在综合分析框架中运作。它包含一个前馈路径,用于计算和编码连续复杂度的时空特征,以及连续级别的反馈路径,以便将它们的解释投影到下面的级别。在每个级别内,前馈路径和反馈路径在LSTM模块中实例化的循环门控电路中进行交互,以生成对输入信号的预测或解释。该网络通过最小化其在层次结构的每个级别上的输入信号的预测误差来学习其世界的内部模型。我们发现,即使在最早的模块中,网络中的层次交互也增加了沿着层次结构的单元的群体代码中的全局运动模式的语义聚类。这有助于学习运动模式之间的关系,从而在基准数据集中的长程视频序列预测中产生最先进的性能。网络模型自动再现在视觉皮层中观察到的各种预测抑制和熟悉抑制神经生理现象,表明分层预测可能确实是视觉皮层中表征学习的重要原则。
translated by 谷歌翻译
转型人工智能技术有可能在不久的将来重塑社会的关键方面。但是,为了适当地为这些技术的到来准备政策,需要准确的预测和时间表。在2018年夏季(ICML,IJCAI和HLAI会议)对三个AI会议的与会者进行了一项调查。该调查包括在下一个十年评估AI能力的问题,预测变革AI的五个场景的问题以及关于计算影响的问题。人工智能研究中的资源。受访者表示,人工任务的中位数为21.5%(即人工目前支付的所有任务)现在可以实现自动化,并且这个数字将在5年内上升到40%,在10年内上升到60% 。中位数预测表明,人工智能系统有50%的概率能够在25年内实现90%的当前人工任务自动化,并在50年内实现99%的当前人工任务。发现出席会议对所有预测产生了统计上的显着影响,HLAI的与会者提供了更加乐观的时间表,而且不确定性较低。这些研究结果表明,人工智能专家预计人工智能技术的重大发展将在未来十年内持续到可能对社会产生深远变革影响的程度。
translated by 谷歌翻译
无监督图像转换旨在学习在给定未配对训练数据的情况下从源域到另一个目标域的转换。一些最先进的作品在GANs-basedunsupervised图像到图像翻译中取得了令人瞩目的成果。与纹理更改任务(如样式转换)相比,它无法捕获域之间的强几何或结构变化,或者对于复杂场景不能令人满意。最近,SAGAN(HanZhang,2018)表明,自我关注网络比基于卷积的GAN产生更好的结果。然而,这些注意网络在无监督的图像到图像转换任务中的有效性尚未得到验证。在本文中,我们提出了一种具有自我关注网络的无监督图像到图像的翻译,其中远程依赖性不仅有助于捕获强烈的几何变化,而且还可以使用来自所有特征位置的细节来生成细节。在实验中,我们定性地和定量地显示了与现有的最先进的无监督图像到图像转换任务相比所提出的方法的优越性。
translated by 谷歌翻译