As low-cost surveillance cameras proliferate, we advocate for these cameras to be zero streaming: ingesting videos directly to their local storage and only communicating with the cloud in response to queries. To support queries over videos stored on zero-streaming cameras, we describe a system that spans the cloud and cameras. The system builds on two unconventional ideas. When ingesting video frames, a camera learns accurate knowledge on a sparse sample of frames, rather than learning inaccurate knowledge on all frames; in executing one query, a camera processes frames in multiple passes with multiple operators trained and picked by the cloud during the query, rather than one-pass processing with operator(s) decided ahead of the query. On diverse queries over 720-hour videos and with typical wireless network bandwidth and low-cost camera hardware, our system runs at more than 100× video realtime. It outperforms competitive alternative designs by at least 4× and up to two orders of magnitude.
translated by 谷歌翻译
最近人工智能的快速发展(人工智能,主要由机器学习研究,特别是深度学习驱动)已经在各种应用中获得了惊人的成功。但是,为了进一步将AI技术应用于实际环境中,应该解决有关AI生态系统的几个重要问题。我们将主要问题确定为数据隐私,所有权和交换,这些问题很难通过当前的机器学习培训方法集中范式来解决。因此,我们提出了基于区块链的新模型训练范例,名为Galaxy Learning,用于训练具有分布式数据的模型并保留其所有者的数据所有权。在这个新的范例中,加密模型会被移动,并且一旦经过训练就会联合起来。通过区块链及其智能合约实现模型培训以及沟通。培训数据的定价取决于其贡献,因此不是数据所有权的交换。在这篇立场文件中,我们描述了GalaxyLearning的动机,范例,设计和挑战以及机遇。
translated by 谷歌翻译
重采样检测在识别图像篡改(例如图像拼接)中起重要作用。目前,重采样检测在重新压缩的图像中仍然是困难的,其通过将重采样和后JPEG压缩应用于主JPEG图像而产生。虽然低质量的初级压缩有利于检测,但由于在成像装置中广泛使用中/高质量压缩,它仍然相当具有挑战性。在本文中,我们提出了一种新颖的深度学习方法,直接从重新压缩的图像中学习重采样特征。为此,部署基于低阶高通滤波器的噪声提取层以产生图像噪声残余域,这更有利于提取操纵轨迹特征。提出了Adual-stream卷积神经网络(CNN)来捕获沿不同方向的采样路径,其中水平和垂直流是交错和连接的。最后,将学习的特征馈送到Sigmoid / Softmax层,其用作分别用于重采样操作的盲检测或参数估计的二进制/多分类器。大量的实验结果表明,我们提出的方法可以在重新压缩的图像中有效地检测重采样并且优于最先进的检测器。
translated by 谷歌翻译
递归神经网络(RNN)已被广泛用于处理自然语言任务并取得巨大成功。传统的RNN通常统一和平等地对待句子中的每个句子。然而,这可能会错过句子的丰富语义结构信息,这对理解自然语言很有用。由于诸如词依赖模式之类的语义结构未被参数化,因此捕获和利用结构信息是一项挑战。在本文中,我们提出了一种改进的RNN变体,即多信道RNN(MC-RNN),以动态捕获和利用本地语义结构信息。具体地,MC-RNN包含多个信道,每个信道一次表示局部依赖模式。根据语义信息,引入注意机制以在每个步骤组合这些模式。然后,我们通过自适应地选择通道之间最合适的连接结构来参数化结构信息。通过这种方式,MC-RNN可以很好地捕获多语言结构和句子中的依赖模式。为了验证MC-RNN的有效性,我们对典型的自然语言处理任务进行了广泛的实验,包括神经机器翻译,抽象概括和语言建模。关于这些任务的实验结果都显示出MC-RNN相对于当前系统的显着改进。
translated by 谷歌翻译
林等人。 (报告,2018年9月7日,第1004页)报告了一个非凡的建议,采用被动的,严格线性的光学设置来进行性能分类。但是将多层衍射设置解释为ade神经网络并将其称为全光学深度学习框架并不合理,并且通过忽视其完美线性和严格钝性的定义特征来表示系统的错误表征。
translated by 谷歌翻译
如今,编辑们倾向于将长篇Wiki-pediaarticle的不同子主题分成多个子文章。这种分离旨在提高人类的可读性。然而,它也对依赖于文章概念假设的许多基于维基百科的任务产生了有害影响,这种假设要求仅通过一篇文章来描述eachentity(或概念)。这种基本假设显着简化了知识表示和提取,并且对于许多现有技术至关重要,例如自动知识库构建,跨语言知识对齐,语义搜索和维基百科实体的数据库。在本文中,我们提供了一种方法,将分散的子文章与其相应的主要文章相匹配,以促进自动化维基百科的策划和处理。所提出的模型采用分层学习结构,该结构将神经文档对编码器的多个变量与一组全面的显式特征组合在一起。创建大型众包数据集以支持任务的评估和特征提取。基于大数据集,所提出的模型可以产生有希望的交叉验证结果,并且显着优于以前的方法。整个英语维基百科上的大规模服务通过有效地提取大量新配对的主要和子文章来提高所提出模型的实用性和可扩展性。
translated by 谷歌翻译
风格转移一直是计算机视觉和图形学中的一个重要课题。加蒂等人。首先证明由预先训练的VGG网络提取的深度特征代表图像的内容和样式特征,因此,可以通过特征空间中的优化来实现样式转移。黄等人。然后通过简单地对齐每个特征通道的均值和方差,表明实时任意样式转移可以发生变化。然而,在本文中,我们认为仅仅调整深度特征的全局统计数据并不总能保证良好的风格转移。相反,我们建议联合分析输入图像对并提取两者之间的共同/可交换的样式特征。此外,还开发了一种新的融合模式,用于在特征空间中结合内容和样式信息。定性和定量实验证明了我们的方法的优势。
translated by 谷歌翻译
在本文中,我们提出神经短语到短语机器翻译(NP $ ^ 2 $ MT)。我们的模型使用短语注意机制来发现解码器用来生成输出(目标)短语的相关输入(源)段。我们还设计了一种有效的动态编程算法来解码分段,这些分段允许比Huang等人现有的基于神经短语的机器翻译方法更快地训练模型。 (2018)。此外,我们的方法可以在解码期间自然地与外部短语词典集成。经验实验表明,我们的方法与基准数据集上的最新方法具有可比性。但是,当训练和测试数据来自不同的分布或域时,我们的方法表现更好。
translated by 谷歌翻译
自然语言生成(NLG)是面向任务的对话系统的重要组成部分。尽管近来NLG的神经方法取得了成功,但它们通常是针对具有丰富注释训练样本的特定域开发的。在本文中,我们在资源匮乏的环境中研究NLG,以便通过少量训练示例在新场景中生成句子。我们从元学习的角度阐述问题,并基于公认的模型不可知元学习(MAML)算法提出基于广义优化的方法(Meta-NLG)。 Meta-NLG定义了一组元代码,并直接将适应新的低资源NLG任务的目标纳入元学习优化过程。对具有多样性变化的大型多域数据集(MultiWoz)进行了广泛的实验。我们表明,Meta-NLG在各种低资源配置中明显优于其他方法。我们分析结果,并证明Meta-NLG适应极快和良好的资源情况。
translated by 谷歌翻译
解密潜在空间中的内容和风格是普通的文本风格转移。然而,在大多数当前神经模型中存在两个主要问题。 1)很难从句子的语义中完全剥离样式信息。 2)基于递归神经网络(RNN)的编码器和解码器,由潜在表示介导,不能解决长期依赖问题,导致非风格语义内容的保存。本文提出了风格变换器,它没有对潜在句子的潜在表现做出任何假设,并且配备了变形金刚注意机制的力量,以实现更好的风格转移和更好的内容保存。
translated by 谷歌翻译