我们介绍了DeepCache,这是一种原理缓存设计,用于持续移动视觉中的深度学习推理。 DeepCache通过在输入视频流中开发时间局部性来提高模型执行效率。它解决了移动视觉引发的一个关键挑战:缓存必须在视频场景变化下运行,同时在缓存性,开销和模式精度损失之间进行权衡。在模型的输入端,DeepCache通过利用视频的内部结构发现视频时间局部性,为此借鉴了视频压缩的经验证据;在模型中,DeepCache通过利用模型的内部结构来传播可重用结果的区域。值得注意的是,DeepCache避免将视频启发式应用于模型内部模型,这些内部结构不是像素,而是高维,难以理解的数据。我们的DeepCache实现与未经修改的深度学习模型一起使用,需要零开发人员的手动工作,因此可立即部署在现成的移动设备上。我们的实验表明,DeepCache平均将推理执行时间节省了18%,最多可节省47%。 DeepCache平均将系统能耗降低20%。
translated by 谷歌翻译
机器学习正在从艺术和科学转变为可供每个开发人员使用的技术。在不久的将来,每个平台上的每个应用程序都将包含训练有素的模型,以编码开发人员无法创作的基于数据的决策。这提出了一个重要的工程挑战,因为目前数据科学和建模在很大程度上与标准软件开发过程脱钩。这种分离使得在应用程序内部的机器学习能力不必要地变得困难,并且进一步阻碍了开发人员将MLin置于首位。在本文中,我们介绍了ML .NET,这是一个在过去十年中在Microsoft开发的框架,用于应对在大型软件应用程序中轻松发布机器学习模型的挑战。我们提出了它的架构,并阐明了形成它的应用程序需求。具体而言,我们引入了DataView,它是ML .NET的核心数据抽象,它可以有效地,一致地捕获完整的预测管道,并在训练和推理生命周期中进行。我们结束了论文,对ML .NET进行了令人惊讶的有利的性能研究,与更多的接受者相比,并讨论了一些经验教训。
translated by 谷歌翻译
交通信号控制是一种新兴的应用场景,用于加强学习。除了作为影响人们通勤日常生活的重要问题之外,交通信号控制在适应动态交通环境和协调包括车辆和行人在内的数千名代理人方面对于强化学习提出了独特的挑战。现代强化学习成功的关键因素依赖于商品模拟器来生成大量用于学习的数据样本。然而,最常用的开源流量模拟器SUMO不能扩展到大型公路网和大流量,这阻碍了对交通场景的强化学习的研究。这促使我们创建一个新的流量模拟器CityFlow,它具有基本优化的数据结构和高效的算法。 CityFlow可以根据合成和真实数据支持灵活的道路网络和交通流量定义。它还提供了用户友好的强化学习界面。最重要的是,CityFlow比SUMO快20多倍,并且能够通过交互式渲染形式监控来支持全市范围的交通模拟。除了交通信号控制,CityFlow还可以作为其他交通研究的基础,并为智能交通领域的测试机器学习方法创造新的可能性。
translated by 谷歌翻译
尽管其重要性,乘客需求预测仍然是一个具有高度挑战性的问题,因为需求同时受到许多空间和时间因素与其他外部因素(如天气)之间的复杂相互作用的影响。为了解决这个问题,我们提出了一个Spatio-TEmporalFuzzy神经网络(STEF-Net)来准确预测乘客需求,以解决所有已知重要因素的复杂相互作用。我们设计了一个端到端的学习框架,其中不同的神经网络建模了不同的因素。具体而言,我们建议通过卷积长短期记忆网络和模式神经网络捕获时空特征交互,模糊神经网络处理的数据不确定性明显优于确定性方法。为了在融合两个网络时保持时间关系并强调有区别的时空特征交互,我们采用了一种新的特征融合方法,即卷积操作和注意层。据我们所知,我们的工作是第一个深度递归神经网络和模糊神经网络来模拟复杂的时空特征相互作用与额外的不确定输入特征进行预测学习。在大型真实世界数据集上的实验表明,我们的模型比最先进的方法实现了超过10%的改进。
translated by 谷歌翻译
由于大量会话数据的可用性以及针对会话AI的神经方法的进展,开发智能开放域对话系统的兴趣日益浓厚。与传统的面向任务的机器人不同,开放域对话系统旨在通过满足人类对沟通,感情和社会归属的需求来与用户建立长期联系。本文回顾了最近关于neuralapproaches的工作,这些工作致力于解决开发此类系统的三个挑战:语义,一致性和交互性。语义学要求adialog系统不仅要理解对话框的内容,还要在对话过程中识别用户的社交需求。一致性要求系统展示一致的个性以赢得用户的信任和gaintheir的长期信心。互动性是指系统产生人际反应以实现特定社会目标的能力,如娱乐,整合和任务完成。我们选择的作品基于我们独特的观点,并不完整。尽管如此,我们希望这次讨论将激发新的研究,以开发更智能的对话系统。
translated by 谷歌翻译
视觉世界中的大多数物体都被部分遮挡,但人类可以毫无困难地识别它们。然而,仍然不知道卷积神经网络(CNN)等对象识别模型是否可以处理现实世界的遮挡。还有一个问题是,使这些模型对恒定掩模遮挡具有鲁棒性的努力是否对于真实世界的阻塞是有效的。我们测试了人类和上述计算模型在极端遮挡下对象识别的挑战性任务,其中目标对象被真实背景中的无关真实对象严重遮挡。我们的结果表明人类视觉对于极端遮挡是非常强大的,而CNN不是,即使经过修改以处理恒定的遮罩遮挡。这表明处理恒定掩模遮挡的能力并不意味着对现实世界遮挡的鲁棒性。作为比较,我们提出了另一种计算模型,该模型利用组合方式中的对象部分/子部分来构建对遮挡的鲁棒性。这在我们的任务上与基于CNN的模型相比具有与人类类似的错误模式。这些结果表明,极端遮挡下的测试可以更好地揭示视觉识别的稳健性,并且组成原则可以鼓励这种稳健性。
translated by 谷歌翻译
合作在多智能体强化学习(MARL)中至关重要。在交通信号控制的背景下,交通信号控制之间的良好合作使得车辆能够更加顺畅地通过交叉口。传统的交通方式通过预先计算两个交叉口之间的偏移来实现合作。这种预先计算的偏移量不适用于动态交通环境。为了结合促进学习(RL)中的合作,提出了两种典型的方法来考虑其他因素的影响:(1)学习通信(即代理之间的影响的表示)和(2)学习代理的联合。尽管在最近的研究中联合行动模型已经显示出一种优选的趋势,但是在交通信号控制的背景下,尚未系统地研究改进药剂之间通信学习的深入研究。为了学习代理之间的通信,在本文中,我们建议使用图注意网络来促进合作。具体来说,对于网络中的目标交叉点,我们提出的模型CoLight不仅可以结合邻近交互的影响,还可以学会将它们的影响区分为目标交叉点。据我们所知,我们是第一个在交通信号控制强化学习环境中使用graphattentional网络的人。在实验中,我们通过学习通信证明,所提出的模型可以获得令人惊讶的良好性能,而基于联合动作建模的现有方法无法很好地学习。
translated by 谷歌翻译
深度生成模型是数据建模的有效方法。然而,单个生成模型并不容易忠实地捕获诸如图像之类的复杂数据的分布。在本文中,我们提出了一种促进生成模型的方法,它将元模型级联在一起以产生更强的模型。可以利用支持可能性评估的任何隐藏变量元模型(例如,RBM和VAE)。我们推导出增强模型的可分解变分下界,它允许每个元模型分别和贪婪地训练。此外,我们的框架可以扩展为tosemi-supervised boosting,其中增强模型学习数据和标签的联合分布。最后,我们将增强框架与多重增强框架相结合,进一步提高了生成模型的学习能力。
translated by 谷歌翻译
多视图子空间聚类旨在根据其基础子空间结构将一组多源数据划分为多个组。尽管基于光谱聚类的方法在多视图聚类中实现了推广,但是它们的效用受到隔离​​亲和矩阵构造和聚类指示符估计的单独学习方式的限制。在本文中,我们建议在统一模型中共同学习自我表征,继续和离散集群指标。我们的模型可以探索每个视图的子空间结构并融合它们以便同时进行聚类。两个基准数据集的实验结果表明,我们的方法优于其他现有的竞争性多视图聚类方法。
translated by 谷歌翻译
虽然神经网络已经在各种应用中取得了很大的进步,但是它们仍然非常具有挑战性,可以从连续的任务流中学习而不会忘记。持续学习是一种新的学习范式,旨在解决这个问题。在这项工作中,我们提出了一种新的连续学习模型,称为贝叶斯优化持续学习与注意机制(BOCL),通过贝叶斯优化动态扩展新任务到达时的网络容量,并选择性地利用以前的知识(例如先前任务的特征图)通过关注机制。我们对MNIST和CIFAR-100变体的实验表明,我们的方法在防止灾难性遗忘和更好地完成新任务方面优于最先进的技术。
translated by 谷歌翻译