我们通过允许在用户频率上进行非均匀分布来概括强盗在线聚类的设置。提出了一种更有效的算法,其具有简单的集合结构来表示集群。我们证明了对新算法的遗憾,该算法没有用户的最小频率。合成和真实数据集上的实验一致地显示了新算法优于现有方法的优势。
translated by 谷歌翻译
在本文中,我们提出了三种解决鲁比克立方体颜色识别的方法,包括一种离线方法和两种在线方法。提出了一种离线方法Scatterbalance \和极限学习机(SB-ELM)来说明基于训练的方法的效率。我们还指出了颜色漂移的概念,这表明离线方法总是有效,并且在连续变化环境中不能很好地工作。相比之下,动态重量标签传播被提出用于通过Rubik立方体的已知中心块颜色来标记块颜色。此外,弱标签层次传播,另一种在线方法,也被提出用于未知的全彩色信息,但仅利用中心块的弱标签进行颜色识别。我们最终设计了一个魔方机器人并构建了一个数据集来说明我们在线方法的效率和有效性,并通过我们的数据流中的颜色漂移来指示离线方法的无效性。
translated by 谷歌翻译
在移动/物联网设备上部署深度学习模型是一项具有挑战性的任务。难点在于计算速度和准确性之间的权衡。具有高精度的Acomplex深度学习模型在资源有限的设备上运行缓慢,而运行速度更快的轻量级模型会失去准确性。在本文中,我们提出了一种新的分解方法,即DAC,它能够将普通的卷积层分解成两层,参数更少。 DAC直接根据原始卷积层的权重计算新生成的层的相应权重。因此,不需要训练(或微调)或任何数据。实验结果表明DAC减少了大量的浮点运算(FLOP),同时保持了预训练模型的高精度。如果2%的准确度是可以接受的,DAC可以在ImageNet数据集上保存VGG16图像分类模型的53%FLOP,在PASCAL VOC2007dataset上保存SSD300物体检测模型的29%FLOPS,以及在MicrosoftCOCO数据集上保存多人姿势估计模型的46%FLOPS。与其他现有分解方法相比,DAC实现了更好的性能。
translated by 谷歌翻译
随着网络深度和宽度的增加,深度神经网络(DNN)的性能在近年来不断提升。为了在移动电话等边缘设备上启用DNN,研究人员提出了几种网络压缩方法,包括修剪,量化和分解。在基于因子化的方法中,低秩近似由于其坚实的理论基础和有效的实现而被广泛采用。以前的几个工作试图通过低秩分解直接逼近预训练模型;然而,参数中的小近似误差可以获得大的预测损失。因此,性能通常会显着下降,并且需要进行复杂的微调才能恢复准确性。我们认为将低秩近似与训练分开并不是最佳选择。与以前的作品不同,本文将低秩近似和正则化集成到训练中。我们提出训练等级修剪(TRP),它迭代低等级近似和训练。 TRP保持原始网络的容量,同时在训练期间施加低级别约束。利用随机亚梯度下降优化核正则化进一步促进TRP中的低秩。 TRP训练的网络本质上具有低秩结构,并且可以以可忽略的性能损失来近似,消除了低秩近似之后的微调。这些方法在CIFAR-10和ImageNet上进行了全面评估,优于使用低秩近似的先前压缩方法。
translated by 谷歌翻译
我们提出了一个正式的测量 - 神经网络理论理论(NN)建立概率耦合理论。我们的主要贡献概括如下。 *建立在概率耦合理论的形式基础上,我们推导出分析框架,称为分层测量组和近似系统(HMGAS),绰号为S-System,旨在学习物理世界中复杂的层次,统计依赖。 *当概率核采用某些指数族分布时,我们证明NN是S系统的特例。激活功能正式推出。我们通过信息几何进一步赋予NN几何,表明NN的中间特征空间是随机流形,并证明样本之间的“距离”收缩为层叠。 * S-System显示NN本质上是随机的,并且在一组现实有界性和多样性条件下,它使我们能够证明对于具有一类损失的大尺寸非线性深NN,包括铰链损耗,最小极小是全局最小值,零损失误差,以及最小区域周围的区域是平坦盆地,其中Hessians的所有特征值都集中在零点,使用来自平均场理论,随机矩阵理论和非线性算子方程的工具和思想。 * S-System,信息几何结构和优化行为组合完成了重整化组(RG)和NN之间的模拟。它表明NN是一种复杂的自适应系统,可以在多个尺度上估计微观物体(例如像素)的统计依赖性。与RG在物理学中产生的明确物理量(例如,温度)不同,NN通过学习/优化而出现的流形正整化/重组,将样本空间划分为由监督标签(在受监督的NN中)所支配的高度语义上有意义的群体。
translated by 谷歌翻译
基于深度学习的场景文本检测方法在过去几年取得了显着的成果。然而,由于自然场景的高度多样性和复杂性,当应用于在现实世界环境中捕获的图像时,先前最先进的文本检测方法可能仍然产生大量的误报。为了解决这个问题,主要受到Mask R-CNN的启发,我们在本文中提出了一种基于特征金字塔网络(FPN)和实例分割的场景文本检测的有效模型。我们建议监督金字塔上下文网络(SPCNET)精确定位文本区域,同时抑制误报。受益于语义信息的指导和共享FPN,SPCNET在引入边际计算时获得了显着增强的性能。标准数据集上的实验表明,我们的SPCNET明显优于最先进的方法。具体而言,ICDAR2013的F测量值为92.1%,ICDAR2015为87.2%,ICDAR2017 MLT为74.1%,Total-Text为82.9%。
translated by 谷歌翻译
尽管取得了许多成功,但基于深度神经网络(DNN)的图像重建通常表现出高和低空间频带之间的不均匀保真度。在本文中,我们提出了DNN学习综合(LS-DNN)方法,其中两个DNN分别处理低空间频率和高空间频率,并且改进[30],两个DNN分别训练,第三个DNN将图像与高图像相结合所有乐队的忠诚度。我们在双周反问题中证明了LS-DNN:衍射极限成像(DLI)中的超分辨率(SR)和定量相位检索(QPR)。我们的结果还显示了基于感知损耗的SR [21]的可比性或改进性能,并且可以推广到更广泛的图像恢复问题。
translated by 谷歌翻译
As a disruptive technology, blockchain, particularly its original form of bitcoin as a type of digital currency, has attracted great attentions. The innovative distributed decision making and security mechanism lay the technical foundation for its success, making us consider to penetrate the power of blockchain technology to distributed control and cooperative robotics, in which the distributed and secure mechanism is also highly demanded. Actually, security and distributed communication have long been unsolved problems in the field of distributed control and cooperative robotics. It has been reported on the network failure and intruder attacks of distributed control and multi-robotic systems. Blockchain technology provides promise to remedy this situation thoroughly. This work is intended to create a global picture of blockchain technology on its working principle and key elements in the language of control and robotics, to provide a shortcut for beginners to step into this research field.
translated by 谷歌翻译
社会产品,例如医疗保健,智能城市和信息网络,通常会在连续的时间内生成有序的事件数据。这些事件数据的生成过程可能非常复杂,需要灵活的模型来捕获它们的动态。时间点过程提供了一个优雅的框架形式化事件数据,而无需离散时间。然而,现有的最大似然估计(MLE)学习范例需要预先手工制作强度函数,并且不能直接监测训练过程中估计模型的拟合度。为了减轻MLE中模型错误指定的风险,我们建议从生成模型生成样本并在训练过程中监控样本的质量,直到样本和真实数据无法区分。我们从强化学习(RL)中获取灵感,并将eachevent的生成视为随机政策所采取的行动。我们将策略参数化为灵活的递归神经网络,并逐步改进策略以模拟观察到的事件分布。由于奖励函数在本设置中是未知的,因此我们使用逆强化学习公式来揭示奖励函数的分析和非参数形式。这个新的RL框架允许我们为学习灵活的点过程模型推导出一种有效的策略梯度算法,并且我们证明它在合成和实际数据中都表现良好。
translated by 谷歌翻译
人员重新识别(reID)是一项重要任务,需要在给定一个感兴趣的人的图像的情况下从图像数据集中检索人的图像。为了学习健壮的人物特征,人物影像的姿势变化是关键挑战之一。针对问题的现有工作要么执行人对齐,要么学习基于人区域的表示。通常需要额外的姿势信息和计算成本用于推断。为了解决该问题,提出了用于学习与身份相关和姿势无关的表示的特征提取生成对抗网络(FD-GAN)。它是一种基于暹罗结构的新颖框架,具有人类姿势和身份的多种新颖鉴别器。除了识别者之外,还集成了一种新颖的相同姿势损失,这要求同一人生成的图像的外观相似。在通过姿势引导学习无关人物特征之后,在测试期间不需要辅助姿势信息和额外的计算成本。我们提出的FD-GAN在三人reIDdatasets上实现了最先进的性能,这证明了所提出的FD-GAN的有效性和强大的特征提取能力。
translated by 谷歌翻译