我们通过$ \ ell_1 $ -minimization研究从一组信号中全局恢复字典的问题。我们假设信号是asi.i.d生成的。来自完整参考字典$ D ^ * \ in \ mathbb R ^ {K \ times K} $的$ K $原子的随机线性组合,其中线性组合系数来自伯努利型模型或精确稀疏模型。首先,我们获得必要且充分的规范条件,引用的字典$ D ^ * $是预期的$ \ ell_1 $目标函数的一个尖锐的局部最小值。我们的结果大大扩展了Wu和Yu(2015)的结果,并允许组合系数是非负的。其次,我们在所引用的字典的目标值最小的区域上获得显式绑定。第三,我们证明了参考字典是唯一的尖锐局部最小值,从而建立了第一个已知的$ \ ell_1 $ -minimization字典学习的全局属性。在理论结果的推动下,我们引入了基于扰动的测试来确定adictionary是否是目标函数的尖锐局部最小值。此外,我们还提出了一种新的基于Block CoordinateDescent的字典学习算法,称为DL-BCD,保证具有单调收敛性。模拟研究表明DL-BCD在恢复率方面具有竞争性,与许多状态相比。 -art字典学习算法。
translated by 谷歌翻译
车辆重新识别是一个重要的问题,随着视频监控和智能传输应用的快速扩展而变得可取。通过回顾人类视觉的识别过程,我们发现当人类识别不同的车辆时存在本地的等级依赖性。具体地,人类总是首先确定一个车辆的粗粒度类别,即汽车模型/类型。然后,在预测的汽车模型/类型的分支下,他们将通过细微的视觉线索(例如,定制的绘画和挡风玻璃)在细粒度水平上识别特定的车辆。受粗到细分层过程的启发,我们提出了一种用于车辆重新识别的端到端基于RNN的分层注意(RNN-HA)分类模型。 RNN-HA由三个相互耦合的模块组成:第一个模块生成车辆图像的图像表示,第二个层次模块模拟上述层级依赖关系,最后一个注意模块侧重于捕获特定车辆彼此之间的细微视觉信息识别。通过对两个车辆重新识别基准数据集VeRi和VehicleID进行全面的实验,我们证明了所提出的模型实现了超越现有技术的卓越性能。
translated by 谷歌翻译
尽管无监督人员重新识别(RE-ID)由于其有可能解决监督的RE-ID模型的可扩展性问题而引起越来越多的研究关注,但是在不相交的摄像机视图中在没有成对标签的情况下学习判别信息是非常具有挑战性的。为了解决这个问题,我们提出了一个用于无监督RE-ID的软多标记学习的深度模型。该想法是通过将未标记的人与来自辅助域的一组已知参考人进行比较来为每个未标记的人学习软多标记(实值标签似然向量)。我们提出了软多标记引导的硬阴性挖掘,通过探索视觉特征与未标记目标对的软多标记的相似性一致性来学习未标记目标域的无差别嵌入。由于大多数目标对是交叉视图对,我们开发了交叉视图一致的软多标记学习,以实现软多标记在不同摄像机视图中始终良好的学习目标。为了实现有效的软多标记学习,我们引入了参考代理学习以通过参考嵌入来表示每个参考人。我们在Market-1501和DukeMTMC-reID上评估我们的统一深度模型。我们的模型通过明确的边距优于未经监督的无监督RE-ID方法。代码可在https://github.com/KovenYu/MAR获得。
translated by 谷歌翻译
贝叶斯优化在优化耗时的黑盒目标方面很受欢迎。尽管如此,对于深度神经网络中的超参数调整,即使是一些超参数设置评估验证错误所需的时间仍然是瓶颈。多保真优化有望减少对这些目标使用更便宜的代理 - 例如,使用训练点的子集训练网络的验证错误或者收敛所需的迭代次数更少。我们提出了一种高度灵活和实用的多保真贝叶斯优化方法,重点是有效地优化迭代训练的监督学习模型的超参数。我们引入了一种新的采集功能,即跟踪感知知识梯度,它有效地利用了多个连续保真度控制和跟踪观察---保真序列中物镜的值,当使用训练迭代改变保真度时可用。我们提供了可用于优化我们的采集功能的可变方法,并展示了它为超神经网络和大规模内核学习的超参数调整提供了最先进的替代方案。
translated by 谷歌翻译
在中国快速城市化建设过程中,城市地理信息的获取和及时的数据更新是城市精细化管理的重要和根本要素。随着国内遥感技术的发展,Gaofen-2(GF-2)高分辨率遥感图像的应用可以大大提高信息提取的准确性。本文介绍了一种基于面向对象分类方法的基于GF-2卫星数据的城市特征提取方法。利用光谱,空间属性和隶属函数相结合的方法绘制了南京市秦淮区的城市特色。数据预处理由ENVI软件执行,后续数据输出到eCognition软件中,用于面向对象的分类和城市特征信息的提取。最后,使用ARCGIS软件对获得的光栅图像分类结果进行矢量化,并将矢量图存储在库中,可用于进一步分析和建模。使用通过视觉解释和其他可靠的二级数据源获得的地面实况数据进行准确性评估。与基于像素的监督(神经网络)分类结果相比,开发的面向对象方法可以显着提高提取精度,经过人工解释后,总体准确率达到95.44%,Kappa系数为0.9405,客观证实面向对象方法的优越性和GF-2卫星数据利用的可行性。
translated by 谷歌翻译
In this technical report, we introduce FastFusionNet, an efficient variant of FusionNet [12]. FusionNet is a high performing reading comprehension architecture, which was designed primarily for maximum retrieval accuracy with less regard towards computational requirements. For FastFusionNets we remove the expensive CoVe layers [21] and substitute the BiLSTMs with far more efficient SRU layers [19]. The resulting architecture obtains state-of-the-art results on DAWNBench [5] while achieving the lowest training and inference time on SQuAD [25] to-date. The code is available at https://github.com/felixgwu/FastFusionNet.
translated by 谷歌翻译
在与人体内部环境相互作用的同时赋予连续机器人合规性对于防止对机器人和周围组织的损害至关重要。与被动顺应性相比,主动顺应性在增加力传递性和提高监视力输出的安全性方面具有优势。以往的研究表明,基于复杂的力学模型与传统的机器学习技术(如支持向量机)相结合,可以实现主动合规性。本文提出了一种基于递归神经网络的方法,避免了建模的复杂性,同时捕获非线性因素,例如滞后,摩擦和电子设备的延迟,这些都很容易建模。该方法在3-tendon单段连续机器人上进行测试,每根电缆上都有力传感器。进行实验以证明具有基于RNN的前馈控制系统的连续机器人能够快速响应外力并且顺从地进入未知环境。
translated by 谷歌翻译
在推荐系统中,用户既可以消费又可以产生信息,因为他们在不确定的情况下做出战略选择。虽然社交计划者会使用多武装带算法来平衡“探索”和“利用”,但用户的激励可能会倾向于这种平衡,有利于开发。我们考虑贝叶斯探索:一种简单的模型,其中推荐系统(“委托人”)控制向用户(“代理人”)的信息流,并努力通过信息不对称来激励探索。这一模型的一轮是来自[Kamenica和Gentzkow]的着名“贝叶斯游戏”的版本。我们允许异构用户,放宽先前工作的主要假设,即用户从一个时间步到另一个步骤具有相同的偏好。现在的目标是学习最好的个性化建议。一个特别的挑战是,无论校长做什么或者她有多少时间,都可能激励一些用户类型采取一些行动。我们考虑模型的几个转换,取决于是否以及何时将用户类型报告给主体,并为每个版本设计接近最优的“推荐策略”。我们还研究了模型选择和用户类型的多样性如何影响每种类型可能“探索”的操作集。
translated by 谷歌翻译
简单和全面是必要的,以便在解释黑箱决策系统时简明扼要地提供大量信息。然而,现有的可解释的机器学习方法不能同时考虑简洁性和全面性,这可能导致多余的解释。我们提出了一种系统无关的可解释方法,通过采用鼓舞人心的信息理论原则,信息瓶颈原理,提供了一个简短而全面的解释。使用信息理论目标,VIBI选择关于输入(简要性)最大压缩的实例关键特征,并且关于由该输入(综合)上的黑盒做出的决定提供信息。所选择的关键特征充当信息瓶颈,作为每个黑盒决策的简明解释。我们表明,VIBI在人类和定量指标评估的可解释性和保真度方面优于其他可解释的机器学习方法。
translated by 谷歌翻译
深度尖峰神经网络(SNN)支持异步事件驱动计算,大规模并行性,并显示出提高其同步模拟对应的能量效率的巨大潜力。然而,在设计SNN学习规则时,神经编码的注意力不足。值得注意的是,时间信用分配已经在速率编码的尖峰输入上进行,导致学习效率低下。在本文中,我们引入了一种新的基于尖峰的速率编码深度SNN学习规则,其中每个神经元的尖峰数被用作梯度反向传播的替代。我们通过在UCI机器学习和MNIST手写数字数据集上训练深度尖峰多层感知器(MLP)和尖峰卷积神经网络(CNN)来评估所提出的学习规则。我们展示了所提出的学习规则在allbenchmark数据集上实现了最先进的精度。所提出的学习规则允许将延迟,尖峰速率和硬件约束引入到SNN学习中,这优于间接方法,其中传统的人工神经网络首先被训练然后被转换为SNN。因此,它允许直接部署到神经形态硬件并支持有效推理。值得注意的是,在我们的实验中,只有10个模拟时间步长,当训练时施加相同的延迟约束时,MNIST数据集的测试精度达到98.40%。
translated by 谷歌翻译