投注机制是引发代理人对事件预测的一次性投注机制。对于确定性投注机制,现有的不可能性结果表明一些理想的理论性质不相容。特别是,帕累托最优性(在分配之前没有盈利的边注)不能与弱激励兼容性,弱预算平衡和个人理性一起实现。在本文中,我们扩展了投注机制的设计空间,以允许随机化,并询问其中是否有随机化的投注机制,可以实现所有先前考虑​​的所需属性,包括帕累托最优性。我们用两类随机化的投注机制积极地回答这个问题:i)现有确定性投资机制的简单随机抽签式实施,以及ii)我们称之为代理投注机制的另一族简单和随机化投注机制,这些机制是强大的tonoisy基本事实。这一系列机制建立在嘈杂标签学习的基础上(Natarajan等人,2013),以及最近将该信息扩展到信息引出而没有验证设置(Liu和Chen2018)。我们表明,广泛的随机化投注机制家族满足了所有理想的理论属性。
translated by 谷歌翻译
人脸识别近年来取得了长足的进步,主要归功于设计的大容量模型和丰富的标签数据。然而,扩大当前的百万级身份注释变得越来越禁止。在这项工作中,我们表明,未标记的面部数据可以与标记的面部数据一样有效。在这里,我们考虑设置密切模仿现实世界的场景,其中未标记的数据从不受约束的环境收集,并且它们的身份与标记的数据是唯一的。我们的主要观点是,尽管类信息不可用,但我们仍然可以通过以自下而上的方式构建关系图来忠实地近似这些语义关系。我们提出共识驱动传播(CDP)来解决这个具有挑战性的问题,有两个模块,即“委员会”和“调解员”,它们通过仔细聚合多视图信息来强有力地选择正面对。大量实验验证了两个模块的有效性,以丢弃异常值和挖掘硬性积极因素。使用CDP,我们通过仅使用9%的标签实现了对MegaFace识别挑战的78.18%的令人信服的准确度,相比之下,当使用未标记数据时为61.78%,而当使用所有标签时为78.52%。
translated by 谷歌翻译
随机梯度下降(SGD)可追溯到20世纪50年代,是进行随机优化的最流行和最有效的方法之一。关于SGD的研究最近在机器学习中重新出现,用于优化凸损失函数以及训练非凸深度神经网络。该理论假设人们可以很容易地计算出无偏的梯度拟合,这通常是由于经验风险最小化的样本平均性质。然而,存在许多场景(例如,图形学习),其中无偏估计器可能与完整梯度一样昂贵,因为训练示例是互连的。在最近的一项工作中,陈等人。 (2018)提出使用一致的梯度估计器作为经济替代方案。受经验成功的鼓舞,我们在一般情况下表明,一致的估计量会导致与无偏差的收敛行为相同的收敛行为。我们的分析涵盖了强凸,凸和非凸目标。这项工作开辟了几个新的研究方向,包括利用一致的估算器开发更高效的SGD更新,以及为大规模图形设计高效的训练算法。
translated by 谷歌翻译
我们如何有效地减轻梯度通信分布式优化的开销?这个问题是培训可扩展机器学习模型的核心,并且主要在无约束设置中进行研究。在本文中,我们提出量化Frank-Wolfe(QFW),这是第一个大规模解决约束优化问题的无投影和通信效率算法。我们考虑凸和非凸目标函数,表示为有限和或更一般的随机优化问题,并为QFW的收敛速度提供强有力的理论保证。这是通过提出量化方案来完成的,该方法可以有效地压缩梯度,同时控制在该过程中引入的方差。最后,我们根据通信和针对自然基线的返回解决方案的质量,从经验上验证了QFW的效率。
translated by 谷歌翻译
我们考虑具有低销售额的在线产品的基于上下文的动态定价问题。来自全球主要在线零售商阿里巴巴的销售数据显示了低价产品的流行。对于这些产品,由于数据样本不足,存在单个产品动态定价算法不能很好地工作。为了应对这一挑战,我们提出了定价政策,这些政策会同时对产品进行集群并在运行中设定单独的定价决策。通过聚类数据和识别具有相似需求模式的产品,我们利用同一集群内产品的销售数据来改进需求估算并允许更好的定价决策。我们使用遗憾来评估算法,结果表明,当产品需求函数来自多个集群时,我们的算法显着优于传统的单一产品定价策略。使用阿里巴巴的真实数据集进行的数值实验表明,与几项基准政策相比,拟议的政策可以增加收入。结果表明,在线集群是解决与低价产品相关的动态定价问题的有效方法。我们的算法在阿里巴巴的实地研究中进一步实施,连续30天实现了40种产品,并与使用阿里巴巴的常规定价政策的产品进行了比较。实地试验结果表明,总收入增长了10.14%。
translated by 谷歌翻译
图像超分辨率(SR)是一种重要的图像处理技术,用于提高计算机视觉中图像和视频的分辨率。近年来,使用深度学习技术的图像超分辨率取得了显着进步。在本次调查中,我们的目的是以系统的方式对使用深度学习方法的图像超分辨率技术的最新进展进行调查。一般而言,我们可以将现有的SR技术研究大致分为三大类:监督SR,无监督SR和域特定SR。此外,我们还介绍了其他一些重要问题,例如公开的基准数据集和绩效评估指标。最后,我们通过强调未来社区应进一步解决的几个未来问题和未决问题来结束本次调查。
translated by 谷歌翻译
电路混淆是最近提出的防御机制,通过使用伪装门(即,逻辑门,其功能不能由攻击者精确确定)来保护数字集成电路(IC)免于逆向工程。已经存在有效的方案,例如基于可满足性检查(SAT)的攻击,其可以潜在地解密混淆的电路,称为反混淆。根据IC和伪装门的数量和布局,反混淆运行时可能具有从几毫秒到数千年或更长的大跨度。因此,准确地预先估计反混淆运行时对于防御者最大化它并优化其防御非常重要。然而,估计反混淆运行时是一项具有挑战性的任务,因为1)图结构电路的复杂性和异构性,2)攻击者进行反混淆的未知和复杂机制。为了解决上述挑战,本工作提出了第一个基于图深度学习技术预测反混淆运行时的机器学习框架。具体来说,我们设计了一个新的模型,ICNet,带有新的输入和卷积层,用于表征和提取IC的图形频率,然后通过异构的深层连接层进行集成,以获得最终输出。 ICNet是一个端到端的框架,可以自动提取反混淆时间的决定性特征。广泛的实验证明了它的有效性和效率。
translated by 谷歌翻译
在本文中,我们提出了一种方法,用于将从源域学习的序列标记的神经模型的知识转移到在目标域上训练的新模型,其中出现新的标签类别。 Ourtransfer学习(TL)技术使得能够使用目标数据和新类别来调整源模型,而无需访问源数据。 Oursolution包括在目标模式的输出层中添加新的神经元,从源模型传输参数,然后使用目标数据进行微调。此外,我们提出了一个神经适配器来学习源和目标标签分布之间的差异,它为目标模型提供了额外的重要信息。我们在NamedEntity识别上的实验表明,(i)当目标数据包含新类别时,源模型中的学习知识可以有效地传递;(ii)我们的神经适配器进一步改善了这种传递。
translated by 谷歌翻译
我们提出了一种新的策略迭代理论,作为软策略迭代和Soft Actor-Critic(SAC)的重要扩展,它是深度强化学习中最有效的modelfree算法之一。在新理论的支持下,广义Shannon熵的任意熵测度,如Tsallisenopy和Renyi熵,可以用来适当随机化动作选择,同时实现最大化预期的长期奖励的目标。我们的理论产生了两个新的算法,即,Tsallis entropyActor-Critic(TAC)和Renyi entropy Actor-Critic(RAC)。理论分析表明这些算法比SAC更有效。此外,它们为我们在本文中开发一种新的Ensemble Actor-Critic(EAC)算法铺平了道路,该算法的特点是使用自举机制进行深度环境探测,并采用新的基于价值函数的机制进行高水平选择。根据经验,我们证明TAC,RAC和EAC可以在一系列基准控制任务上实现最先进的性能,在样本效率和效率方面优于SAC和几种尖端学习算法。
translated by 谷歌翻译
在本文中,我们提出了一种新的甲状腺细胞病理学WSIs高效滤泡分离方法。首先,我们提出了一种混合分段架构,它通过添加分支将分类器集成到Deeplab V3中。通过使用分类分支来浏览不相关区域,节省了大量的WSI分段时间。其次,将Deeplab V3中的低尺度精细特征融入到原始的空间金字塔空间(ASPP)中,以准确地表示细胞病理图像。第三,我们的混合模型采用面向准则的自适应损失函数进行训练,使模型收敛速度更快。对甲状腺贴片的实验结果表明,所提出的模型在分割精度上达到80.9%。此外,采用我们提出的方法,WSI分割的时间减少了93%,WSI水平精度达到53.4%。
translated by 谷歌翻译