在许多实际应用中,例如,期望优化长期价值。推荐系统。最常见的长期价值优化方法是使用长期价值作为目标的监督学习。遗憾的是,长期指标需要很长时间才能衡量(例如,客户会完成阅读电子书吗?),而且香草预报员在结果之前无法学习示例观察到了。在新项目经常出现的实际系统中,这种延迟会增加培训服务偏差,从而负面影响模型对新产品的预测。我们认为,中间观察(例如,如果客户在24小时内阅读了本书的三分之一)可以改进模型的预测。我们将问题形式化为一个随机模型,其中实例由对手选择,但是,例如,中间观察和结果是从一个因子联合分布中采样的。我们提出了一种利用中间观测的算法,并在理论上量化它可以胜过忽略中间观测的任何预测方法。在理论分析的推动下,我们提出了两种神经网络架构:FactoredForecaster(FF),如果我们的假设得到满足则是理想的,而ResidualFactored Forecaster(RFF)对于模型错误规范更具鲁棒性。对两个真实世界数据集的实验,数据集源自GitHubrepositories和来自流行市场的另一个数据集,表明RFFout同时执行FF以及忽略内部观察的算法。
translated by 谷歌翻译
在本文中,我们提出了深度学习算法,用于排列响应面,并应用于金融数学中的最优停止问题。通过在随机控制问题中估计最优反馈策略图来激发排序响应面的问题,目的是有效地找到与整个连续输入空间上的最小响应相关联的索引$ \ mathcal {X} \ subseteq \ mathbb {R} ^ d $。通过将$ \ mathcal {X} $中的点作为像素和最小曲面的索引作为标签,我们将该问题重新设计为图像分割问题,该问题为图像中的每个像素分配标签,使得具有相同标签的像素共享某些特征。这提供了一种替代方法,可以有效地解决问题,而不是在我们以前的工作中使用顺序设计[R. Hu和M. Ludkovski,SIAM / ASA Journal on UncertaintyQuantification,5(2017),212--239]。深度学习算法是可扩展的,并行的和无模型的,即响应表面上需要的非参数假设。考虑到排名响应表面,因为图像分割允许人们使用广泛的深度神经网络,例如,UNet,SegNet,DeconvNet,它们已被广泛应用并且在数值上证明在该领域具有高精度。我们还系统地研究了深度学习算法对均匀网格上生成的输入数据的依赖性或通过顺序设计采样,并观察到深度学习的性能对训练的噪声和位置(接近/远离边界)敏感。数据。我们提出了一个包括合成的样本和百慕大期权定价问题,以显示该方法的效率和准确性。
translated by 谷歌翻译
视觉定位是一个有吸引力的问题,它基于查询图像估计来自数据库图像的相似定位。它是各种应用的关键任务,例如自动驾驶汽车,辅助导航和增强现实。任务的挑战性问题在于查询和数据库图像之间的不同外观变化,包括照明变化,季节变化,动态对象变化和观点变化。为了应对这些挑战,本文提出了全景环形透镜和强大的深度图像描述符的全景环形定位器。处理由单个摄像机捕获的全景环形图像并将其馈送到NetVLAD网络中以形成活动的深度描述符,并且利用顺序匹配来生成定位结果。在公共数据集和现场进行的实验说明了所提出的系统的验证。
translated by 谷歌翻译
在所有生理信号中,随着单引线版本的增加,心电图(ECG)在医疗和娱乐应用中已经出现了一些最大的扩展。这些版本嵌入在医疗设备和可穿戴产品中,例如可注射的Medtronic Linq监视器,iRhythmZiopatch可穿戴监视器和Apple Watch系列4.最近,深度神经网络已被用于对ECG进行分类,甚至优于心脏电生理学专业的医生。然而,深层学习分类器已被证明对对抗性的例子很脆弱,包括与医学相关的任务。然而,传统的攻击方法,如投影梯度下降(PGD),会产生引入非生理方波伪影的例子。在这里,我们开发了一种方法来构造平滑的对称实例。我们选择专注于从2017年PhysioNet /心脏计算机心理学挑战中获得的数据,用于单导联心电图分类。对于这个模型,我们利用一种新技术生成平滑的例子来产生信号,这些信号是1)与原始实例无法区分的心脏病学家2)被神经网络错误分类。此外,我们表明对抗性的例子并不罕见。已经达到最先进性能的Deepneural网络无法对临床专家看似真实的平滑对抗心电图进行分类。
translated by 谷歌翻译
在本文中,一种新的统计度量学习被开发出高光谱图像的光谱空间分类。首先,每批中每个类的样本的标准方差用于降低每个类中的类级方差。然后,使用不同类别的平均值之间的距离来惩罚训练样本的类间方差。最后,添加不同类的平均值之间的标准方差作为附加的多样性项,以相互排斥不同的类。实验已在两个真实世界的高光谱图像数据集上进行,实验结果显示了所提出的统计度量学习的有效性。
translated by 谷歌翻译
我们研究了知识图(KG)嵌入的问题。对此问题的广泛认可是类似实体可能具有类似的关系角色。然而,现有的相关方法导出KG嵌入主要基于三级学习,其缺乏捕获实体的长期关系依赖性的能力。此外,三级学习不足以在实体之间传播语义信息,特别是对于跨KG嵌入的情况。在本文中,我们提出了当前的跳过网络(RSN),它采用跳过机制来填补实体之间的空白。 RSN将循环神经网络(RNN)与残留学习相结合,以有效地捕获KG内部和之间的长期关系依赖性。我们设计了一个端到端框架,以支持不同任务的RSN。我们的实验结果表明,RSN优于最先进的基于嵌入的实体对齐方法,并实现了KG完成的竞争性能。
translated by 谷歌翻译
通过开发复杂的图像先验或设计深(er)架构,最近提出了各种图像超分辨率(SR)方法并且实现了非常有前途的性能。一个自然的问题是,这些方法是否可以重新形成一个统一的框架,这个框架是否有助于SR重建?在本文中,我们提出了一种基于集成学习的简单但有效的单图像SR方法,该方法可以产生比从任何SR方法(或称为组件超级解析器)获得的更好的性能。基于在执行SR重建时更好的组件超级解析器应该具有更大的集合权重的假设,我们提出了用于推断最优集合权重的最大后验(MAP)估计框架。特别地,我们引入了一个参考数据集,它由高分辨率(HR)和低分辨率(LR)图像对组成,用于测量不同组件超级分辨率的超分辨率能力(先验知识)。为了获得optimalesesemble权重,我们建议结合重建约束,其表明退化的HR图像应该等于LRobservation的权重,以及集合权重的先验知识到MAP估计框架中。此外,所提出的优化问题可以通过分析解决方案来解决。我们通过与不同的竞争方法进行比较来研究所提出方法的性能,包括基于最先进的非深度学习方法,四种最新的基于深度学习的方法和一种基于集成学习的方法,并证明它在三个公共数据集上的有效性和优越性。 。
translated by 谷歌翻译
最近,鲁棒性成为机器学习社区的主要问题之一,因为学习算法通常容易受到异常值或破坏的影响。受这种趋势和需求的驱使,我们在本文中追求鲁棒性的无限定编程(SDP)。具体来说,这是通过在低等级SDP中使用更强大的$ \ ell_1 $ -loss替换常用的平方损失来完成的。然而,由此产生的目标既不是凸起的光滑的。由于不能应用现有算法,我们设计了一种基于主要化最小化的有效算法来优化目标。所提出的算法不仅具有廉价迭代和低空间复杂度,而且理论上也收敛于某些临界点。最后,经验研究表明,提出的算法的新目标在速度和准确性方面都优于现有技术。
translated by 谷歌翻译
研究人员目前依靠临时数据集来训练自动化可视化工具并评估可视化设计的有效性。这些样本通常缺乏真实数据集的特征,而且它们的一次性特性使得难以比较不同的技术。在本文中,我们介绍了VizNet:一个包含来自开放数据存储库和在线可视化库的超过3100万个数据集的大规模语料库。 Onaverage,这些数据集包含3个维度的17个记录,并且在整个公司中,我们发现51%的维度记录分类数据,44%定量,仅有5%的时间。 VizNet提供了必要的公共基线,用于比较可视化设计技术,以及用于自动化可视化分析的开发基准模型和算法。为了展示VizNet的实用程序作为进行在线众包实验的平台,我们复制了一项先前的研究,评估用户任务和数据分布对视觉编码有效性的影响,并通过考虑额外的任务来扩展它:异常值检测。为了应对大规模运行此类研究,我们展示了如何从实验结果中学习感知有效性的度量,并展示其在测试数据集中的预测能力。
translated by 谷歌翻译
卷积神经网络(CNN)在人脸识别方面取得了巨大成功,不幸的是,这种方法以大量计算和存储消耗为代价。因此提出了许多紧凑的面部识别网络来解决这个问题。三重损失对于进一步改善这些紧凑型号的性能是有效的。然而,它通常对所有样本使用固定的保证金,这忽略了不同身份之间的信息相似性结构。在本文中,我们提出了一种增强版的三脚架损失,称为三重蒸馏,它利用了ateacher模型的能力,通过自适应地改变正负对之间的边界,将相似性信息传递给一个小模型。 LFW,AgeDB和CPLFW数据集的实验显示了我们的方法与原始三重态损失相比的优点。
translated by 谷歌翻译