基于游戏的基准测试在人工智能(AI)技术的开发中发挥了重要作用。提供各种挑战是推动现代技术创新和理解研究的关键。 Rinascimento提供参数化的部分可观察的基于多人牌的棋盘游戏,这些参数可以轻松修改游戏中的规则,目标和物品。我们描述了所有功能的框架和游戏挑战,提供基线游戏AI和分析他们的技能。我们保留了代理商在实验中的超参数调整中心角色,突出了它如何能够严重影响性能。基线代理包含对统计前向规划算法的若干额外贡献。
translated by 谷歌翻译
在实际系统中非常昂贵的问题是非常普遍的,因为一个适合的评估花费几个小时甚至几天。在过去的几十年中,替代辅助进化算法(SAEAs)已被广泛用于解决这一关键问题。然而,大多数研究的SAEA专注于解决问题,至少十倍的问题维度,这在许多非常昂贵的现实问题中是不可接受的。在本文中,我们使用Voronoidiagram来提高SAEA的性能,并提出一个新的框架,名为基于Voronoi的有效代理协助进化算法(VESAEA),用于解决非常昂贵的问题,其中优化预算在fitnessevaluations方面仅为5倍。问题的维度。在提议的框架中,Voronoi图将整个搜索空间划分为若几个子空间,然后本地搜索在一些可能的更好的子空间中运行。此外,为了权衡勘探和开发,该框架涉及通过组合一次性交叉验证和径向基函数替代模型而开发的全局搜索阶段。性能选择器旨在在全局和本地搜索阶段之间动态和自动切换搜索。各种基准问题的实证结果表明,所提出的框架显着优于具有极其有限的适应性评估的几种最先进的算法。此外,还进一步分析了Voronoi图的功效,结果表明它有可能优化非常昂贵的问题。
translated by 谷歌翻译
本文介绍了一种简单快速的Planet Wars变体,作为基于统计规划的游戏AI代理的测试平台,以及嘈杂的超参数优化。 Planet Wars是一款实时策略游戏,具有简单的规则但复杂的游戏玩法。本文介绍的变体旨在实现高效实验,并且还可以通过固定动作空间实现与通用视频游戏AI代理的实际互操作性。如果将游戏作为一个输赢游戏(这是标准的)来进行游戏,那么这将导致在调整代理中玩游戏以及调整游戏参数时的嘈杂优化问题。在这里,我们关注调整代理的问题,并使用最近开发的N-Tuple Bandit EvolutionaryAlgorithm和许多其他优化器(包括基于顺序模型的算法配置(SMAC))来报告结果。结果表明,N-Tuple BanditEvolutionary提供了竞争性能以及对参数选择组合的影响的洞察力。
translated by 谷歌翻译
机器学习工作流程开发是一个反复试验的过程:开发人员通过测试小的修改来迭代工作流程,直到达到所需的准确性。不幸的是,现有的机器学习系统只关注模型训练 - 只占整个开发时间的一小部分 - 而忽略了解决迭代开发问题。我们建议使用Helix,amachine学习系统来优化执行情况 - 智能地缓存和重用,或者重新计算中间体。 Helix在其斯卡拉DSL中捕获了各种各样的应用程序需求,其简洁的语法定义了数据处理,模型规范和学习的统一过程。我们证明了重用问题可以被转换为Max-Flow问题,而缓存问题则是NP-Hard。我们为后者开发有效的轻量级启发式算法。 Empiricalevaluation显示Helix不仅能够在一个统一的工作流程中处理各种各样的用例,而且速度更快,在四个实际上提供比最先进系统(如DeepDive或KeystoneML)高达19倍的运行时间减少。世界在自然语言处理,计算机视觉,社会和自然科学中的应用。
translated by 谷歌翻译
近年来,作为神经网络的展开迭代算法已成为解决稀疏恢复问题的经验成功。然而,理论上的理解仍然不成熟,这使我们无法充分利用神经网络的力量。在这项工作中,我们研究了展开的ISTA(迭代收缩阈值算法),用于稀疏信号恢复。我们引入了渐近收敛对真实稀疏信号所必需的权重结构。利用这种结构,展开的ISTA可以获得线性收敛,这比一般情况下ISTA / FISTA的次线性收敛更好。此外,我们建议在网络中加入阈值来执行支持选择,这种支持选择易于实现,并且能够在理论上和经验上提高收敛速度。广泛的模拟,包括稀疏矢量恢复和对真实图像数据的压缩感知实验,证实了我们的理论结果,并证明了它们的实用性。
translated by 谷歌翻译
数据应用程序开发人员和数据科学家花费大量时间迭代机器学习(ML)工作流程 - 通过修改数据中心处理,模型训练和后处理步骤 - 通过心房和错误来实现所需的模型性能。加速机器学习的现有工作侧重于加快工作流程的一次性执行,未能解决典型ML开发的增量和动态性质。我们提出了Helix,一种声明式机器学习系统,通过优化端到端和跨迭代的工作流执行来加速迭代开发。 Helix通过程序分析和先前结果的智能重用最小化了每次迭代的运行时间,这些结果是选择性物质化的 - 为了潜在的未来利益而牺牲物化成本 - 加速未来的迭代。此外,Helix还提供了可视化工作流程DAG的图形界面,并比较了可以实现迭代开发的版本。通过两个ML应用程序,分类和结构化预测,与会者将体验Helix编程接口的模糊性以及使用Helix进行迭代开发的速度和简易性。在我们的评估中,与最先进的机器学习工具相比,Helix在累计运行时间方面实现了数量级的降低。
translated by 谷歌翻译
卷积稀疏表示是具有结构化翻译不变字典的稀疏表示形式。迄今为止,大多数卷积字典学习算法以批处理模式运行,需要在学习过程中同时访问所有训练图像,这会导致非常高的内存使用量并严重限制可以使用的训练数据。但是,最近很多作者都考虑过线性卷积字典学习算法的设计,其训练集大小比批处理方法提供更好的内存和计算成本。本文扩展了我们以前的工作,改进了以前算法的许多方面;提出一个全新的,具有更好的性能,并支持包含空间掩模,以便从不完整的数据中学习;并对这些方法进行严格的理论分析。
translated by 谷歌翻译
随着移动设备变得越来越流行,移动游戏已经成为一个充满希望的市场,拥有数十亿美元的收入。世界各地已开发出各种移动游戏平台和服务。对这些平台和服务的一个关键挑战是了解移动游戏中的流失行为,这通常涉及微观层面(应用程序和特定用户之间)和宏观层面(应用程序及其所有用户之间)的流失。准确的微观流失预测和宏观级别的流失排名将有利于许多利益相关者,如游戏开发商,广告商和平台运营商。在本文中,我们提出了第一个大规模的流失分析平板电脑分析,它支持微观流失预测和宏观流程排序。对于微观流失预测,鉴于建立在传统机器学习模型上的最先进方法的共同限制,我们设计了一种新颖的半监督和归纳嵌入模型,它共同学习预测功能和用户的嵌入功能 - 应用关系。我们通过深度神经网络对这两个函数进行建模,采用独特的边缘嵌入技术,能够捕获背景信息和关系动态。我们还设计了一种novelattributed随机游走技术,该技术考虑了拓扑性和属性相似性。为了解决宏观级别的流失排名,我们建议构建一个关联图,将估计的微观流失概率作为边权重,并在图上调整链路分析算法。我们设计了一个简单的算法SimSum,并采用了两个更先进的算法PageRank和HITS。我们针对两级churnanalysis问题的解决方案的性能是根据从SamsungGame Launcher平台收集的真实数据进行评估的。
translated by 谷歌翻译
车辆重新识别是一个重要的问题,随着视频监控和智能传输应用的快速扩展而变得可取。通过回顾人类视觉的识别过程,我们发现当人类识别不同的车辆时存在本地的等级依赖性。具体地,人类总是首先确定一个车辆的粗粒度类别,即汽车模型/类型。然后,在预测的汽车模型/类型的分支下,他们将通过细微的视觉线索(例如,定制的绘画和挡风玻璃)在细粒度水平上识别特定的车辆。受粗到细分层过程的启发,我们提出了一种用于车辆重新识别的端到端基于RNN的分层注意(RNN-HA)分类模型。 RNN-HA由三个相互耦合的模块组成:第一个模块生成车辆图像的图像表示,第二个层次模块模拟上述层级依赖关系,最后一个注意模块侧重于捕获特定车辆彼此之间的细微视觉信息识别。通过对两个车辆重新识别基准数据集VeRi和VehicleID进行全面的实验,我们证明了所提出的模型实现了超越现有技术的卓越性能。
translated by 谷歌翻译
具有有限信息反馈(强盗)的在线学习试图解决在线学习者在学习过程中从环境接收部分反馈信息的问题。在此设置下,Flaxman通过提出具有预期梯度(OGDEG)算法的在线梯度下降来扩展Zinkevich的经典在线梯度下降(OGD)算法Zinkevich [2003]。具体来说,它使用一个简单的技巧来估计损失函数$ f_t $的梯度,通过在单个点进行评估并将预期的后悔限制为$ \ mathcal {O}(T ^ {5/6})$ Flaxman等。 [2005]。已经表明,与一阶算法相比,二阶在线学习算法如Online Newton Step(ONS)Hazan等。 [2007]可以显着提高传统在线学习的收敛速度。本文旨在利用二阶信息加速OGDEG的收敛。特别是,我们利用预期梯度技巧扩展了ONS算法,并开发了一种新颖的二阶在线学习算法,即具有预期梯度的在线牛顿步(ONSEG)。理论上,我们证明了所提出的ONSEG算法显着降低了OGDEG的预期遗憾。在强盗反馈场景中从$ \ mathcal {O}(T ^ {5/6})$到$ \ mathcal {O}(T ^ {2/3})$。根据经验,我们在几个真实世界的数据集中展示了所提出的算法的优点。
translated by 谷歌翻译