高度动态的移动ad-hoc网络(MANET)仍然是开发和部署强大,高效和可扩展的路由协议的最具挑战性环境之一。在本文中,我们提出了DeepCQ +路由协议,以一种新颖的方式将新兴的多代理深度增强学习(Madrl)技术集成到现有的基于Q学习的路由协议及其变体中,并在各种拓扑结构中实现了持续更高的性能和移动配置。在保持基于Q学习的路由协议的整体协议结构的同时,DeepCQ +通过精心设计的Madrl代理替换静态配置的参数化阈值和手写规则,使得不需要这些参数的配置。广泛的模拟表明,与其基于Q学习的对应物相比,DeptCQ +产生的端到端吞吐量显着增加了端到端延迟(跳数)的明显劣化。在定性方面,也许更重要的是,Deepcq +在许多情况下维持了非常相似的性能提升,即在网络尺寸,移动条件和交通动态方面没有接受过培训。据我们所知,这是Madrl框架的第一次成功应用MANET路由问题,即使在训练有素的场景范围之外的环境中,即使在训练范围之外的环境中也能够高度的可扩展性和鲁棒性。这意味着我们的基于Marl的DeepCQ +设计解决方案显着提高了基于Q学习的CQ +基线方法的性能,以进行比较,并提高其实用性和解释性,因为现实世界的MANET环境可能会在训练范围的MANET场景之外变化。讨论了进一步提高性能和可扩展性的增益的额外技术。
translated by 谷歌翻译
Bayesian Optimization(Bo)是全球优化昂贵的客观功能的框架。古典BO方法假设客观函数是一个黑匣子。但是,有关客观函数计算的内部信息通常可用。例如,在使用模拟优化制造行的吞吐量时,除了整体吞吐量之外,我们还会观察每个工作站等待等待的部件数。最近的BO方法利用此类内部信息显着提高性能。我们称之为这些“灰盒”BO方法,因为它们将客观计算视为部分可观察且甚至可修改,将黑盒方法与所谓的“白盒”的第一原理进行客观函数计算的知识。本教程描述了这些方法,专注于复合物镜功能的博,其中可以观察和选择性地评估饲喂整体目标的单个成分;和多保真博,其中一个人可以通过改变评估oracle的参数来评估目标函数的更便宜的近似。
translated by 谷歌翻译
BYTESCHEDULER分区和重新排列张测变速器,以提高分布式深神经网络(DNN)训练的通信效率。超参数的配置(即分区大小和信用尺寸)对于分区和重新排列的有效性至关重要。目前,Bytescheduler采用贝叶斯优化(BO)预先找到超级参数的最佳配置。然而,在实践中,各种运行时因子(例如,工人节点状态和网络条件)随着时间的推移而变化,使得静态确定的一拍配置结果次优为现实世界的DNN培训。为了解决这个问题,我们介绍了一个实时配置方法(称为autobyte),它自动并及时搜索最佳的超参数,因为培训系统动态地改变。 Autobyte将Bytescheduler框架与Meta网络扩展,将系统的运行时统计信息作为其输入,并在特定配置下的加速器输出预测。各种DNN模型的评估结果表明,Autobyte可以动态调整具有低资源使用率的超参数,并且比ByTescheduler中最好的静态配置提供高达33.2 \%的性能。
translated by 谷歌翻译
心电图(ECG)的解释给出了临床信息,并有助于评估心脏功能。存在与特定类别的arrythmia相关的不同的心电图图案。卷积神经网络实际上是ECG处理中最应用的深度学习算法之一。但是,对于深度学习模型,还有许多普遍的公共参数来调整。为卷积神经网络算法选择最佳或最佳的封面计是具有挑战性的。通常,我们最终通过不同可能的值范围手动调整模型,直到获得最佳拟合模型。使用贝叶斯优化(BO)和进化算法的自动封锁调整为港口手动配置提供了解决方案。在本文中,我们建议优化具有两个级别的经常性一维卷积神经网络模型(R-1D-CNN)。在第一级别,培训残余卷积层和一维卷积神经层以学习特定于患者特定的ECG特征,多层的Perceptron层可以学习产生每个输入的最终类载体。此级别是手动,并旨在降低搜索空间。第二级是自动的,基于所提出的基于算法的博。我们提出的优化R-1D-CNN架构是在两个公开的ECG数据集上进行评估。实验结果显示,基于算法的BO实现了99.95 \%的最佳速率,而基线模型对于MIT-BIH数据库实现99.70 \%。此外,实验表明,拟议的架构与BO微调的结构比其他拟议的架构更高的精度。与以前的作品相比,我们的建筑达到了良好的结果,并基于不同的实验。
translated by 谷歌翻译
计算高效的非近视贝叶斯优化(BO)的最新进展提高了传统近视方法的查询效率,如预期的改进,同时仅适度提高计算成本。然而,这些进展在很大程度上是有限的,因为不受约束的优化。对于约束优化,少数现有的非近视博方法需要重量计算。例如,一个现有的非近视约束BO方法[LAM和Willcox,2017]依赖于计算昂贵的不可靠的暴力衍生物的无可靠性衍生物优化蒙特卡罗卷展卷采集功能。使用Reparameterization技巧进行更有效的基于衍生物的优化的方法,如在不受约束的环境中,如样本平均近似和无限扰动分析,不扩展:约束在取样的采集功能表面中引入阻碍其优化的不连续性。此外,我们认为非近视在受限制问题中更为重要,因为违反限制的恐惧将近视方法推动了可行和不可行区域之间的边界,减缓了具有严格约束的最佳解决方案的发现。在本文中,我们提出了一种计算的有效的两步保护受限贝叶斯优化采集功能(2-OPT-C)支持顺序和批处理设置。为了实现快速采集功能优化,我们开发了一种新的基于似然比的非偏见估计,其两步最佳采集函数的梯度不使用Reparameterization技巧。在数值实验中,2-OPT-C通常通过先前的方法通过2倍或更多的查询效率,并且在某些情况下通过10倍或更大。
translated by 谷歌翻译
多代理市场仿真通常用于为下游机器学习或加强学习任务创建环境,例如在部署它们以实时交易之前培训或测试交易策略。在电子交易市场中,只有多个市场参与者的互动导致的价格或体积时间序列通常是直接可观察到的。因此,需要校准多代理市场环境,以使模拟代理的相互作用与历史相互作用导致的时间序列 - 这使得解决高度复杂的大规模优化问题。在本文中,我们提出了一种简单而有效的框架,可以从历史时间序列观测校准多代理市场模拟器参数。首先,我们考虑一个新颖的资格概念,以绕过潜在的不可识别性问题。其次,我们通过Bonferroni校正概括了两个样本的Kolmogorov-Smirnov(K-S)测试,以测试两个高维时间序列分布之间的相似性,这在时间序列样本集之间提供了一个简单但有效的距离度量。第三,我们建议使用贝叶斯优化(BO)和信任区域BO(Turbo)来最小化上述距离度量。最后,我们展示了使用数值实验的框架的效率。
translated by 谷歌翻译
优化昂贵以评估黑盒功能在包含D对象的所有排列中的输入空间是许多真实应用的重要问题。例如,在硬件设计中放置功能块以通过仿真优化性能。总体目标是最小化函数评估的数量,以找到高性能的排列。使用贝叶斯优化(BO)框架解决这个问题的关键挑战是折衷统计模型的复杂性和采集功能优化的途径。在本文中,我们提出并评估了博的两个算法(BOPS)。首先,BOPS-T采用高斯工艺(GP)代理模型与KENDALL内核和基于Thompson采样的Trocable采集功能优化方法,以选择评估的排列顺序。其次,BOPS-H采用GP代理模型与锦葵内核和启发式搜索方法,以优化预期的改进采集功能。理论上,从理论上分析BOPS-T的性能,以表明他们的遗憾增加了亚线性。我们对多种综合和现实世界基准测试的实验表明,BOPS-T和BOPS-H均优于组合空间的最先进的BO算法。为了推动未来的对这个重要问题的研究,我们为社区提供了新的资源和现实世界基准。
translated by 谷歌翻译
优化问题在人工智能中至关重要。优化算法通常用于调整人工智能模型的性能,以最小化映射输入的误差输出。优化算法上的当前评估方法通常考虑质量方面的性能。然而,并非所有测试用例的所有优化算法都是等于质量的等于的,但也应考虑计算时间以进行优化任务。在本文中,我们研究了优化问题中优化算法的质量和计算时间,而不是唯一的质量评估。我们选择众所周知的优化算法(贝叶斯优化和进化算法),并在质量和计算时间方面评估基准测试功能。结果表明,BO适用于在有限函数评估中获得所需质量所需的优化任务中,并且EAS适合搜索允许找到具有足够函数最佳解决方案的任务的最佳选择评估。本文提供了选择合适的优化算法的建议,以了解不同数量的函数评估的优化问题,这有助于获得所需质量的效率,以较少的计算时间进行优化问题。
translated by 谷歌翻译
贝叶斯优化(BO)与高斯工艺(GP)作为代理模型广泛用于优化分析且昂贵的函数。在本文中,我们提出了先前的卑鄙贝叶斯优化(Probo),以特定问题表达了古典博。首先,我们研究高斯过程的效果对古典博的收敛性的先前规范。我们发现前面的平均参数对所有先前组件之间的收敛具有最高影响。响应于此结果,我们将probo介绍为博的概括,其旨在使该方法更加强大地朝着先前的平均参数误操作。这是通过明确地通过先前的近无知模型进行GP来实现的实现。在核心的核心是一种新的采集功能,广义较低的置信度(GLCB)。我们在物质科学的真实问题上测试我们对古典博的方法,并观察Progo更快地收敛。关于多模式和WIGGLY目标功能的进一步实验证实了我们方法的优越性。
translated by 谷歌翻译
Bayesian Optimization(BO)是一种优化昂贵对评估黑匣子功能的采样有效的方法。大多数BO方法忽略了评估成本如何在优化域中变化。然而,这些成本可以是高度异质的并且通常提前未知。这发生在许多实际设置中,例如机器学习算法或基于物理的仿真优化的超参数调整。此外,那些确认成本异质性的现有方法并不自然地适应总评估成本的预算限制。这种未知的成本和预算限制的组合引入了勘探开发权衡的新维度,其中关于成本的学习成本本身。现有方法没有原因地理由以原则的方式对此问题的各种权衡,经常导致性能不佳。我们通过证明,每单位成本的预期改进和预期改善,可以使这两个最广泛使用的采购职能在实践中的预期改进和预期的索赔可以是任意劣等的。为了克服现有方法的缺点,我们提出了预算的多步预期改进,是一个非近视收购函数,以概括为异质和未知评估成本的古典预期改进。最后,我们表明我们的采集功能优于各种合成和实际问题的现有方法。
translated by 谷歌翻译