最近在体现AI中的研究已经通过使用模拟环境来开发和培训机器人学习方法。然而,使用模拟已经引起了只需要机器人模拟器可以模拟的任务:运动和物理接触的任务。我们呈现IGIBSON 2.0,一个开源仿真环境,通过三个关键创新支持模拟更多样化的家庭任务。首先,IGIBSON 2.0支持对象状态,包括温度,湿度水平,清洁度和切割和切片状态,以涵盖更广泛的任务。其次,IGIBSON 2.0实现了一组谓词逻辑函数,该逻辑函数将模拟器状态映射到烹饪或浸泡等逻辑状态。另外,给定逻辑状态,IGIBSON 2.0可以对满足它的有效物理状态进行示例。此功能可以以最少的努力从用户生成潜在的无限实例。采样机制允许我们的场景在语义有意义的位置中的小对象更密集地填充。第三,IGIBSON 2.0包括虚拟现实(VR)界面,以将人类浸入其场景以收集示威操作。因此,我们可以从这些新型任务中收集人类的示威活动,并使用它们进行模仿学习。我们评估了IGIBSON 2.0的新功能,以实现新的任务的机器人学习,希望能够展示这一新模拟器的潜力来支持体现AI的新研究。 IGIBSON 2.0及其新数据集可在http://svl.stanford.edu/igibson/上公开提供。
translated by 谷歌翻译
自1970年代初以来,已经开发并改进了质谱仪和不连贯的散射雷达(MSIS)模型家族。 MSI的最新版本是海军研究实验室(NRL)MSIS 2.0经验大气模型。 NRLMSIS 2.0提供物种密度,质量密度和温度估计作为位置和空间天气条件的功能。长期以来,MSIS模型一直是研究和运营社区中的大气模型的流行选择,但与许多模型一样,并未提供不确定性估计。在这项工作中,我们开发了基于机器学习(ML)的外层温度模型,该模型可与NRLMSIS 2.0一起使用,以相对于高保真卫星密度估计值校准其。我们的模型(称为MSIS-UQ)没有提供点估计,而是输出一个分布,该分布将使用称为校准误差评分的度量进行评估。我们表明,MSIS-UQ的DEMIAS nRLMSIS 2.0导致模型和卫星密度之间的差异减少25%,并且比太空力量的高精度卫星阻力模型更接近卫星密度。我们还通过生成物种密度,质量密度和温度的高度曲线来显示模型的不确定性估计功能。这明确证明了外层温度概率如何影响NRLMSIS 2.0内的密度和温度曲线。另一项研究显示,相对于单独的NRLMSIS 2.0,迅速过冷的能力提高了,从而增强了它可以捕获的现象。
translated by 谷歌翻译
神经建筑搜索(NAS)已被广泛研究,并已成长为具有重大影响的研究领域。虽然经典的单目标NAS搜索具有最佳性能的体系结构,但多目标NAS考虑了应同时优化的多个目标,例如,将沿验证错误最小化资源使用率。尽管在多目标NAS领域已经取得了长足的进步,但我们认为实际关注的实际优化问题与多目标NAS试图解决的优化问题之间存在一些差异。我们通过将多目标NAS问题作为质量多样性优化(QDO)问题来解决这一差异,并引入了三种质量多样性NAS优化器(其中两个属于多重速度优化器组),以寻求高度多样化但多样化的体系结构对于特定于应用程序特定的利基,例如硬件约束。通过将这些优化器与它们的多目标对应物进行比较,我们证明了质量多样性总体上优于多目标NA在解决方案和效率方面。我们进一步展示了应用程序和未来的NAS研究如何在QDO上蓬勃发展。
translated by 谷歌翻译
尽管深度神经网络(DNNS)在封闭世界的学习方案中取得了令人印象深刻的分类性能,但它们通常无法概括地在动态的开放世界环境中看不见的类别,在这种环境中,概念数量无界的数量。相反,人类和动物学习者具有通过识别和适应新颖观察结果来逐步更新知识的能力。特别是,人类通过独家(唯一)基本特征集来表征概念,这些特征既用于识别已知类别和识别新颖性。受到自然学习者的启发,我们引入了稀疏的高级独特,低水平共享的特征表示(Shels),同时鼓励学习独家的高级功能和必不可少的,共享的低级功能。高级功能的排他性使DNN能够自动检测到分布(OOD)数据,而通过稀疏的低级功能可以有效利用容量,可以容纳新知识。最终的方法使用OOD检测来执行班级持续学习,而没有已知的类边界。我们表明,使用木材进行新颖性检测导致对各种基准数据集的最新OOD检测方法的统计显着改善。此外,我们证明了木木模型在课堂学习环境中减轻灾难性的遗忘,从而实现了一个组合的新颖性检测和住宿框架,该框架支持在开放世界中学习
translated by 谷歌翻译
在现实世界中,使用机器学习系统通常可能是有问题的,使用莫名其妙的黑框模型,假定的不完善测量的确定性或提供单个分类而不是概率分布。本文介绍了犹豫不决的树,对在不确定性下学习的决策树进行了修改,可以在不确定性下执行推理,在可能的标签上提供强大的分布,并可以将其分解为一组逻辑论证,以用于其他推理系统。
translated by 谷歌翻译
机器学习(ML)通常被视为一种黑盒回归技术,无法提供相当大的科学见解。 ML模型是通用函数近似器,如果正确使用,则可以提供与用于拟合的地面数据集有关的科学信息。 ML比参数模型的好处是,没有预定义的基础函数限制可以建模的现象。在这项工作中,我们在三个数据集上开发了ML模型:太空环境技术(SET)高精度卫星阻力模型(HASDM)密度数据库,这是Jacchia-Bowman 2008经验热层密度模型(JB2008),Jacchia-Bowman 2008经验的空间端段匹配数据集,以及具有挑战性的Minisatellite有效载荷(Champ)的加速度计衍生的密度数据集。将这些ML模型与海军研究实验室质谱仪和不相互分的散射雷达(NRLMSIS 2.0)模型进行比较,以研究中热层中传感后冷却的存在。我们发现NRLMSIS 2.0和JB2008-ML都不能说明后冷却,因此在强烈的地磁风暴(例如2003年万圣节风暴)之后的时期内表现不佳。相反,HASDM-ML和Champ-ML确实显示了传感后冷却的证据,表明这种现象存在于原始数据集中。结果表明,根据位置和暴风雨强度,速度1-3天的密度降低可能会发生1--3天。
translated by 谷歌翻译
从移动设备收集的位置数据代表个人和社会水平的移动性行为。这些数据具有从运输计划到疫情建模的重要应用。但是,必须克服最佳服务的问题:数据通常代表有限的人口样本和数据危害隐私的数据。为了解决这些问题,我们展示并评估用于使用在实际位置数据上培训的深频复制神经网络(RNN)来生成合成移动数据的系统。该系统将群体分发作为输入,为相应的合成群生成移动性跟踪。相关的生成方法尚未解决在较长时间内捕获个人移动行为中的模式和变异性的挑战,同时还平衡了具有隐私的现实数据的产生。我们的系统利用RNNS的能力生成复杂和新序列的能力,同时保留训练数据的模式。此外,该模型引入了用于校准各个级别的合成和实际数据之间的变化的随机性。这是捕获人类移动性的可变性,并保护用户隐私。基于位置的服务(LBS)来自22,700多种移动设备的数据用于实用程序和隐私度量的实验评估。我们示出了生成的移动数据保留了实际数据的特征,同时从个人级别的实际数据变化,并且在此变化量匹配真实数据内的变化。
translated by 谷歌翻译
我们考虑从原始数据学习自由形式符号表达的问题,例如由任何科学域的实验产生的。精确和可解释的科学现象模型是科学研究的基石。简单但可诠释的模型,例如线性或逻辑回归和决策树通常缺乏预测的准确性。或者,精确的黑箱模型,如深神经网络,提供了高的预测精度,但不容易承认以丰富的这种现象理论的方式承认人类的理解。科学的许多巨大突破围绕着高预测准确性的扩大公正模型的发展,如牛顿的法律,普遍引力和麦克斯韦方程式。以前的工作是自动化从数据中搜索公正模型,结合了域特定启发式,以及计算昂贵的技术,例如遗传编程和蒙特卡罗搜索。我们开发一个深度神经网络(MACSYMA),以解决符号回归问题作为端到端的监督学习问题。 MacSyma可以生成描述数据集的符号表达式。任务的计算复杂性降低到神经网络的前馈计算。我们在由不同长度和不同噪声水平的数据表上培训我们的神经网络,其中神经网络必须学习通过令牌生成正确的符号表达式令牌。最后,我们通过在行为科学的公共数据集上运行来验证我们的技术。
translated by 谷歌翻译
Two-level stochastic optimization formulations have become instrumental in a number of machine learning contexts such as continual learning, neural architecture search, adversarial learning, and hyperparameter tuning. Practical stochastic bilevel optimization problems become challenging in optimization or learning scenarios where the number of variables is high or there are constraints. In this paper, we introduce a bilevel stochastic gradient method for bilevel problems with lower-level constraints. We also present a comprehensive convergence theory that covers all inexact calculations of the adjoint gradient (also called hypergradient) and addresses both the lower-level unconstrained and constrained cases. To promote the use of bilevel optimization in large-scale learning, we introduce a practical bilevel stochastic gradient method (BSG-1) that does not require second-order derivatives and, in the lower-level unconstrained case, dismisses any system solves and matrix-vector products.
translated by 谷歌翻译
治疗效应的预测方法异质性陈述的重点是基线风险,作为治疗效果的强大预测指标,并为RCT环境中基于风险的治疗效应异质性提供了指导。这项研究的目的是使用标准化的可伸缩框架将这种方法扩展到观测设置。拟议的框架包括五个步骤:1)研究目的的定义,即人口,治疗,比较者和感兴趣的结果; 2)识别相关数据库; 3)开发感兴趣结果的预测模型; 4)在调整观察到的混杂状态后,对预测风险的层中相对和绝对治疗效果的估计; 5)结果。我们通过评估血管紧张素转换酶(ACE)抑制剂与β受体阻滞剂对三个疗效和三个观测数据库中的六个安全结果的影响来证明我们的框架。提出的框架可以补充任何比较有效性研究。我们提供了一个公开可用的R软件包,以将此框架应用于映射到观察性医学结果伙伴关系伙伴关系模型的任何数据库。在我们的演示中,急性心肌梗死风险低的患者对所有三种疗效结果都获得了可忽略的绝对收益,尽管他们在最高风险季度更为明显,尤其是对于心力衰竭的住院治疗。但是,即使调整了观察到的混杂,诊断失败也显示出残余失衡的证据。我们的框架允许评估风险层面的差异治疗效果,这为考虑替代治疗之间的利益障碍权衡提供了机会。
translated by 谷歌翻译