长期以来,Robotics一直是一个遍布复杂系统体系结构的领域,无论传统或基于学习的模块和联系都需要大量的人类专业知识和先验知识。受大型预训练语言模型的启发,这项工作引入了预先培训的通用表示范式,该范式可以作为给定机器人多个任务的起点。我们提出了感知性因果变压器(PACT),这是一种基于生成变压器的架构,旨在以自我监督的方式直接从机器人数据构建表示形式。通过对状态和行动的自动回归预测,我们的模型隐含地编码了特定机器人的动态和行为。我们的实验评估重点是移动药物的域,我们表明该机器人特定的表示可以作为单个起点,以实现不同的任务,例如安全导航,定位和映射。我们评估了两个形式:使用激光雷达传感器作为感知输入(MUSHR)的轮式机器人,以及使用第一人称RGB图像(栖息地)的模拟药物。我们表明,与训练单个模型的同时训练单个模型相比,对所有任务的单个模型进行训练,并且与独立培训单独的大型模型相当的性能,对每个任务的单个模型进行了可比的训练,则在较大的审计模型上进行了固定小型任务特异性网络,从而使性能明显提高。通过跨任务共享共同的优质表示,我们可以降低整体模型容量并加快此类系统的实时部署。
translated by 谷歌翻译
由于其物理能力,模拟的类人动物是一个吸引人的研究领域。尽管如此,他们也在控制方面具有挑战性,因为政策必须推动不稳定,不连续和高维物理系统。一种经过广泛研究的方法是利用运动捕获(MOCAP)数据来教授类人动物的低水平技能(例如,站立,步行和跑步),然后可以重新使用以综合高级行为。但是,即使使用MOCAP数据,控制模拟的类人动物仍然非常困难,因为MOCAP数据仅提供运动学信息。寻找物理控制输入以实现所示动作需要计算密集型方法,例如增强学习。因此,尽管有公开可用的MOCAP数据,但其效用仍限于具有大规模计算的机构。在这项工作中,我们通过训练和释放高质量的代理,可以大大降低有关该主题的生产研究的障碍,这些代理可以在基于DM_Control物理学的环境中跟踪三个小时的MOCAP数据以上的MOCAP数据。我们释放Mocapact(动作动作捕获),这些专家代理的数据集及其推出,其中包含本体感受观察和动作。我们通过使用它来训练单个层次结构策略来证明MOCAPACT的实用性,该策略能够跟踪DM_Control中的整个MOCAP数据集并显示学习学到的低级组件可以被重新使用以有效地学习下游高级任务。最后,我们使用MoCapact训练自动回旋GPT模型,并表明它可以控制模拟的类人动物以在运动提示下执行自然运动完成。结果和指向代码和数据集的链接的视频可在https://microsoft.github.io/mocapact上获得。
translated by 谷歌翻译
我们为处理顺序决策和外在不确定性的应用程序开发了增强学习(RL)框架,例如资源分配和库存管理。在这些应用中,不确定性仅由于未来需求等外源变量所致。一种流行的方法是使用历史数据预测外源变量,然后对预测进行计划。但是,这种间接方法需要对外源过程进行高保真模型,以确保良好的下游决策,当外源性过程复杂时,这可能是不切实际的。在这项工作中,我们提出了一种基于事后观察学习的替代方法,该方法避开了对外源过程进行建模的建模。我们的主要见解是,与Sim2real RL不同,我们可以在历史数据中重新审视过去的决定,并在这些应用程序中对其他动作产生反事实后果。我们的框架将事后最佳的行动用作政策培训信号,并在决策绩效方面具有强大的理论保证。我们使用框架开发了一种算法,以分配计算资源,以用于现实世界中的Microsoft Azure工作负载。结果表明,我们的方法比域特异性的启发式方法和SIM2REAL RL基准学习更好的政策。
translated by 谷歌翻译
Pairwise Causal Discovery is the task of determining causal, anticausal, confounded or independence relationships from pairs of variables. Over the last few years, this challenging task has promoted not only the discovery of novel machine learning models aimed at solving the task, but also discussions on how learning the causal direction of variables may benefit machine learning overall. In this paper, we show that Quantitative Information Flow (QIF), a measure usually employed for measuring leakages of information from a system to an attacker, shows promising results as features for the task. In particular, experiments with real-world datasets indicate that QIF is statistically tied to the state of the art. Our initial results motivate further inquiries on how QIF relates to causality and what are its limitations.
translated by 谷歌翻译
当不可用的数据不可用时,在电子商务行业中通常使用强盗算法来培训机器学习(ML)系统。但是,行业的设置提出了各种挑战,使实践中实施强盗算法的挑战是非平凡的。在本文中,我们详细阐述了非政策优化,延迟奖励,概念漂移,奖励设计和业务规则限制的挑战。我们的主要贡献是对开放匪徒(OBP)框架的扩展。我们为一些上述挑战提供模拟组件,以使未来的从业者,研究人员和教育工作者提供资源,以应对电子商务行业遇到的挑战。
translated by 谷歌翻译
对心脏周围环境的脂肪库的定量是评估与多种疾病相关的健康风险因素的准确程序。但是,由于人为的工作量,这种类型的评估并未在临床实践中广泛使用。这项工作提出了一种用于自动分割心脏脂肪垫的新技术。该技术基于将分类算法应用于心脏CT图像的分割。此外,我们广泛评估了几种算法在此任务上的性能,并讨论了提供了更好的预测模型。实验结果表明,心外膜和纵隔脂肪分类的平均准确性为98.4%,平均正面速率为96.2%。平均而言,关于分割的患者和地面真相的骰子相似性指数等于96.8%。因此,迄今为止,我们的技术已经获得了心脏脂肪自动分割的最准确结果。
translated by 谷歌翻译
我们引入了一个新的差异隐私(DP)会计师,称为鞍点会计师(SPA)。SPA以准确而快速的方式近似保证DP机制的组成。我们的方法是受鞍点法的启发,这是一种统计中无处不在的数值技术。通过为SPA提供的近似误差,我们通过得出上限和下限来证明性能的严格保证。水疗中心的关键是与中心极限定理的大型探空方法的组合,我们通过指数倾斜与DP机制相对应的隐私损失随机变量来得出。水疗中心的一个关键优点是,它可以在$ n $折叠机制的$ n $折叠组成下持续运行。数值实验表明,水疗中心的准确性与更快的运行时的最新会计方法相当。
translated by 谷歌翻译
该技术报告建议将深卷卷神经网络用作初步的诊断方法,用于分析来自严重急性呼吸系统症状(SARS)症状的胸部计算机断层扫描图像(SARS)和怀疑的Covid-19疾病,尤其是在延迟时在RT-PCR结果和缺乏紧急护理的情况下,可能会导致严重的暂时,长期或永久性健康损害。该模型接受了83,391张图像的培训,并在15,297张验证,并在22,185个数字上进行了测试,在Cohen's Kappa中获得了98%的F1分数,准确性98.4%,损失为5.09%。与当前的金色标准检查,实时反向转录酶聚合酶链反应(RT-PCR)相比,证明高度准确的自动分类并提供的时间更少。 - o存在相关性\'orio t \'ecnico prop \ 〜oe a fituiliza \ c {c} \ 〜ao de uma de uma de uma de uma de uma de uma de uma rede refolucional refolucional profunda como m \'etodo' tomografia computadorizada tor \'accica em pacientes com sintomas de s \'indrome respirat \'oria aguda grave(srag) ^encia de cuidados ungratees poderia acartar graves danos temer \'arios,\`longo prazo,ou permanentes \ a a sa \'ude。 o Modelo Foi Treinado EM 83.391成像,VILEDADO EM 15.297,E TESTADO EM 22.185 FIGURAS,ATINGINDO PONTUA \ C {C} \ 〜AO no F1-SCORE DE 98%,97,59%EM COHEN KAPPA,98,4%DEACUR,98,4%DEACUR \'acia e 5,09%损失。 atestando uma classifica \ c {c} \ 〜ao aumatizada r \'apida e de alta precis \ 〜ao,e fornecendo resuldo exultado em tempo menor ao ao do exame padr \ 〜Ao-ao-outo atual,o实时反向转移酶聚合酶链链反应(RT-PCR)。
translated by 谷歌翻译
如今,视觉变压器是图像分类任务的事实上的偏好。分类任务有两种类别,即细粒度和粗粒。在细粒度的分类中,由于子类之间的相似性高度相似,因此必须发现细微的差异。当我们降低图像以节省与视觉变压器(VIT)相关的计算成本时,这种区别通常会丢失。在这项工作中,我们介绍了深入的分析,并描述了开发用于从标本室纸的细粒度分类系统的关键组成部分。我们广泛的实验分析表明,需要更好的增强技术以及现代神经网络处理更高维图像的能力。我们还介绍了一个称为“ Anciformer”的卷积变压器体系结构,该体系结构与流行的视觉变压器(Convit)不同,可以处理更高的分辨率图像,而不会爆炸记忆和计算成本。我们还介绍了一种新颖的,改进的预处理技术,称为Presizer,以更好地调整图像大小,同时保留其原始纵横比,这对于对天然植物进行分类至关重要。借助我们简单而有效的方法,我们在202X和Inatorist 2019数据集上实现了SOTA。
translated by 谷歌翻译
石油场和地震成像的储层模拟被称为石油和天然气(O&G)行业中高性能计算(HPC)最苛刻的工作量。模拟器数值参数的优化起着至关重要的作用,因为它可以节省大量的计算工作。最先进的优化技术基于运行大量模拟,特定于该目的,以找到良好的参数候选者。但是,在时间和计算资源方面,使用这种方法的成本高昂。这项工作提出了金枪鱼,这是一种新方法,可增强使用性能模型的储层流仿真的最佳数值参数的搜索。在O&G行业中,通常使用不同工作流程中的模型合奏来减少与预测O&G生产相关的不确定性。我们利用此类工作流程中这些合奏的运行来从每个模拟中提取信息,并在其后续运行中优化数值参数。为了验证该方法,我们在历史匹配(HM)过程中实现了它,该过程使用Kalman滤波器算法来调整储层模型的集合以匹配实际字段中观察到的数据。我们从许多具有不同数值配置的模拟中挖掘了过去的执行日志,并根据数据提取的功能构建机器学习模型。这些功能包括储层模型本身的属性,例如活动单元的数量,即模拟行为的统计数据,例如线性求解器的迭代次数。采样技术用于查询甲骨文以找到可以减少经过的时间的数值参数,而不会显着影响结果的质量。我们的实验表明,预测可以平均将HM工作流程运行时提高31%。
translated by 谷歌翻译