由于混淆偏差,测量在观察研究中的治疗效果是挑战性的。当变量影响治疗和结果时发生混淆。传统方法,如倾向评分匹配通过对混凝剂的调节来匹配估计治疗效果。最近的文献介绍了使用机器学习来预测观察研究中的反事实的新方法,然后允许估计治疗效果。然而,这些研究已经应用于真正的治疗效果尚未知道的真实世界数据。本研究旨在通过模拟两个主要场景来研究这种反事实预测方法的有效性:随着和不混淆。每种类型还包括输入和输出数据之间的线性和非线性关系。模拟中的关键项目是我们生成了已知的真正因果效果。线性回归,套索回归和随机林模型用于预测反事实和治疗效果。将这些与真实的治疗效果相比以及幼稚的治疗效果进行比较。结果表明,本机学习方法是否表现良好的最重要因素,是数据中的非线性度。令人惊讶的是,对于非混淆\纺织{和}混淆,机器学习模型都在线性数据集进行了良好。然而,当引入非线性时,模型非常差。因此,在该仿真研究的条件下,即使存在混淆,机器学习方法也在线性的条件下表现良好,但是在存在混淆时,但在介绍非线性时,在此阶段不应该信任。
translated by 谷歌翻译
在这项工作中,我们提出了一个端到端的异质多机器人系统框架,地面机器人能够在高空四个四极管实时创建的语义图中进行本地化,计划和导航。地面机器人在没有任何外部干预的情况下独立选择并解散目标。此外,他们通过使用语义将其本地地图与高架图匹配,执行跨视图本地化。通信主链是机会主义的,并且可以分配,使整个系统除了四型四型GPS之外没有外部基础架构,没有外部基础架构。我们通过在不同环境中的多个实验上执行不同的任务,通过执行不同的任务,对系统进行了广泛的测试。我们的地面机器人在现实世界中最少的干预和96公里的模拟无需干预即可自主行驶以上超过6公里。
translated by 谷歌翻译
科学家越来越依靠Python工具使用丰富的,类似于Numpy的表达式执行可扩展的分布式内存阵列操作。但是,这些工具中的许多工具都依赖于针对抽象任务图进行了优化的动态调度程序,这些调度图通常遇到内存和网络带宽相关的瓶颈,这是由于亚最佳数据和操作员的放置决策。在消息传递接口(MPI)(例如Scalapack和Slate)上构建的工具具有更好的缩放属性,但是这些解决方案需要使用专门的知识。在这项工作中,我们提出了NUMS,这是一个数组编程库,可在基于任务的分布式系统上优化类似Numpy的表达式。这是通过称为负载模拟层次调度(LSHS)的新型调度程序来实现的。 LSHS是一种本地搜索方法,可通过最大程度地减少分布式系统中任何给定节点上的最大内存和网络加载来优化操作员放置。再加上用于负载平衡数据布局的启发式,我们的方法能够在某些常见的数值操作上达到通信下限,我们的经验研究表明,LSHS通过减少2倍的降低2倍来增强RAR上的性能,需要减少4倍的内存, ,在逻辑回归问题上减少10倍的执行时间。在Terabyte尺度数据上,NUMS在DGEMM上实现了竞争性能,与Dask ML和Spark的Mllib相比,在键盘分解的密钥操作中,DASK高达20倍的速度以及logistic回归的2倍加速。
translated by 谷歌翻译
内容创作者竞争用户的关注。它们的影响力至关重要取决于开发人员在在线平台上做出的算法选择。为了最大程度地提高曝光率,许多创作者从策略上适应了,如庞大的搜索引擎优化行业这样的例子所证明。这将为有限的用户注意池竞争。我们在所谓的曝光游戏中正式化了这些动态,这是一种由算法引起的激励模型,包括现代化分解和(深)两位塔体系结构。我们证明,看似无害的算法选择 - 例如,非负和不受约束的分解 - 在曝光游戏中(NASH)平衡的存在和特征显着影响。我们将像我们这样的创建者行为模型用于(前ANTE)前部署审核。这样的审核可以确定所需内容和激励内容之间的错位,从而补充了诸如内容过滤和节制之类的事后措施。为此,我们提出了用于在曝光游戏中找到平衡的工具,并说明了Movielens和LastFM数据集的审核结果。除此之外,我们发现策略生产的内容在算法探索和内容多样性之间表现出强烈的依赖,以及模型表达和对基于性别的用户和创建者群体的偏见。
translated by 谷歌翻译
最近的攻击表明,可以从FEDSGD更新中恢复用户数据,从而破坏隐私。但是,这些攻击具有有限的实际相关性,因为联邦学习通常使用FedAvg算法。与FEDSGD相比,从FedAvg更新中恢复数据要困难得多,因为:(i)更新是在未观察到的中间网络权重计算的,(ii)使用大量批次,并且(iii)标签和网络权重在客户端上同时不同脚步。在这项工作中,我们提出了一项新的基于优化的攻击,该攻击通过解决上述挑战来成功攻击FedAvg。首先,我们使用自动差异化解决了优化问题,该分化迫使客户端更新的仿真,该更新生成了恢复的标签和输入的未观察到的参数,以匹配接收到的客户端更新。其次,我们通过将来自不同时期的图像与置换不变的先验联系起来来解决大量批处理。第三,我们通过在每个FedAvg步骤中估算现有FEDSGD攻击的参数来恢复标签。在流行的女性数据集中,我们证明,平均而言,我们从现实的FedAvg更新中成功地恢复了> 45%的图像,该更新是在10个本地时期计算出的10批批次,每个批次,每个图像,每张5张图像,而使用基线仅<10%。我们的发现表明,基于FedAvg的许多现实世界联合学习实现非常脆弱。
translated by 谷歌翻译
我们介绍了Pogema(https://github.com/airi-institute/pogema)一个沙盒,用于挑战部分可观察到的多代理探路(PO-MAPF)问题。这是一个基于网格的环境,专门设计为灵活,可调和可扩展的基准。它可以针对各种PO-MAPF量身定制,这些PO-MAPF可以作为计划和学习方法及其组合的绝佳测试基础,这将使我们能够填补AI计划和学习之间的差距。
translated by 谷歌翻译
我们开发了一种内点方法来解决受约束的变异不平等(CVI)问题。受乘数在单目标上下文中的交替方向方法(ADMM)方法的效力的启发,我们将ADMM推广为CVIS的一阶方法,我们将其称为基于ADMM基于ADMM的内部点方法(用于受限的VIS)( ACVI)。我们在两个通用类问题中为ACVI提供了收敛保证:(i)当操作员为$ \ xi $ - 单酮,并且(ii)当它是单调的时,限制是有效的,并且游戏不纯粹是旋转的。当操作员为后一种情况添加L-lipschitz时,我们将$ \ MATHCAL {O}的差距函数的速率匹配已知的低界限(1/\ sqrt {k})$和$ \ MATHCAL {O}(O}(O})(最后一个和平均迭代的1/k)$。据我们所知,这是针对具有全球收敛保证的一般CVI问题的一阶内点方法的首次介绍。此外,与以前的工作不同的是,ACVI提供了一种在限制不平的情况下解决CVI的方法。经验分析表明,ACVI比常见的一阶方法具有明显的优势。特别是,(i)当我们的方法从分析中心接近解决方案时,周期性行为显着降低,并且(ii)与基于投影的方法不同,在接近约束时振荡的方法有效地处理了约束。
translated by 谷歌翻译
合奏是一种直接,非常有效的方法,用于提高模型在分类任务上的准确性,校准和鲁棒性;然而,其成功基础的原因仍然是研究的积极领域。我们基于PFAU(2013)的偏见变化分解的扩展,以便对分类器合奏的行为产生关键的见解。为了引入偏见变化权衡的双重重新聚集,我们首先得出了典型的分类任务的非对称损失的总期望和差异的广义定律。比较条件和引导偏置/方差估计值,我们表明条件估计必定会导致不可还原误差。接下来,我们表明在双空间中结合会降低差异并使偏差不变,而标准结合可以任意影响偏见。从经验上讲,标准的结合减少偏见,使我们假设分类器的集合可能会出现很好的表现,部分原因是这种意外的减少。我们通过对最近的深度学习方法的经验分析来结束,这些方法是在超级范围上进行整体,这表明这些技术确实有利于降低偏见偏见的偏见偏见。这表明,与经典智慧相反,靶向偏见可能是分类器合奏的有希望的方向。
translated by 谷歌翻译
对比性自我监督学习方法学会将图像(例如图像)映射到无需标签的情况下将图像映射到非参数表示空间中。尽管非常成功,但当前方法在训练阶段需要大量数据。在目标训练集规模限制的情况下,已知概括是差的。在大型源数据集和目标样本上进行微调进行预处理,容易在几杆方向上过度拟合,在几个弹药方面,只有少量的目标样本可用。在此激励的情况下,我们提出了一种用于自我监督的对比度学习的域适应方法,称为少数最大的学习方法,以解决对目标分布的适应问题,这些问题在几乎没有射击学习下。为了量化表示质量,我们在包括ImageNet,Visda和FastMRI在内的一系列源和目标数据集上评估了很少的最大最大速度,在这些数据集和FastMRI上,很少有最大最大的最大值始终优于其他方法。
translated by 谷歌翻译
部署的AI系统通常不起作用。它们可以随意地构造,不加选择地部署并欺骗性地促进。然而,尽管有这一现实,但学者,新闻界和决策者对功能的关注很少。这导致技术和政策解决方案的重点是“道德”或价值一致的部署,通常会跳过先前的问题,即给定系统功能或完全提供任何好处。描述各种功能失败的危害,我们分析一组案例研究,以创建已知的AI功能问题的分类法。然后,我们指出的是政策和组织响应,这些策略和组织响应经常被忽略,并在功能成为重点后变得更容易获得。我们认为功能是一项有意义的AI政策挑战,是保护受影响社区免受算法伤害的必要第一步。
translated by 谷歌翻译