联合学习(FL)是一个杰出的框架,可以通过融合本地,分散的模型来确保用户隐私来培训集中式模型。在这种情况下,一个主要障碍是数据异质性,即每个客户具有非相同和独立分布(非IID)数据。这类似于域概括(DG)的上下文,在该上下文中,每个客户端都可以视为不同的域。但是,尽管DG中的许多方法从算法的角度来解决数据异质性,但最近的证据表明,数据增强可以诱导相等或更高的性能。在这种连接的激励下,我们介绍了受欢迎的DG算法的联合版本,并表明,通过应用适当的数据增强,我们可以在联合环境中减轻数据异质性,并为看不见的客户获得更高的准确性。配备了数据增强功能,我们甚至可以使用最基本的联邦平均算法实现最先进的性能,并具有更稀疏的沟通。
translated by 谷歌翻译
In this paper, we propose the first-ever real benchmark thought for evaluating Neural Radiance Fields (NeRFs) and, in general, Neural Rendering (NR) frameworks. We design and implement an effective pipeline for scanning real objects in quantity and effortlessly. Our scan station is built with less than 500$ hardware budget and can collect roughly 4000 images of a scanned object in just 5 minutes. Such a platform is used to build ScanNeRF, a dataset characterized by several train/val/test splits aimed at benchmarking the performance of modern NeRF methods under different conditions. Accordingly, we evaluate three cutting-edge NeRF variants on it to highlight their strengths and weaknesses. The dataset is available on our project page, together with an online benchmark to foster the development of better and better NeRFs.
translated by 谷歌翻译
The 1$^{\text{st}}$ Workshop on Maritime Computer Vision (MaCVi) 2023 focused on maritime computer vision for Unmanned Aerial Vehicles (UAV) and Unmanned Surface Vehicle (USV), and organized several subchallenges in this domain: (i) UAV-based Maritime Object Detection, (ii) UAV-based Maritime Object Tracking, (iii) USV-based Maritime Obstacle Segmentation and (iv) USV-based Maritime Obstacle Detection. The subchallenges were based on the SeaDronesSee and MODS benchmarks. This report summarizes the main findings of the individual subchallenges and introduces a new benchmark, called SeaDronesSee Object Detection v2, which extends the previous benchmark by including more classes and footage. We provide statistical and qualitative analyses, and assess trends in the best-performing methodologies of over 130 submissions. The methods are summarized in the appendix. The datasets, evaluation code and the leaderboard are publicly available at https://seadronessee.cs.uni-tuebingen.de/macvi.
translated by 谷歌翻译
Recent approaches to drape garments quickly over arbitrary human bodies leverage self-supervision to eliminate the need for large training sets. However, they are designed to train one network per clothing item, which severely limits their generalization abilities. In our work, we rely on self-supervision to train a single network to drape multiple garments. This is achieved by predicting a 3D deformation field conditioned on the latent codes of a generative network, which models garments as unsigned distance fields. Our pipeline can generate and drape previously unseen garments of any topology, whose shape can be edited by manipulating their latent codes. Being fully differentiable, our formulation makes it possible to recover accurate 3D models of garments from partial observations -- images or 3D scans -- via gradient descent. Our code will be made publicly available.
translated by 谷歌翻译
我们证明,就机器学习政策的参数而言,自然梯度下降承认了与自然选择进化一致的共轭动力描述。我们将这些共轭动力学表征为对连续时间复制器动力学的本地最佳拟合,并表明价格方程适用于策略架构和参数生成的希尔伯特空间的函数等效类别。我们认为,“共轭自然选择”直观地解释了自然梯度下降的经验有效性,同时为机器学习动力学开发了有用的分析方法。
translated by 谷歌翻译
从先前收集的专家数据数据集中学习提供了有望在没有不安全和昂贵的在线探索的情况下获取机器人政策。但是,一个主要的挑战是培训数据集中的各州与在测试时学到的政策访问的国家之间的分配转移。尽管先前的工作主要研究了在离线培训期间政策引起的分配变化,但研究在部署时间从分布状态恢复的问题还不是很好。我们通过引入一项恢复政策来减轻部署时间的分配转变,该恢复政策将代理人带回培训歧管,每当由于外部扰动而逐渐退出分布状态,例如。恢复策略依赖于训练数据密度的近似值和学习的模棱两可的映射,该映射将视觉观测映射到一个潜在空间中,在该空间中,翻译与机器人动作相对应。我们通过在真正的机器人平台上进行了几个操纵实验来证明所提出的方法的有效性。我们的结果表明,恢复策略使代理可以完成任务,而行为克隆仅由于分配转移问题而失败。
translated by 谷歌翻译
密切的人类机器人互动(HRI),尤其是在工业场景中,已经对结合人类和机器人技能的优势进行了广泛的研究。对于有效的HRI,应质疑当前可用的人机通信媒体或工具的有效性,并应探讨新的交流方式。本文提出了一个模块化体系结构,允许人类操作员通过不同的方式与机器人互动。特别是,我们使用智能手表和平板电脑分别实施了架构来分别处理手势和触摸屏输入。最后,我们在这两种方式之间进行了比较用户体验研究。
translated by 谷歌翻译
嵌入大而冗余的数据,例如图像或文本,在较低维空间的层次结构中是表示方法的关键特征之一,如今,这些特征是一旦相信困难或不可能的问题,这些方法就可以为问题提供最新的解决方案解决。在这项工作中,在具有强大元回味的情节扭转中,我们展示了受过训练的深层模型与它们优化的数据一样多余,因此如何使用深度学习模型来嵌入深度学习模型。特别是,我们表明可以使用表示形式学习来学习经过训练的深层模型的固定大小,低维的嵌入空间,并且可以通过插值或优化来探索此类空间,以实现现成的模型。我们发现,可以学习相同体系结构和多个体系结构的多个实例的嵌入空间。我们解决了信号的图像分类和神经表示,表明如何学习我们的嵌入空间,以分别捕获性能和3D形状的概念。在多架结构的环境中,我们还展示了仅在架构子集中训练的嵌入方式如何才能学会生成已经训练的架构实例,从未在培训时看到实例化。
translated by 谷歌翻译
语言模型既展示了定量的改进,又展示了新的定性功能,随着规模的增加。尽管它们具有潜在的变革性影响,但这些新能力的特征却很差。为了为未来的研究提供信息,为破坏性的新模型能力做准备,并改善社会有害的效果,至关重要的是,我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战,我们介绍了超越模仿游戏基准(Big Bench)。 Big Bench目前由204个任务组成,由132家机构的442位作者贡献。任务主题是多样的,从语言学,儿童发展,数学,常识性推理,生物学,物理学,社会偏见,软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号,Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为,跨越了数百万到数十亿个参数。此外,一个人类专家评估者团队执行了所有任务,以提供强大的基准。研究结果包括:模型性能和校准都随规模改善,但绝对的术语(以及与评估者的性能相比);在模型类中的性能非常相似,尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分,而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标;社交偏见通常会随着含糊不清的环境而随着规模而增加,但这可以通过提示来改善。
translated by 谷歌翻译
我们在强烈混合(混乱)方面基于能源持续的哈密顿动力学进行了优化的新框架,并在分析和数值上建立其关键特性。该原型是对出生式动力学的离散化,取决于目标函数,其平方相对速度限制。这类无摩擦,节能优化器毫不动摇地进行,直到自然放慢速度在最小的损失附近,这主要是系统的相位空间体积。我们从对动力台球等混乱系统的研究构建,我们制定了一种特定的算法,在机器学习和解决PDE解决任务(包括概括)方面具有良好的性能。它不能以高的局部最低限度停止,这是非凸损失功能的优势,并且比浅谷中的GD+动量更快。
translated by 谷歌翻译