基于变分粒子的贝叶斯学习方法的优点是不受影响更多传统参数化技术的偏差的限制。本文建议利用非参数贝叶斯近似推理的灵活性,以开发一种新颖的贝叶斯联邦无学习方法,称为遗忘 - 斯坦变分梯度下降(忘记-SVGD)。忘记SVGD在SVGD上构建 - 一种基于粒子的近似贝叶斯推理方案,使用基于梯度的确定性更新 - 以及称为分布式SVGD(DSVGD)的分布式(联合)扩展名。在完成联合学习后,作为一个或多个参与代理人要求他们的数据被“忘记”,忘记-SVGD在数据需要“未解析”的代理商处执行本地SVGD更新,其与通信回合进行交错参数服务器。通过与非参数化方案通过捕获要遗忘的数据以及现有的参数贝叶斯未经学习方法来验证该方法,以及从头开始训练。
translated by 谷歌翻译
神经辐射场(NERF)使用基于坐标的神经场景表示实现了前所未有的视图合成质量。然而,NERF的视图依赖项只能处理像亮点的简单反射,而是无法处理复杂的反射,例如来自玻璃和镜子的复杂反射。在这些方案中,NERF将虚拟映像模拟为实际几何形状,这导致了不准确的深度估计,并且当违反多视图一致性时产生模糊渲染,因为只有在一些视点下只能看到反射对象。为了克服这些问题,我们介绍了nerfren,它建在nerf,以模拟思考的场景。具体地,我们建议将场景分成传输和反射的组件,并模拟具有单独的神经辐射场的两个组件。考虑到这种分解是高度限制的,我们利用几何前瞻,并仔细设计的培训策略,以实现合理的分解结果。各种自捕获场景的实验表明,我们的方法实现了高质量的新颖观看合成和物理声音深度估计结果,同时启用场景编辑应用。代码和数据将被释放。
translated by 谷歌翻译
压缩已成为必不可少的深度学习研究主题之一,特别是对于具有有限的计算能力和存储容量的边缘设备。在主要压缩技术中,已知通过矩阵分解的低秩压缩具有两个问题。首先,需要广泛的调整。其次,由此产生的压缩性能通常不令人印象深刻。在这项工作中,我们提出了一种低秩压缩方法,该方法利用修改的光束搜索自动等级选择和压缩型培训的修改稳定等级。得到的BSR(波束搜索和稳定等级)算法仅需要调谐所需压缩比的单个封路数据计。 BSR在精度和压缩比权衡曲线方面的性能转出优于先前已知的低秩压缩方法。此外,BSR可以与最先进的结构修剪方法进行或更好地执行。与修剪一样,BSR可以容易地与量化进行额外压缩。
translated by 谷歌翻译
通用事件边界检测(GEBD)是一个新建议的视频了解任务,旨在找到事件的一个级别更深入的语义边界。桥接自然人感知和视频理解之间的差距,它具有各种潜在的应用,包括可解释和语义有效的视频解析。仍处于早期发展阶段,现有的Gebd求解器是相关视频理解任务的简单扩展,无视Gebd的独特特征。在本文中,我们向无监督/监督Gebd提出了一种新颖的框架,通过使用时间自相似性矩阵(TSM)作为视频表示。新的递归TSM解析(RTP)算法利用TSM中的本地对角线模式来检测边界,与边界对比(BOCO)丢失相结合,以培训我们的编码器以产生更多的信息性TSM。我们的框架可以应用于无监督和监督的设置,通过Gebd基准的巨大边缘实现最先进的性能。特别是,我们无监督的方法优于以前的最先进的“监督”模型,这意味着它的卓越效果。
translated by 谷歌翻译
尽管机器学习模型在自然语言处理中的成功(NLP)任务中,但是这些模型的预测经常失败在分销(OOD)样本上。事先作品专注于开发用于检测ood的最先进的方法。 oo ood样本如何与分布式样品不同的基本问题仍未得到答复。本文探讨了培训模型中的数据动态如何,可以使用广泛的细节来了解OOD和配送样本之间的根本差异。我们发现数据样本的句法特征,即该模型在ood和分销案件中持续预测不正确,直接相互矛盾。此外,我们观察到初步证据支持假设模型更容易锁存在琐碎的句法启发式(例如,在对OOD样本进行预测时锁存两种句子之间的单词。我们希望我们的初步研究加速了对各种机器学习现象的数据为中心的分析。
translated by 谷歌翻译
半监督域适应(SSDA)是将学习者调整到新域,只有一小组标记的数据集在源域上给出时,只有一小组标记的样本。在本文中,我们提出了一种基于对的SSDA方法,使用用样品对的自蒸馏来适应靶域的模型。每个样本对由来自标记数据集(即源或标记为目标)的教师样本以及来自未标记数据集的学生样本(即,未标记的目标)组成。我们的方法通过在教师和学生之间传输中间样式来生成助手功能,然后通过最小化学生和助手之间的输出差异来培训模型。在培训期间,助手逐渐弥合了两个域之间的差异,从而让学生容易地从老师那里学习。标准基准测试的实验评估表明,我们的方法有效地减少了域间和域内的差异,从而实现了对最近的方法的显着改进。
translated by 谷歌翻译
基于WiFi的传感引起了近年来的巨大关注。基本原理是由人类引起的信号波动携带可以从WiFi的信道状态信息中提取的人类行为的信息。尽管如此,先前的研究主要关注单任务传感(STS),例如手势识别,室内定位,用户识别。由于手势引起的波动与身体特征和用户的位置高度耦合,因此我们提出了一种基于WiFi的多任务感测模型(Wimuse)来执行手势识别,室内定位和用户识别任务。但是,这些任务具有不同的难度级别(即,不平衡问题),需要特定于任务特定信息(即,差异问题)。为了解决这些问题,Wimuse采用知识蒸馏技术和任务特定的残余适配器。我们首先为每项任务训练STS模型。然后,为了解决不平衡问题,鼓励Wimuse中提取的共同特征接近STS模型的对应特征。此外,对于每个任务,应用了特定于任务特定的残差适配器以提取与公共功能融合的任务特定的补偿功能以解决差异问题。我们对三个公共数据集进行全面的实验,评估表明,Wimuse实现了最先进的性能,平均准确性为85.20%,98.39%,98.39%和98.725%的手势识别,室内本地化和用户识别, 分别。
translated by 谷歌翻译
许多移动制造商最近在其旗舰模型中采用了双像素(DP)传感器,以便更快的自动对焦和美学图像捕获。尽管他们的优势,由于DT在DP图像中的视差缺失的数据集和算法设计,但对3D面部理解的使用研究受到限制。这是因为子孔图像的基线非常窄,并且散焦模糊区域存在视差。在本文中,我们介绍了一种以DP为导向的深度/普通网络,该网络重建3D面部几何。为此目的,我们使用我们的多摄像头结构光系统捕获的101人拥有超过135k张图片的DP面部数据。它包含相应的地面真值3D模型,包括度量刻度的深度图和正常。我们的数据集允许建议的匹配网络广泛化,以便以3D面部深度/正常估计。所提出的网络由两种新颖的模块组成:自适应采样模块和自适应正常模块,专门用于处理DP图像中的散焦模糊。最后,该方法实现了最近基于DP的深度/正常估计方法的最先进的性能。我们还展示了估计深度/正常的适用性面对欺骗和致密。
translated by 谷歌翻译
人类的持续学习(CL)能力与稳定性与可塑性困境密切相关,描述了人类如何实现持续的学习能力和保存的学习信息。自发育以来,CL的概念始终存在于人工智能(AI)中。本文提出了对CL的全面审查。与之前的评论不同,主要关注CL中的灾难性遗忘现象,本文根据稳定性与可塑性机制的宏观视角来调查CL。类似于生物对应物,“智能”AI代理商应该是I)记住以前学到的信息(信息回流); ii)不断推断新信息(信息浏览:); iii)转移有用的信息(信息转移),以实现高级CL。根据分类学,评估度量,算法,应用以及一些打开问题。我们的主要贡献涉及I)从人工综合情报层面重新检查CL; ii)在CL主题提供详细和广泛的概述; iii)提出一些关于CL潜在发展的新颖思路。
translated by 谷歌翻译
我们提出了一种小说隐私保留的联邦对冲域适应方法($ \ textbf {prada} $),以解决在学习的下面但实际的跨筒仓联合域适应问题,其中目标域的一方在两个样本中不足和特色。通过通过常规联合学习将特征空间扩展到具有功能丰富的派对来解决缺乏特征问题,并通过从富含样品富裕的源党对目标方进行对抗域适应来解决样本稀缺问题。在这项工作中,我们专注于可解释性至关重要的财务应用。然而,现有的对抗域适配方法通常应用单个特征提取器来学习对于目标任务的低解释是低解释的特征表示。为了提高可解释性,我们利用域专业知识将要素空间拆分为多个组,每个组都保存相关功能,并且我们从每个功能组中学习语义有意义的高阶功能。此外,我们将特征提取器(以及域鉴别器以及域鉴别器一起)应用于每个特征组以启用细粒度的域自适应。我们设计一种安全的协议,以安全有效地执行PRADA。我们在两个表格数据集中评估我们的方法。实验表明了我们方法的有效性和实用性。
translated by 谷歌翻译