本文关注的是通过人工神经网络逼近偏微分方程的解。这里使用前馈神经网络来近似偏微分方程的解。将学习问题表述为最小二乘法,选择偏微分方程的残差作为损失函数,而采用多级Levenberg-Marquardt方法作为训练方法。此设置允许我们进一步了解多级方法的潜力。实际上,当最小二乘问题源于人工神经网络的训练时,受优化的变量与任何几何约束无关,并且标准插值和限制算子不能再使用。然后提出了由代数多重网格方法启发的启发式方法,以构建多级传输算子。数值实验表明,与标准的相应一级程序相比,新的多重开发方法对人工神经网络训练的效率有相关的结果。
translated by 谷歌翻译
随着大规模,真实世界数据集的快速增长,解决长尾数据分发的问题变得至关重要(即,几个类占大多数数据,而大多数类是代表性的)。现有解决方案通常采用类别重新平衡策略,例如基于每个类别的观察数量的重新采样和重新加权。在这项工作中,我们认为随着样本数量的增加,新增数据点的额外好处将会减少。我们引入了一种新的理论框架,通过将每个样本与一个小的邻近区域而不是单个点相关联来测量数据重叠。样本的有效数量定义为样本量,可以通过简单公式$(1- \ beta ^ {n})/(1- \ beta)$计算,其中$ n $是样本数和$ \ beta \ in [0,1)$是一个超参数。我们设计了加权方案,该方案使用每个类别的有效样本数量来平衡损失,从而产生类平衡损失。对人工诱导的长尾CIFAR数据集和包括ImageNet和iNaturalist在内的大型数据集进行综合实验。我们的结果表明,当使用所提出的类平衡损失进行训练时,网络能够在长尾数据集上实现显着的性能提升。
translated by 谷歌翻译
机器人辅助治疗(RAT)已经成功地用于HRI研究,其中包括社交机器人在医疗保健干预中,因为它们能够吸引人类用户的社交和情感维度。该主题的研究项目遍布全球,遍及美国,欧洲和亚洲。所有这些项目都有一个雄心勃勃的目标,即增加无辜人口的福祉。 RAT的典型工作是使用遥控机器人进行的;一种名为Wizard of of Oz(WoZ)的技术。机器人通常由操作人员控制,患者不知道。然而,从长远来看,WoZ已被证明不是一种可持续发展的技术。为机器人提供自主权(同时保持在治疗师的监督下)有可能减轻治疗师的负担,不仅在治疗方面本身,而且在长期诊断任务中。因此,需要探索在治疗中使用的社交机器人的几个自治程度。增加机器人的自主权也可能带来一系列新的挑战。特别是,需要回答新的道德问题,即使用弱势群体的机器人,以及需要确保符合道德规范的机器人行为。因此,在本次研讨会中,我们希望收集研究结果并探索哪种程度的自主权可能有助于改善医疗保健干预措施,以及我们如何克服其固有的道德挑战。
translated by 谷歌翻译
这篇简短的说明考虑了动态精度的信赖域算法的有效变体,提出了Carter(1993)和Conn,Gould和Toint(2000)作为高性能计算的工具,这是一个允许多精度计算的关键领域。用于控制能量耗散。数值实验表明,通过有效地利用多精度计算,使用所考虑的方法可以大大节省目标函数和梯度评估“能源成本”。
translated by 谷歌翻译
研究表明,广泛使用的深度神经网络是易受攻击的对抗性扰动。而且,这些对抗性的扰动经常跨模型传递。我们假设对抗弱点由三个偏差来源组成:架构,数据集和随机初始化。我们展示了可以将对抗性示例分解为依赖于体系结构的组件,依赖于数据的组件和依赖于噪声的组件,并且这些组件的行为直观。例如,依赖于噪声的组件向所有其他模型转移不良,而依赖于架构的组件更好地转移到具有相同架构的再训练模型。此外,我们证明这些组件可以重新组合以提高可转移性而不牺牲原始模型的功效。
translated by 谷歌翻译
任何精明的在线购物者都知道,二手点对点市场充满了混合质量的图像。图像质量如何影响市场结果,并且可以自动预测质量?在这项工作中,我们对用户生成的图像在对等市场中的质量进行了大规模的研究。通过收集常见二手产品(约75,000张图像)的数据集并使用人类标记的质量判断来注释子集,我们能够以相当高的准确度(~87%)建模和预测图像质量。然后,我们进行了两项研究,重点是了解这些图像质量得分与两种市场结果之间的关系:销售和感知可信度。我们表明,图像质量与物品出售的可能性较高有关,但其他因素(如观看次数)是更好的销售预测因素。尽管如此,我们表明,我们的模型选择的高质量用户生成的图像优于股票图像,不会影响用户的信任感。我们的研究结果可以为未来的市场设计提供信息,并指导潜在的卖家采取更好的产品质量。
translated by 谷歌翻译
神经网络容易受到对抗性示例的攻击,恶意输入可以欺骗受过训练的模型。对抗性示例通常表现出黑色 - 传递,这意味着一个模型的对抗性示例可以欺骗另一个模型。然而,对抗性示例可能过度拟合以利用源模型的特定结构和特征表示,从而导致对其他目标模型的非最佳黑盒传输攻击。这导致我们引入中级攻击(ILA),它试图通过增加其在源模型的预先指定的层上的扰动来微调现有的对抗性示例以获得更大的黑盒可转移性。通过验证我们的方法可以有效地实现这一目标,并且我们可以在不知道目标模型的情况下确定源模型的非常优化层。
translated by 谷歌翻译
我们研究量子力学形式主义对日常生活的适用性。这似乎与在一个问题上得出结论或决定的行为影响对另一个问题的结论或决定的信心的情况直接相关。李代数理论被认为是指导构建这种情境的量子描述的非常有用的工具。讨论了测试,扩展和推测应用及其含义,包括神经网络中思想的编码。建议将这种数学结构识别并结合到机器学习和人工智能中除了在基本水平上确保概率推理之外,还可以提高效率和普遍性。
translated by 谷歌翻译
估计基本矩阵是计算机视觉中的经典问题。传统方法在很大程度上依赖于估计的关键点对应的正确性,这可能是噪声和不可靠的。结果,这些方法难以处理具有大遮挡的图像对或显着不同的相机姿势。在本文中,我们提出了新颖的神经网络架构,以端到端的方式估计基本矩阵,而不依赖于点对应。引入新模块和层以便将基本矩阵的数学属性保持为具有七个自由度的同构秩-2矩阵。我们使用KITTI数据集上的各种度量来分析所提出的模型的性能,并且表明它们与传统方法相比具有竞争性能,而无需提取对应关系。
translated by 谷歌翻译
语义分割是一个具有挑战性的视觉问题,通常需要收集大量精细注释的数据,这些数据的获取成本非常高。粗略注释的数据提供了有趣的替代方案,因为它通常更便宜。在这项工作中,我们提出了一种方法,利用粗略注释的数据和finesupervision,以产生比仅使用精细数据获得更好的分割结果。我们通过使用来自Cityscapes数据集的少于200个低分辨率图像来模拟ascarce数据设置来验证我们的方法,并且表明我们的方法基本上优于仅通过平均15.52%mIoU对精细注释数据进行训练并且优于粗糙掩模平均5.28%mIoU 。
translated by 谷歌翻译