我们应用数值方法结合有限差分时域(FDTD)模拟,利用新颖的多保真高斯过程方法,利用五维参数空间上的多目标品质因数优化等离子体镜面滤色器的传输特性。我们将这些结果与传统的无导数全局搜索算法进行比较,例如(单保真)高斯过程优化方案和粒子群优化 - 纳米光子学社区中常用的方法,这是在Lumerical商业光子学软件中实现的。我们在几个预先收集的现实数据集上展示了各种数值优化方法的性能,并表明通过廉价模拟适当地交易廉价信息源,可以更有效地优化具有固定预算的传输属性。
translated by 谷歌翻译
序列到序列模型是NLP的强大主力。大多数变体在其注意机制和输出层中都采用softmax变换,导致密集对齐和严格正输出概率。这种密度是浪费的,使得模型可解释性较差,并为许多难以置信的输出分配概率质量。在本文中,我们提出了sparsese序列到序列模型,植根于$ \ alpha $ -entmaxtransformations的新系列,其中包括softmax和sparsemax作为特定情况,并且对于任何$ \ alpha> 1 $都是稀疏的。我们提供快速算法来评估这些变换及其渐变,这些算法可以很好地扩展到大型词汇表。我们的模型能够生成稀疏对齐并将非非可置性分配给可能输出的简短列表,有时会使波束搜索精确。形态学变形和机器平移的实验揭示了密集模型的一致增益。
translated by 谷歌翻译
卷积神经网络(CNN)在人脸识别方面取得了巨大成功,不幸的是,这种方法以大量计算和存储消耗为代价。因此提出了许多紧凑的面部识别网络来解决这个问题。三重损失对于进一步改善这些紧凑型号的性能是有效的。然而,它通常对所有样本使用固定的保证金,这忽略了不同身份之间的信息相似性结构。在本文中,我们提出了一种增强版的三脚架损失,称为三重蒸馏,它利用了ateacher模型的能力,通过自适应地改变正负对之间的边界,将相似性信息传递给一个小模型。 LFW,AgeDB和CPLFW数据集的实验显示了我们的方法与原始三重态损失相比的优点。
translated by 谷歌翻译
解决基础语言任务通常需要推理给定任务上下文中对象之间的关系。例如,回答问题:“盘子里的杯子是什么颜色的?”我们必须检查特定杯子的颜色,该杯子满足关于盘子的“开启”关系。最近的工作提出了各种方法复杂的关系推理。然而,它们的大部分功率都在推理结构中,而场景用简单的局部外观特征表示。在本文中,我们采用另一种方法,在视觉场景中为对象构建上下文化表示,以支持关系推理。我们提出了语言条件图网络(LCGN)的一般框架,其中每个节点表示一个对象,并且由相关对象的上下文感知表示通过以文本输入为条件的迭代消息传递来描述。例如,调整与盘子的“上”关系,对象``mug''收集来自对象``plate''的消息,将其表示更新为“盘子上的杯子”,这可以很容易地消耗掉通过简单的分类器进行答案预测。我们通过实验证明,我们的LCGN能够有效地支持关系推理,并提高了几个任务和数据集的性能。
translated by 谷歌翻译
信息融合是众多工程系统和生物功能的重要组成部分,例如人类认知。融合发生在许多层面,从信号的低级组合到异构决策过程的高级聚合。虽然过去十年见证了深度学习研究的爆发,但神经网络融合并没有观察到同样的革命。具体而言,大多数神经融合方法是特定的,不被理解,分布与局部,和/解释性低(如果存在的话)。在此,我们证明了模糊Choquet积分(ChI),一种强大的非线性聚合函数,可以表示为多层网络,以下称为ChIMP。我们还提出了一种改进的ChIMP(iChIMP),它根据ChI不等式约束的指数数量导致基于随机梯度下降的优化。 ChIMP / iChIMP的另一个好处是它可以实现可解释的AI(XAI)。提供了综合验证实验,并将iChIMP应用于远程感知中的一组异构架构深度模型的融合。我们展示了模型精度的提高,我们之前建立的XAI指数揭示了我们的数据,模型及其决策的质量。
translated by 谷歌翻译
带有冲突的装箱(BPC)是这样的问题,其中具有兼容性约束的物品必须包装在最少数量的箱中,注意箱的容量并确保在每个箱中包装非冲突物品。在这项工作中,我们介绍了Bin Packing Problem withCompatible Categories(BPCC),这是BPC的一个变体,其中的项目属于toconflicting或兼容的类别,与之前文献中的逐项兼容性相反。在位于人口密集区域的纳米存储体的最后一英里分布的背景中,这是一个常见问题。为了有效地解决实际大小的问题实例,我们提出了一种变邻域搜索(VNS)元启发式算法。计算实验表明,与在高性能计算环境中运行的线性整数规划相比,该算法在很短的时间内产生了良好的解决方案。
translated by 谷歌翻译
神经网络力场(NNFF)是一种执行回归原子结构 - 力关系的方法,绕过昂贵的量子力学计算,阻止执行长的从头开始质量的分子动力学模拟。然而,大多数用于复杂多元素原子系统的NNFF方法通过利用单原子结构旋转不变特征和计算上昂贵的网络特征空间衍生物来间接地预测原子力矢量。我们开发了交错的NNFF体系结构,分别利用旋转不变和协变特征来直接预测原子力矢量而不使用空间衍生物,从而将昂贵的结构特征计算减少了~180-480x。这种加速使我们能够开发出NNFF,它直接预测复杂的三元和四元元素扩展系统中的原子力,这些系统由长聚合物链,无定形氧化物和表面化学反应组成。所描述的交错旋转不变 - 协变结构还可以直接预测来自计算材料科学之外的域中的局部物理结构的复杂协变矢量输出。
translated by 谷歌翻译
神经网络的量化在降低计算和存储成本方面具有重要意义。虽然没有领域专家提出特殊的手工优化技术或原始网络架构的特殊操作,但深度量化(低于8位)导致量化模型和全精度计数器部件之间的不可恢复的精度差距,这是诱人的。我们提出了一种新颖的正弦正则化,称为SinReQ,用于低精度深度量化训练。所提出的方法旨在自动地在常规训练期间以预定目标比特宽度产生半量化权重。通过在原始目标函数上添加周期函数(正弦正则化器)来实现所提出的正则化。我们利用具有正弦函数的期望凸度轮廓的固有周期性来自动地在常规训练期间将权重推向目标量化水平。我们的方法通过提供任意比特量化的灵活性和通过同时优化不同的分层正则化器进行定制来结合一致性。在CIFAR10,SVHN上的实验的初步结果表明,训练算法中的积分SumReQ达到2.82%,并且对DoReFa(Zhou)的精确度提高了2.11%。等人,2016)和WRPN(Mishra等人,2018)方法。
translated by 谷歌翻译
本文针对紧密编队飞行中的固定翼无人机进行了鲁棒的协同编队控制,以节约能源。开发了Anovel协同控制方法。虚拟结构的概念用于解决在编队飞行中为大量无人机设计虚拟领导者的难度。为了改善瞬态性能,期望的轨迹通过一​​组协同滤波器以产生平滑的参考信号,即虚拟引导的状态。由于无人机之间的空气动力学耦合导致的模型不确定性是使用不确定性和干扰观察器来估计和补偿的。因此,整个设计包含三个主要部分:用于运动规划的协同过滤器,基线协同控制以及不确定性和干扰观察。所提出的地层控制器至少可以确保地层跟踪的最终有界控制性能。如果满足某些条件,则可以获得渐近地层跟踪控制。本文的主要贡献在于两个方面:1)从虚拟结构概念的角度解决虚拟领导者设计的难点; 2)提出了一种机器人协同控制器,用于大量无人机在其间进行气动耦合的近距离飞行。将使用近地层飞行中的五个UAV的数值模拟来证明所提出的设计的效率。
translated by 谷歌翻译
不断发展的物联网(IoT)应用通常需要使用基于传感器的室内跟踪和定位,通过识别周围的环境环境的类型,可以显着提高性能。这种识别非常重要,因为它可以提高定位精度。本文提出了一种基于级联两级机器学习方法的新方法,利用自适应选择和射频特征的组合,在室内环境中进行高精度和鲁棒的定位。在该方法中,机器学习首先用于识别室内周围的类型。环境。然后,在第二阶段,机器学习用于识别产生最高定位精度的RF特征的最合适的选择和组合。分析基于k-最近邻(k-NN)机器学习算法,该算法应用于在真实的印度环境中从RF信号的实际测量产生的真实数据集。接收信号强度,信道传递函数和频率相干函数是正在探索和组合的主要RF功能。数值研究表明,基于主要RF特征的连接的预测显着增强,因为定位精度提高了至少50%至超过70%。
translated by 谷歌翻译