由于稀疏神经网络通常包含许多零权重,因此可以在不降低网络性能的情况下潜在地消除这些不必要的网络连接。因此,设计良好的稀疏神经网络具有显着降低拖鞋和计算资源的潜力。在这项工作中,我们提出了一种新的自动修剪方法 - 稀疏连接学习(SCL)。具体地,重量被重新参数化为可培训权重变量和二进制掩模的元素方向乘法。因此,由二进制掩模完全描述网络连接,其由单位步进函数调制。理论上,从理论上证明了使用直通估计器(STE)进行网络修剪的基本原理。这一原则是STE的代理梯度应该是积极的,确保掩模变量在其最小值处收敛。在找到泄漏的Relu后,SoftPlus和Identity Stes可以满足这个原理,我们建议采用SCL的身份STE以进行离散面膜松弛。我们发现不同特征的面具梯度非常不平衡,因此,我们建议将每个特征的掩模梯度标准化以优化掩码变量训练。为了自动训练稀疏掩码,我们将网络连接总数作为我们的客观函数中的正则化术语。由于SCL不需要由网络层设计人员定义的修剪标准或超级参数,因此在更大的假设空间中探讨了网络,以实现最佳性能的优化稀疏连接。 SCL克服了现有自动修剪方法的局限性。实验结果表明,SCL可以自动学习并选择各种基线网络结构的重要网络连接。 SCL培训的深度学习模型以稀疏性,精度和减少脚波特的SOTA人类设计和自动修剪方法训练。
translated by 谷歌翻译
可变形图像注册是医学图像分析中的关键步骤,用于在一对固定图像和移动图像之间找到非线性空间转换。基于卷积神经网络(CNN)的深度注册方法已被广泛使用,因为它们可以快速和端到端的方式执行图像注册。但是,这些方法通常对具有较大变形的图像对的性能有限。最近,迭代深度注册方法已被用来减轻这种限制,在这种限制中,转换以粗到精细的方式迭代学习。但是,迭代方法不可避免地会延长注册运行时,并倾向于学习每次迭代的单独图像特征,从而阻碍了功能的利用,以便在以后的迭代时促进注册。在这项研究中,我们提出了一个非详细的粗到十五个注册网络(NICE-NET),用于可变形图像注册。在Nice-Net中,我们提出:(i)单个深度累积学习(SDCL)解码器,可以在网络的单个通过(迭代)中累积地学习粗到5的转换,以及(ii)选择性地 - 传播功能学习(SFL)编码器,可以为整个粗到精细的注册过程学习通用图像功能,并根据需要选择性地传播功能。在3D脑磁共振成像(MRI)的六个公共数据集上进行了广泛的实验表明,我们提出的Nice-NET可以超越最新的迭代深度注册方法,而仅需要与非辅助方法类似的运行时间。
translated by 谷歌翻译
我们提出了一种将任意样式图像的艺术特征转移到3D场景的方法。在点云或网格上执行3D风格的先前方法对复杂的现实世界场景的几何重建错误敏感。取而代之的是,我们建议对更健壮的辐射场字段表示。我们发现,常用的基于克矩阵的损失倾向于在没有忠实笔触的情况下产生模糊的结果,并引入了最近的基于邻居的损失,该损失非常有效地捕获样式的细节,同时保持多视图一致性。我们还提出了一种新颖的递延后传播方法,以使用在全分辨率渲染图像上定义的样式损失来优化记忆密集型辐射场。我们广泛的评估表明,我们的方法通过产生与样式图像更相似的艺术外观来优于基线。请检查我们的项目页面以获取视频结果和开源实现:https://www.cs.cornell.edu/projects/arf/。
translated by 谷歌翻译
我们提出了一种方法,可以在神经SDF渲染器中相对于几何场景参数自动计算正确的梯度。最近基于物理的可区分渲染技术用于网格采样来处理不连续性,尤其是在对象轮廓上,但是SDF没有简单的参数形式,可用于采样。取而代之的是,我们的方法建立在区域采样技术的基础上,并为SDFS开发了连续的翘曲功能,以解决这些不连续性。我们的方法利用了在SDF中编码的表面的距离,并在球形示踪剂点上使用正交来计算此翘曲功能。我们进一步表明,这可以通过对要点进行次采样来使神经SDF的方法进行。我们可区分的渲染器可用于优化从多视图图像中的神经形状,并对最近基于SDF的反向渲染方法产生可比较的3D重建,而无需2D分割掩码来指导几何形状优化,而无需对几何形状进行体积近似。
translated by 谷歌翻译
最近的工作表明,视觉变压器(VTS)的注意力图在接受自学训练时,可以包含一种语义分割结构,在监督训练时不会自发出现。在本文中,我们明确鼓励这种空间聚类的出现作为一种培训正规化的形式,这种方式包括在标准监督学习中进行自我监督的借口任务。更详细地,我们根据信息熵的空间公式提出了一种VT正则化方法。通过最大程度地减少提议的空间熵,我们明确要求VT生成空间有序的注意图,这是在训练过程中包括基于对象的先验。使用广泛的实验,我们表明,在不同的培训方案,数据集,下游任务和VT体系结构中,提出的正则化方法是有益的。该代码将在接受后可用。
translated by 谷歌翻译
我们在强烈混合(混乱)方面基于能源持续的哈密顿动力学进行了优化的新框架,并在分析和数值上建立其关键特性。该原型是对出生式动力学的离散化,取决于目标函数,其平方相对速度限制。这类无摩擦,节能优化器毫不动摇地进行,直到自然放慢速度在最小的损失附近,这主要是系统的相位空间体积。我们从对动力台球等混乱系统的研究构建,我们制定了一种特定的算法,在机器学习和解决PDE解决任务(包括概括)方面具有良好的性能。它不能以高的局部最低限度停止,这是非凸损失功能的优势,并且比浅谷中的GD+动量更快。
translated by 谷歌翻译
败血症是危及生命的医疗紧急情况,这是全世界死亡的主要原因,也是美国死亡率的第二大原因。研究综合脓毒症系统的最佳控制处理或干预策略是降低死亡率的关键。为此目的,首先,本文提高了我们以前的工作中提出的复杂非线性败血症模型。然后,为每个SEPSIS子系统进行分叉分析,以研究某些系统参数下的模型行为。分叉分析结果还进一步表明了控制治疗和干预治疗的必要性。如果SEPSIS系统在某些参数和初始系统值设置下没有添加任何控件,系统将随着时间的推移而进行持续存在的炎症结果。因此,我们将复杂的改进的非线性败血症模型发展成败血症最优控制模型,然后使用现有诊所实践建议的一些有效的生物标志物作为衡量败血症的发展的优化目标函数。除此之外,还引入了通过组合反复性神经网络(RNN-BO算法)的贝叶斯优化算法来预测研究的败声最优控制系统的最佳控制策略。来自其他优化算法的RNN-BO算法之间的差异是,一旦给定任何新的初始系统值设置(初始值与患者的初始条件相关),则RNN-BO算法能够快速预测相应的时间序列基于任何新败血症患者的历史最佳控制数据的最佳控制。为了证明RNN-BO算法在复杂非线性SEPSIS系统上解决最佳控制解决方案的效力和效率,通过与本文中的其他优化算法进行比较来实现一些数值模拟。
translated by 谷歌翻译
贝叶斯优化算法已成为非线性全球优化问题和许多机器学习应用的有希望的方法。在过去的几年里,提出了改进和增强,他们已经提出了一些有希望的结果,在解决复杂的动态问题,客观函数计算昂贵的普通微分方程的系统来评估。此外,贝叶斯优化算法的直接实现仅适用于10-20维度的优化问题。本文提出的研究提出了一种新的高维贝叶斯优化算法,其结合了经常性神经网络,预计将预测高维或时间序列决策模型的全局优化问题的最佳解决方案。所提出的RNN-BO算法可以解决较低尺寸空间中的最佳控制问题,然后使用经常性神经网络从历史数据学习,以了解历史最佳解决方案数据,并预测任何新的初始系统值设置的最佳控制策略。此外,准确且快速地提供最佳控制策略对于有效和有效地控制疫情,同时最小化相关的财务成本至关重要。因此,为了验证所提出的算法的有效性,对确定性SEIR流行病模型和随机SIS最优控制模型进行计算实验。最后,我们还讨论了不同数量的RNN层和培训时代对解决方案质量与相关计算努力之间的权衡的影响。
translated by 谷歌翻译
知识图表(kg)的表示学习模型已被证明是有效地编码结构信息并在kgs上进行推理。在本文中,我们提出了一种用于知识图表表示学习的新型预训练 - 然后微调框架,其中kg模型首先用三重分类任务预先培训,然后在特定的下游任务上进行判别微调作为实体类型预测和实体对齐。借鉴典型的预训练语言模型学习深层语境化词表示的一般思想,我们提出了学习预先训练的kg表示与目标三重编码的结构和上下文三元组。实验结果表明,微调SCOP不仅优于下游任务组合的基线的结果,而且还避免了特定于特定的特定模型设计和参数培训。
translated by 谷歌翻译
视觉问题应答(VQA)任务利用视觉图像和语言分析来回回答图像的文本问题。它是一个流行的研究课题,在过去十年中越来越多的现实应用。本文介绍了我们最近对AliceMind-MMU的研究(阿里巴巴的编码器 - 解码器来自Damo Academy - 多媒体理解的机器智能实验室),其比人类在VQA上获得相似甚至略微更好的结果。这是通过系统地改善VQA流水线来实现的,包括:(1)具有全面的视觉和文本特征表示的预培训; (2)与学习参加的有效跨模型互动; (3)一个新颖的知识挖掘框架,具有专门的专业专家模块,适用于复杂的VQA任务。处理不同类型的视觉问题,需要具有相应的专业知识在提高我们的VQA架构的表现方面发挥着重要作用,这取决于人力水平。进行了广泛的实验和分析,以证明新的研究工作的有效性。
translated by 谷歌翻译