超过30亿人缺乏护理皮肤病。AI诊断工具可能有助于早期皮肤癌检测;然而,大多数模型尚未在不同肤色或罕见疾病的图像上进行评估。为了解决这个问题,我们策划了多样化的皮肤科(DDI)DataSet - 这是一种具有不同皮肤色调的第一个公开的,病理证实的图像。我们展示了最先进的皮肤科AI模型在DDI上表现得很糟糕,ROC-AUC与模型的原始结果相比下降29-40%。我们发现暗肤色和罕见的疾病,在DDI数据集中提供良好,导致性能下降。此外,我们表明,无需多样化培训数据,我们表明最先进的强大培训方法无法纠正这些偏差。我们的研究结果确定了需要解决的皮肤病学AI中的重要弱点和偏见,以确保可靠应用于各种患者和所有疾病。
translated by 谷歌翻译
从单个视图中重建高质量的3D对象,从单个视图中的部分观测可能对计算机视觉,机器人和图形的各种应用来说至关重要。虽然最近的神经隐式建模方法显示了合成或密集数据的有希望的结果,但它们在稀疏和嘈杂的现实世界数据上表现不佳。我们发现流行的神经隐式模型的局限性是由于缺乏鲁棒形状的主管和缺乏适当的正则化。在这项工作中,我们展示了使用:(i)一个深度编码器作为形状潜在代码的鲁棒初始化器的深度编码器; (ii)正规化的测试时间优化潜在代码; (iii)以学习的高维形状为深度鉴别者; (iv)一种新颖的课程学习策略,允许模型学习合成数据的形状前瞻,并将其平稳地将它们转移到稀疏的现实世界数据。我们的方法更好地捕获了全局结构,在遮挡和稀疏观测上表现良好,并用地面真理形状良好寄存。我们在两个现实世界数据集上展示了最先进的3D对象重建方法的卓越性能。
translated by 谷歌翻译
基于宽高的情绪分析(ABSA)是一种细粒度的情绪分析任务。为了更好地理解长期复杂的句子,并获得准确的方面的信息,这项任务通常需要语言和致辞知识。然而,大多数方法采用复杂和低效的方法来结合外部知识,例如,直接搜索图形节点。此外,尚未彻底研究外部知识和语言信息之间的互补性。为此,我们提出了一个知识图形增强网络(kgan),该网络(kgan)旨在有效地将外部知识与明确的句法和上下文信息纳入。特别是,kgan从多个不同的角度来看,即基于上下文,语法和知识的情绪表示。首先,kgan通过并行地了解上下文和句法表示,以完全提取语义功能。然后,KGAN将知识图形集成到嵌入空间中,基于该嵌入空间,基于该嵌入空间,通过注意机制进一步获得了方面特异性知识表示。最后,我们提出了一个分层融合模块,以便以本地到全局方式补充这些多视图表示。关于三个流行的ABSA基准测试的广泛实验证明了我们康复的效果和坚固性。值得注意的是,在罗伯塔的预用模型的帮助下,Kggan实现了最先进的性能的新记录。
translated by 谷歌翻译
最近,在一步的Panoptic细分方法上越来越关注,旨在有效地旨在在完全卷积的管道内共同分割实例和材料。但是,大多数现有的工作直接向骨干功能提供给各种分段头,忽略语义和实例分割的需求不同:前者需要语义级别的判别功能,而后者需要跨实例可区分的功能。为了缓解这一点,我们建议首先预测用于增强骨干特征的不同位置之间的语义级和实例级相关性,然后分别将改进的鉴别特征馈送到相应的分割头中。具体地,我们将给定位置与所有位置之间的相关性组织为连续序列,并将其预测为整体。考虑到这种序列可以非常复杂,我们采用离散的傅里叶变换(DFT),一种可以近似由幅度和短语参数化的任意序列的工具。对于不同的任务,我们以完全卷积的方式从骨干网上生成这些参数,该参数通过相应的任务隐含地优化。结果,这些准确和一致的相关性有助于产生符合复杂的Panoptic细分任务的要求的合理辨别特征。为了验证我们的方法的有效性,我们对几个具有挑战性的Panoptic细分数据集进行实验,并以45.1美元\%PQ和ADE20K为32.6美元\%PQ实现最先进的绩效。
translated by 谷歌翻译
有效的空间交通管理需要积极识别人造卫星。从观察到的数据中提取对象识别的当前方法需要空间分辨的图像,其限制对低地球轨道中的对象的标识。然而,大多数人造卫星在地球静止轨道上运行在距离的距离中,禁止基于地面的观察者解析空间信息。本文演示了一种物体识别解决方案,利用修改的残余卷积神经网络将远程不变光谱数据映射到对象标识。我们报告了模拟64级卫星问题超过80%的分类精度 - 即使在卫星正在进行恒定,随机重新定位的情况下。由这些结果驱动的天文观察活动,九级问题的精度为72%,平均每类的100个示例,按照模拟预期执行。我们展示了通过辍学,随机重量平均(SWA)和SWA集中的分层贝叶斯推断的应用,以测量空间交通管理中的分类不确定性 - 临界部件,其中日常决策昂贵的空间资产并承担地缘政治后果。
translated by 谷歌翻译
我们展示了一个新的开源和可扩展知识提取工具包,称为Deepke(基于深度学习的知识提取),支持标准完全监督,低资源少拍摄和文档级方案。 Deepke实现了各种信息提取任务,包括命名实体识别,关系提取和属性提取。使用统一的框架,DeePke允许开发人员和研究人员根据其要求,自定义数据集和模型以从非结构化文本中提取信息。具体而言,DeePke不仅为不同的任务和场景提供了各种功能模块和模型实现,而且还通过一致的框架组织所有组件以维持足够的模块化和可扩展性。此外,我们在\ URL {http://deepke.zjukg.cn/}中介绍一个在线平台,用于实时提取各种任务。 Deepke已经配备了Google Colab教程和初学者的综合文件。我们用演示视频发布\ url {https://github.com/zjunlp/deepke}源代码。
translated by 谷歌翻译
多租户机器学习服务已成为数据中心的数据密集型工作负载,具有GPU资源的繁重。由于大规模,许多调整参数和繁重的资源使用量,评估和基准真实集群的机器学习服务通常是不切实际的。在这次演示中,我们展示了AnalySim,一个集群模拟器,可以为多租户学习服务提供高效的设计探索。具体而言,通过跟踪驱动的群集工作负载仿真,Analysim可以轻松测试和分析许多性能指标中的各种调度策略,例如GPU资源利用率。 Analysim根据物理拓扑和逻辑分区模拟群集计算资源。该工具已用于大致用途,以了解不同调度策略与来自超过1000个GPU的实际生产集群的轨迹的影响。我们发现抢占和迁移能够显着降低平均工作完成时间并减轻资源碎片问题。
translated by 谷歌翻译
轨迹预测(TP)是计算机视觉和机器人领域的重要研究主题。最近,已经提出了许多随机TP模型来处理这个问题,并且比具有确定性轨迹输出的传统模型实现了更好的性能。然而,这些随机模型可以产生许多具有不同品质的未来轨迹。它们缺乏自我评估能力,即检查其预测结果的合理性,因此未能引导用户从候选结果中识别高质量的用户。这阻碍了他们在真正的应用中玩最佳。在本文中,我们弥补了这种缺陷并提出了基于轨迹异常检测(AD)技术的新型TP评估方法。在TPAD中,我们首先将自动化机器学习(Automl)技术和广告和TP字段中的经验结合起来,以自动设计有效的轨迹广告模型。然后,我们利用学习的轨迹广告模型来检查预测轨迹的合理性,并筛选出用户的良好TP结果。广泛的实验结果表明,TPAD可以有效地识别近最佳预测结果,提高随机TP模型的实际应用效果。
translated by 谷歌翻译
结构分布,即组合空间的分布,通常用于学习观察到数据的潜在概率表示。然而,缩放这些模型是由高计算和内存复杂度相对于潜在表示的大小的瓶颈。诸如隐藏的马尔可夫模型(HMMS)和概率的无内容语法(PCFG)的常见模型在隐藏状态的数量中需要时间和空间二次和立方。这项工作展示了一种简单的方法来降低大类结构化模型的计算和内存复杂性。我们展示通过将中央推理步骤视为矩阵 - 矢量产品,并使用低秩约束,我们可以通过等级进行模型表达性和速度。用神经参数化结构化模型进行语言建模,复音音乐建模,无监督语法诱导和视频建模的实验表明,我们的方法在提供实用加速度的同时匹配大状态空间的标准模型的准确性。
translated by 谷歌翻译
神经MWP求解器很难处理小型本地差异。在MWP任务中,一些本地更改节省原始语义,而其他本地更改可能完全更改底层逻辑。目前,MWP任务的现有数据集包含有限的样本,这些样本是神经模型的关键,用于学会消除问题的不同类型的差异并正确解决问题。在本文中,我们提出了一套新型数据增强方法,可以通过不同类型的局部差异增强此类数据来补充现有数据集,并有助于提高当前神经模型的泛化能力。新样本由知识导向实体替换,逻辑引导问题重组产生。确保增强方法保持新数据与其标签之间的一致性。实验结果表明了我们方法的必要性和有效性。
translated by 谷歌翻译