基础培训数据的质量对于建立具有更广泛的Generalizabilty的表演机器学习模型非常重要。但是,当前机器学习(ML)工具缺乏简化的流程,用于提高数据质量。因此,获取数据质量见解并迭代地修剪以获取最大代表下游使用情况的数据集的错误仍然是Ad-hoc手动过程。我们的工作解决了这种数据工具差距,需要纯粹通过以数据为中心的技术构建改进的ML工作流程。更具体地说,我们介绍了(1)在数据集中找到嘈杂或错误标记的样本的系统框架,(2)识别最具信息丰富的样本,当包含在训练中时,该样本将提供最大的模型性能提升。我们展示了我们在公共场合的框架以及两家财富500强公司的私营企业数据集的效果,并确信这项工作将形成ML团队执行更智能的数据发现和修剪的基础。
translated by 谷歌翻译
阿拉伯联合酋长国阿布扎比技术创新研究所最近完成了一辆新的无人面车辆的生产和测试,称为Nukhada,专门用于自主调查,检查和对水下行动的支持。此稿件描述了Nukhada USV的主要特征,以及在开发期间进行的一些试验。
translated by 谷歌翻译
数据表示的比较是一个复杂的多个方面问题,尚未享受完整的解决方案。我们提出了一种用于比较两个数据表示的方法。我们介绍了表示拓扑分歧(RTD),测量在两点云之间的多尺度拓扑中的异常相同,在点之间的一对一的对应关系。数据点云被允许位于不同的环境空间中。RTD是少数基于TDA的实用方法之一,适用于真实机器学习数据集。实验表明,提议的RTD同意对数据表示相似性的直观评估,对其拓扑结构敏感。我们申请RTD在各种问题的计算机视觉和NLP域中获得神经网络表示的见解:培训动力学分析,数据分配转移,转移学习,集合学习,解剖学评估。
translated by 谷歌翻译
最近的作品表明,通过降低空间冗余,可以显着提高视频识别的计算效率。作为代表性的工作,自适应焦点方法(Adafocus)通过动态识别和参加每个视频帧中的信息区域来实现精度和推理速度之间的有利权衡。然而,除非领需要一个复杂的三阶段训练管道(涉及强化学习),导致收敛缓慢,对从业者不友好。这项工作通过引入基于分配的内插的补丁选择操作来重新重新培训ADAFOCUS作为简单的单级算法,实现有效的端到端优化。我们进一步提出了一种改进的培训计划,以解决一级制定的问题,包括缺乏监督,投入多样性和培训稳定性。此外,提出了一种条件 - 退出技术,用于在没有额外训练的情况下在Adafocus的顶部执行时间自适应计算。在六个基准数据集(即,ActivityNet,FCVID,Mini-Kinetics,Something-V1&V2和Jesters)上进行了广泛的实验表明,我们的模型显着优于原始的Adafocus和其他竞争基础,同时培训更简单和有效。代码可在https://github.com/leaplabthu/adafocusv2获得。
translated by 谷歌翻译
在图像变压器网络的编码器部分中的FineTuning佩带的骨干网一直是语义分段任务的传统方法。然而,这种方法揭示了图像在编码阶段提供的语义上下文。本文认为将图像的语义信息纳入预磨料的基于分层变换器的骨干,而FineTuning可显着提高性能。为实现这一目标,我们提出了一个简单且有效的框架,在语义关注操作的帮助下将语义信息包含在编码器中。此外,我们在训练期间使用轻量级语义解码器,为每个阶段提供监督对中间语义的先前地图。我们的实验表明,结合语义前导者增强了所建立的分层编码器的性能,随着絮凝物的数量略有增加。我们通过将Sromask集成到Swin-Cransformer的每个变体中提供了经验证明,因为我们的编码器与不同的解码器配对。我们的框架在CudeScapes数据集上实现了ADE20K数据集的新型58.22%的MIOU,并在Miou指标中提高了超过3%的内容。代码和检查点在https://github.com/picsart-ai-research/semask-egation上公开使用。
translated by 谷歌翻译
我们介绍了Netket的版本3,机器学习工具箱适用于许多身体量子物理学。Netket围绕神经网络量子状态构建,并为其评估和优化提供有效的算法。这个新版本是基于JAX的顶部,一个用于Python编程语言的可差分编程和加速的线性代数框架。最重要的新功能是使用机器学习框架的简明符号来定义纯Python代码中的任意神经网络ANS \“凝固的可能性,这允许立即编译以及渐变的隐式生成自动化。Netket 3还带来了GPU和TPU加速器的支持,对离散对称组的高级支持,块以缩放多程度的自由度,Quantum动态应用程序的驱动程序,以及改进的模块化,允许用户仅使用部分工具箱是他们自己代码的基础。
translated by 谷歌翻译
为了实现长文档理解的构建和测试模型,我们引入质量,具有中文段的多项选择QA DataSet,具有约5,000个令牌的平均长度,比典型的当前模型更长。与经过段落的事先工作不同,我们的问题是由阅读整个段落的贡献者编写和验证的,而不是依赖摘要或摘录。此外,只有一半的问题是通过在紧缩时间限制下工作的注释器来应答,表明略读和简单的搜索不足以一直表现良好。目前的模型在此任务上表现不佳(55.4%),并且落后于人类性能(93.5%)。
translated by 谷歌翻译
分析显微镜图像中细胞的形态可以为化合物或基因的功能提供洞察。解决此任务需要不仅可以从图像中提取生物信息的方法,而且还忽略了技术变异,即,用于收集显微镜图像的设备之间的实验过程或差异的变化。我们提出了与专家混合(团队)的嵌入学习方法提出了治疗计划,该方法学习了一组专家,专门专门捕获我们的培训集中的技术变异,然后在测试时间汇总专家的预测。因此,通过最大限度地减少每个专家的噪声,团队可以通过更少的技术变化偏差来学习强大的嵌入。要培训我们的模型,我们利用了处理样本,使我们的方法能够在每个小靶中捕获整个数据集的分布,同时仍然适用于GPU存储器。我们在三个数据集中评估了我们的方法,如药物发现,促进了识别细胞治疗的真实作用机制的表现,通过最先进的5.5-11%。
translated by 谷歌翻译
如今,各种机器学习(ML)应用程序在无线网络边缘提供连续数据处理和实时数据分析。分布式ML解决方案受到资源异质性严重挑战,特别是所谓的脱柱效应。为了解决此问题,我们设计一种用于设备的新设备到设备(D2D)辅助编码联合学习方法(D2D-CFL),用于在特征隐私泄漏时跨设备负载平衡。所提出的解决方案捕获系统动态,包括数据(时间依赖学习模型,数据到达的各种强度),设备(不同的计算资源和培训数据量)和部署(各种位置和D2D图连接)。我们得出了最佳压缩速率,以实现最小处理时间并建立与收敛时间的连接。由此产生的优化问题提供了次优压缩参数,其提高了总培训时间。我们所提出的方法有利于实时协同应用,用户不断地生成培训数据。
translated by 谷歌翻译
由于新型模型利用较大的数据集和新颖架构,通过生成模型创建的合成图像提高了质量和表现力。尽管这种质感主义是来自创意的角度的正副作用,但是当这种生成模型用于无同意时的冒充时,它会出现问题。这些方法中的大多数是基于源和目标对之间的部分传输,或者它们基于理想的分布生成完全新的样本,仍然类似于数据集中最接近的真实样本。我们提出Mixsyn(阅读为“Mixin”),用于从多种来源学习新的模糊组合物并将新颖的图像作为与组合物对应的图像区域的混合。 Mixsyn不仅将来自多个源掩码的不相关的区域与相干语义组成相结合,而且还生成了非现有图像的掩模感知的高质量重建。我们将Mixsyn与最先进的单源顺序发电和拼贴生成方法相比,在质量,多样性,现实主义和表现力方面;同时还展示了交互式合成,混合和匹配,以及编辑传播任务,没有掩码依赖性。
translated by 谷歌翻译