本报告描述了18个项目,这些项目探讨了如何在国家实验室中将商业云计算服务用于科学计算。这些演示包括在云环境中部署专有软件,以利用已建立的基于云的分析工作流来处理科学数据集。总的来说,这些项目非常成功,并且他们共同认为云计算可以成为国家实验室科学计算的宝贵计算资源。
translated by 谷歌翻译
我们提出了多语种神经机器翻译(MNMT)的调查,近年来获得了很多关注。由于知识转移,MNMT在提高翻译质量方面非常有用。由于端到端建模和分布式表示开辟了新的途径,因此MNMT比其统计机器翻译对应者更有希望和有趣。为了利用多语言并行代码来提高翻译质量,已经提出了许多方法。然而,缺乏全面的调查使得很难确定哪些方法是有希望的,因此值得进一步探索。在本文中,我们对MNMT现有文献进行了深入的调查。我们根据资源场景和基础建模原则对各种方法进行分类。我们希望本文能成为对MNMT感兴趣的研究人员和工程师的起点。
translated by 谷歌翻译
漫画是一种人物形象的艺术形式,其中某些特征被抽象或夸大以产生愚蠢或讽刺效果。对于众多漫画相关的应用,如属性识别和漫画编辑,面部解析是一个必不可少的预处理步骤,提供完整的面部结构理解。然而,当前最先进的面部解析方法需要在像素上的大量标记数据 - 漫画的水平和这样的过程是乏味和劳动密集型的。对于真实照片,有许多用于faceparsing的标记数据集。因此,我们将漫画人脸解析制定为领域适应问题,其中真实照片扮演源域的角色,适应目标漫画。具体来说,我们首先利用基于空间变换器的网络来实现形状域移位。然后利用前馈式传输网络来捕获纹理级域间隙。通过这两个步骤,从真实照片中合成面部漫画,因此我们可以使用原始照片的解析背景来学习解析模型。对合成和真实漫画的实验结果证明了所提出的域自适应算法的有效性。代码位于:https://github.com/ZJULearning/CariFaceParsing。
translated by 谷歌翻译
我们提出了基于互补搜索技术和新颖架构设计的下一代移动网络.MobileNetV3通过硬件网络架构搜索(NAS)与NetAdapt算法的补充,然后通过小说进行改进,调整到移动电话CPU建筑进步。本文探讨了自动搜索算法和网络设计如何协同工作,以利用互补的方法来改进艺术的总体状态。通过这个过程,我们创建了两个新的MobileNet模型:MobileNetV3-Large和MobileNetV3-Small,适用于高资源低用量用例。然后对这些模型进行调整并应用于对象检测和语义分割的任务。对于语义分割(或任何密集像素预测)的任务,我们提出了一种新的高效分割解码器Lite Reduced Atrous Spatial Pyramid Pooling(LR-ASPP)。 Weachieve移动分类,检测和分割的最新技术成果。与MobileNetV2相比,MobileNetV3-Large在ImageNet分类上的准确度提高了3.2%,同时将延迟降低了15%.MobileNetV2-Small的准确度提高了4.6%,同时与MobileNetV2相比,延迟降低了5%。 MobileNetV3-大检测速度提高了25%,与COCO检测时的MobileNetV2大致相同。 MobileNetV3-Large LR-ASPP比MobileNetV2 R-ASPP快30%,与Cityscapes细分的准确度相似。
translated by 谷歌翻译
人们普遍认为,数据质量会影响机器学习(ML)模型的性能,数据科学家在模型培训之前花费大量时间进行数据清理。然而,到目前为止,还没有关于清洁如何影响ML --- ML社区通常关注某些分布的特定类型噪声(例如,错误标签)对某些ML模型的影响,而数据库(DB)的严格研究社区一直在研究单独的数据清理问题,而没有考虑下游分析如何消耗数据。我们提出CleanML基准,系统地研究数据清理对下游ML模型的影响。 CleanML基准测试目前包含13个具有实际错误的真实数据集,五种常见错误类型以及七种不同的ML模型。为确保我们的研究结果具有统计学意义,CleanML使用统计假设检验仔细控制ML实验中的随机性,并使用Benjamini-Yekutieli(BY)程序来控制由于该基准中的许多假设而导致的潜在错误发现。我们获得了许多有趣且非平凡的见解,并确定了多个开放的研究方向。我们还发布了基准,并希望对联合数据清理和ML的重要问题进行未来的研究。
translated by 谷歌翻译
ProductNet是高质量产品数据集的集合,可以更好地理解产品。在ImageNet的推动下,ProductNet旨在通过适当选择的分类法策划高质量的产品数据集来支持产品表示学习。在本文中,构建高质量产品数据集和学习产品表示的两个目标是以迭代的方式相互支持:产品嵌入是通过多模式深度神经网络(主模型)获得的,旨在利用产品图像和目录信息;作为回报,嵌入通过主动学习(本地模型)来大大加速注释过程。对于标记数据,建议的主模型产生高分类精度(1240类的前1精度为94.7%),可用作机器学习模型的搜索索引,分区键和输入特征。 productembedding,以及特定businesstask的精细调整的主模型,也可用于各种传输学习任务。
translated by 谷歌翻译
检测航拍图像中的物体至少有两个原因具有挑战性:(1)像行人这样的目标物体在像素方面非常小,使得难以与周围的背景区分开来; (2)目标通常非常稀疏和不均匀分布,使得检测效率低下。在本文中,我们解决了这些目标经常聚集在一起的观察所引发的问题。特别是,我们提出了一种集群检测(ClusDet)网络,它将对象集群和检测统一在端到端框架中。 ClusDet中的关键组件包括集群提议子网(CPNet),规模估算子网(ScaleNet)和专用检测网络(DetecNet)。给定输入图像,CPNet生成(对象)聚类区域,ScaleNet估计这些区域的对象比例。然后,将每个尺度标准化的聚类区域及其特征馈送到DetecNet以进行对象检测。与以前的解决方案相比,ClusDet具有以下几个优点:(1)它大大减少了最终对象检测的块数,从而实现了高运行时间效率。(2)基于聚类的尺度估计比以前使用的基于单个对象的尺度估计更准确,因此有效地改进了对小对象的检测,以及(3)最终的DetecNet专用于聚类区域,并对先前的上下文信息进行隐式建模,以提高检测准确性。所提出的方法在三个代表性的航空图像数据集上进行测试,包括VisDrone,UAVDT和DOTA。在所有实验中,与现有技术的探测器相比,ClusDetachie在效率和准确性方面都具有很好的性能。
translated by 谷歌翻译
对于感兴趣的产品,我们提出了一种表示一组参考产品的搜索方法。参考产品可用作支持下游建模任务和业务应用程序的候选者。搜索方法包括产品表示学习和指纹型矢量搜索。通过新颖的注意自动编码器神经网络将产品目录信息转换为高质量的低维度嵌入,并且嵌入还与二进制编码向量相结合以便快速检索。我们通过大量实验来评估所提出的方法,并将其与同行服务进行比较,以证明其在搜索返回率和精度方面的优势。
translated by 谷歌翻译
无模型单目标跟踪(SOT)算法的最新进展极大地激发了将SOT应用于\ emph {多目标跟踪}(MOT)以提高鲁棒性以及减轻对外部检测器的依赖性。然而,SOT算法通常被设计用于将目标与其环境区分开,因此当目标在空间上与在MOT中经常观察到的类似物体混合时遇到问题。为了解决这个问题,在本文中,我们提出了一种实例感知跟踪器,用于在目标模型内部和目标模型之间集成SOT技术以实现MOTby编码感知。特别地,我们通过融合用于区分目标与背景和其他实例(跟踪目标)的信息来构建每个目标模型。为了保证所有目标模型的唯一性,我们的实例感知跟踪器会考虑来自所有目标模型的响应图,并专门分配空间位置以优化整体精度。我们做出的另一个贡献是通过卷积神经网络学习的动态模型再雾化策略。该策略有助于消除初始化噪声以及适应目标大小和外观的变化。为了显示所提出的方法的有效性,它在流行的MOT15和MOT16挑战基准上进行了评估。在两个基准测试中,与已发布的结果相比,我们的方法实现了最佳的整体性能。
translated by 谷歌翻译
本文的目的是通过将机构学习框架定义为在概率测量空间上定义的最小化功能,提供对机器学习中广泛感兴趣的问题的统一视图。特别是,通过我们框架的镜头可以看出,强化学习中的生成对抗网络,变分推理和反应批评方法都可以看出来。然后,我们讨论了一种用于我们的配方的通用优化算法,称为概率函数下降(PFD),并展示了该算法如何恢复在前面提到的设置中独立开发的现有方法。
translated by 谷歌翻译