机器学习正在从艺术和科学转变为可供每个开发人员使用的技术。在不久的将来,每个平台上的每个应用程序都将包含训练有素的模型,以编码开发人员无法创作的基于数据的决策。这提出了一个重要的工程挑战,因为目前数据科学和建模在很大程度上与标准软件开发过程脱钩。这种分离使得在应用程序内部的机器学习能力不必要地变得困难,并且进一步阻碍了开发人员将MLin置于首位。在本文中,我们介绍了ML .NET,这是一个在过去十年中在Microsoft开发的框架,用于应对在大型软件应用程序中轻松发布机器学习模型的挑战。我们提出了它的架构,并阐明了形成它的应用程序需求。具体而言,我们引入了DataView,它是ML .NET的核心数据抽象,它可以有效地,一致地捕获完整的预测管道,并在训练和推理生命周期中进行。我们结束了论文,对ML .NET进行了令人惊讶的有利的性能研究,与更多的接受者相比,并讨论了一些经验教训。
translated by 谷歌翻译
The ability to estimate task difficulty is critical for many real-world decisions such as setting appropriate goals for ourselves or appreciating others' accomplishments. Here we give a computational account of how humans judge the difficulty of a range of physical construction tasks (e.g., moving 10 loose blocks from their initial configuration to their target configuration , such as a vertical tower) by quantifying two key factors that influence construction difficulty: physical effort and physical risk. Physical effort captures the minimal work needed to transport all objects to their final positions, and is computed using a hybrid task-and-motion planner. Physical risk corresponds to stability of the structure, and is computed using noisy physics simulations to capture the costs for precision (e.g., attention, coordination, fine motor movements) required for success. We show that the full effort-risk model captures human estimates of difficulty and construction time better than either component alone.
translated by 谷歌翻译
理解和解释深度学习模型所做出的决策在许多领域都是非常宝贵的。在计算机视觉中,来自深度网络的计算热图是一种用于可视化和理解深度网络的流行方法。然而,与网络无关的热图可能误导人类,因此热图的表现对于深入网络提供忠实的解释至关重要。在本文中,我们提出了I-GOS,它可以优化热图,使得蒙版图像上的分类分数最大程度地降低。该方法的主要新颖性是基于积分梯度而不是常规梯度来计算下降方向,这避免了局部最优并加速了收敛。与以前的方法相比,我们的方法可以灵活地计算任何分辨率的热图,以满足不同的用户需求。在几个基准数据集上的广泛实验表明,与其他最先进的方法相比,我们的方法产生的热图与底层深层网络的决策更加相关。
translated by 谷歌翻译
属性引导的面部图像合成旨在操纵面部图像上的属性。大多数现有的图像到图像转换方法可以使用单个属性在任意两个图像域之间执行固定转换,或者为每个主体提供感兴趣的属性的训练数据。因此,这些方法只能为每对图像训练一个特定的模型。域名,限制了他们处理超过两个域的能力。这些方法的另一个缺点是它们经常遭受模式崩溃的常见问题,这会降低所生成的图像的质量。为了克服这些缺点,我们提出了使用单个模型的属性引导面部图像生成方法,其能够合成以感兴趣的属性为条件的多个实际人脸图像。此外,我们采用所提出的模型来增加模拟面图像的真实感,同时保留面部特征。与现有模型相比,我们的方法生成的合成人脸图像在几个人脸数据集上呈现出良好的现实主义质量。最后,我们证明生成的面部图像可用于合成数据增强,并提高用于面部表情识别的分类器的性能。
translated by 谷歌翻译
在本文中,我们提出了一种脑信号分类方法,该方法使用协方差矩阵的特征值作为特征来对从脑信号创建的图像(topomaps)进行分类。在处理2D和3D问题期间记录信号。该系统用于对2D和3D问题的正确和错误答案进行分类。使用分类技术,将比较2D和3D多媒体教育内容对学习,记忆保持和回忆的影响。受试者学习相似的2D和3D教育内容。然后,在三十分钟(短期记忆)和两个月(长期记忆)之后,向受试者询问与内容相关的20个多项选择题(MCQ)。从topomaps图像中提取的特征值特征被给予K-最近邻(KNN)和支持向量机(SVM)分类器,以便识别与不正确和正确答案相关的大脑状态。通过两种分类器获得的优异精度和对结果进行统计分析,在STM和LTM中,2D和3D多媒体教学内容在学习,记忆保持和回忆方面没有显着差异。
translated by 谷歌翻译
本文旨在为研究人员和工程专业人员提供实用和全面的基于深度学习的解决方案,以检测建筑设备从开发的最初阶段到最后一个部署阶段。本文重点介绍部署的最后一步。解决方案开发的第一阶段,涉及数据准备,模型选择,模型训练和模型评估。该研究的第二阶段包括模型优化,特定应用嵌入式系统选择,经济分析。提出并比较了几种嵌入式系统。结果的结果证实了解决方案具有优异的实时性能,并且具有一致的90%以上的准确率。目前的研究验证了基于深度学习的对象检测解决方案对于构造场景的实用性。此外,本研究中提供的详细知识可以用于多种目的,例如安全监测,生产力评估和管理决策。
translated by 谷歌翻译
对具有显着不同尺度和密度的人或物体进行计数引起了研究界的极大兴趣,但它仍然是一个开放的问题。在本文中,我们提出了一个简单但有效且有效的网络,名为DENet,它由两个组件组成,即检测网络(DNet)和编码器 - 解码器估计网络(ENet)。我们首先在输入图像上运行HTTP,以检测和计算可以明确分割的个体。然后,利用ENet估计剩余区域的密度图,其中无法检测到个体的数量。我们提出了经过修改的Xception作为特征提取的编码器以及相关卷积和转置卷积作为解码器的组合。在上海科技A部分,UCF和WorldExpo'10数据集中,我们的DENet实现了比最先进方法更低的绝对误差(MAE)。
translated by 谷歌翻译
精神障碍如自闭症谱系障碍(ASD)是异质性疾病,众所周知难以诊断,特别是在儿童中。目前的精神病诊断过程完全基于症状学的行为保护(DSM-5 / ICD-10),可能容易发生由于误诊导致的药物过度处方。为了使这个领域更加时尚化,我们需要先进的,可扩展的机器学习基础设施,这将使我们能够识别精神健康障碍的可靠生物标志物。在本文中,我们提出了一个名为ASD-DiagNet的框架,通过仅使用fMRI数据来分类来自健康受试者的ASD受试者。我们使用自动编码器和单层感知器设计并实现了联合学习过程,从而提高了提取特征的质量和模型的优化参数。此外,我们设计并实现了基于可用特征向量的线性插值的adata增强策略,这使我们能够生成训练机器学习模型所需的合成数据集。所提出的方法在由自闭症脑成像数据交换提供的公共数据集上进行评估,包括来自17个不同脑成像中心的1035个受试者。我们的机器学习模型优于13个成像中心的其他最先进的方法,其分类精度提高了20%,最高准确度达到80%。本文提出的机器学习技术除了可以产生更好的质量之外,还在执行时间方面提供了巨大的优势(40分钟与其他方法的6小时相比)。实施的代码可作为我们实验室的GPL许可证onGitHub门户网站(https://github.com/pcdslab/ASD-DiagNet)。
translated by 谷歌翻译
基于深度卷积网络的超分辨率是一个快速发展的领域,具有许多实际应用。在本次展览中,我们广泛地比较了30多个最先进的超分辨率卷积神经网络(CNN),超过三个经典和三个最近引入的具有挑战性的数据基准单图像超分辨率。我们引入了基于深度学习的超分辨率网络的分类法,该网络将现有的方法分为包括线性,残差,多分支,递归,渐进,基于注意力和对抗性设计的intonine类别。我们还在网络复杂性,内存足迹,模型输入和输出,学习细节,网络损耗类型和重要架构差异(例如,深度,跳过连接,过滤器)方面提供模型之间的比较。进行了广泛的评估,显示了过去几年中准确性的一致性和快速增长,以及相应的boostin模型复杂性和大规模数据集的可用性。还可以看出,被确定为基准的开创性方法已经被当前的竞争者明显超越。尽管近年来取得了进展,但我们发现了现有技术的一些缺点,并为解决这些开放性问题提供了未来的研究方向。
translated by 谷歌翻译
深度卷积神经网络在包含空间不变噪声(合成噪声)的图像上表现更好;然而,它们在真实噪声照片上的性能受到限制,需要多级网络建模。为了提高去噪算法的实用性,本文提出了采用模块化结构的新型单级盲实时图像去噪网络(RIDNet)。我们在残差结构上使用残差来减轻低频信息的流动,并应用特征注意来利用信道依赖性。此外,对三种合成和四种真实噪声数据集的定量测量和视觉质量的评估,对19种最先进的算法进行了评估,证明了我们的RIDNet的优越性。
translated by 谷歌翻译