通过将机器学习算法应用于“大数据”,可以在manydomains中看到图像处理能力的快速发展。然而,在医学图像分析领域,由于大规模,注释良好的数据集的可用性有限,部分进展受到限制。造成这种情况的主要原因之一是与生产大量高质量元数据相关的高成本。最近,人们越来越关注为此目的应用众包;这种技术已经被证明可以有效地创建从计算机视觉到物理学的各个学科的大规模数据集。尽管这种方法越来越受欢迎,但还没有全面的文献综述为研究人员提供指导,以考虑在他们自己的医学成像分析中使用众包方法。在本次调查中,我们回顾了将众包应用于2018年7月之前发布的医学图像分析的研究。我们确定了常见的方法,挑战和考虑因素,为采用这种方法的研究人员提供了实用指南。最后,我们将讨论这一新兴领域的未来发展机遇。
translated by 谷歌翻译
本研究使用新颖的统一光谱分析工作流程,对非侵入性传感器进行了比较评估,以评估绿叶蔬菜的微生物污染和货架时间(即储存时间)。在本研究的背景下使用了两个新鲜的即食绿色沙拉,目的是评估所提出的工作流程的效率和实际应用:火箭和婴儿菠菜沙拉。所采用的分析工作流程包括强大的数据归一化,基于随机森林回归的强大特征选择,以及通过在解释的方差图上估计拐点来选择训练过程中的偏最小二乘回归系数。培养过程基于在等温条件(4,8和12C)下储存绿色沙拉样品期间得到的微生物和光谱数据,而在动态温度条件下(模拟食品供应链中的实际温度波动)对数据存储进行测试。由于近年来在食品质量评估中使用非侵入性传感器的兴趣日益增加,因此通过基于有限尺寸特征集的创建/使用而在其中描述的统一光谱分析工作流程在食品中非常有用 - 具体的低成本传感器开发。
translated by 谷歌翻译
用于语义分割的训练卷积网络需要每像素地点真值标签,这非常耗时且因此获得成本高。因此,在这项工作中,我们研究和开发分层深度网络体系结构以及相应的语义分割损失,可以从弱监督,如边界框或图像级标签,以及强大的每像素监督。我们证明了层次结构和强((每像素)和弱(边界框)标签的同时训练,即使是来自不同的数据集,也不断提高针对每像素训练的性能。此外,我们探索了添加弱图像级标签的更具挑战性的案例。我们从巨大的Open Images数据集中收集街道场景图像和弱标签以生成OpenScapes数据集,我们使用这个新颖的数据集来增加两个已建立的每像素标记数据集Cityscapes和Vistas的分割性能。我们报告关键街道场景类的性能提升高达+ 13.2%mIoU,城市景观的Titan V GPU的分辨率为20 fps,分辨率为512 x1024。我们的网络和OpenScapes数据集与搜索社区共享。
translated by 谷歌翻译
在本文中,我们介绍了一种最先进的实时跟踪器(CFNet)的变体,它增加了原始算法对目标损耗的鲁棒性,而没有显着的计算开销。新方法基于以下假设:特征图可用于更准确地估计跟踪置信度。当置信度较低时,我们避免通过要素图更新对象的位置;相反,跟踪器传递到单帧失效模式,在此模式期间,补丁的低级可视内容用于在下一帧中从目标丢失恢复之前,迅速更新对象的位置。通过对几个跟踪数据集评估方法提供的实验证据验证了特征图与跟踪置信度相关的理论假设,以及所提出的实现可以在多个场景中实现目标恢复,而不会影响实时性能。
translated by 谷歌翻译
最近,深度学习领域受到了科学界的高度重视,并被用来为许多计算机视觉问题提供改进的解决方案。卷积神经网络(CNN)已经成功地用于攻击诸如对象识别,对象检测,语义分割和场景理解之类的问题。深度学习的快速发展与GPU加速其过程(如网络培训和推理)的适应性密切相关。尽管在使用GPU加速计算之前很久就存在FPGA设计,尽管高级综合(HLS)工具越来越有吸引力,但由于硬件设计相关性要求,FPGA对深度学习研究和应用开发的适应性很差。这项工作为使用HLS工具在小型低成本低功耗FPGA器件上深度学习移动应用加速提供了工作流程。此工作流程简化了SqueezeJet加速器的改进版本的设计,用于加速移动友好的低参数ImageNet类CNN,例如SqueezeNet v1.1和ZynqNet。此外,该工作流程还包括开发HLS驱动的分析模型,该模型用于加速器的性能评估。该模型还可用于指导设计过程并导致未来的设计改进和优化。
translated by 谷歌翻译
在本文中,我们解决了多线索影响识别的挑战性环境,如儿童机器人交互。为了实现这一目标,我们提出了一种自动识别情感的方法,该方法利用身体表情和面部表情,而传统方法通常只关注后者。我们在一个充满挑战的机器人 - 情感表达的机器人交互数据库以及演员的情绪表达数据库中评估我们的方法,并且表明所提出的方法与面部表情基线相比具有明显更好的结果,可以联合和分开训练,并为我们提供了个人模态以及全身情绪的计算模型。
translated by 谷歌翻译
在本文中,提出了使用深度学习架构进行犯罪分类和预测的详细研究。我们使用来自警方报告的开放数据,检查了该领域的深度学习算法的有效性,并提供了设计和培训深度学习系统以预测犯罪领域的建议。作为犯罪类型perlocation的训练数据时间序列,进行了针对三种不同深度学习配置的10种最先进方法的比较研究。在我们使用公开数据集的实验中,我们证明了基于深度学习的方法始终优于现有的最佳表现方法。此外,我们评估不同参数在深度学习体系中的有效性,并为配置它们提供见解,以便在犯罪分类和最终犯罪预测方面实现更高的性能。
translated by 谷歌翻译
我们解决了通过卷积神经网络验证基于神经的感知系统的问题。我们基于仿射和光度变换定义了局部鲁棒性的概念。我们表明这个概念不能被先前使用的鲁棒性概念所捕获。所提出的方法基于前馈神经网络的可达性分析,并且依赖于所讨论的CNN和变换的MILP编码。我们提出了一种实现方式,并讨论了从MNIST数据集训练的CNN获得的实验结果。
translated by 谷歌翻译
将图形表示为矢量是一项具有挑战性的任务;理想情况下,表示应易于计算并有助于图表之间的有效比较,适合特定数据和分析任务。不幸的是,“一刀切”的解决方案是无法实现的,因为不同的分析任务可能需要对全局或局部图特征进行不同的关注。我们以自我监督的方式开发SGR,这是我们的知识,方法,用于学习图表表示。基于光谱图分析,SGR无缝地结合了上述所有理想的特性。在广泛的实验中,我们展示了我们的方法如何在大图集合上工作,促进跨越各种应用领域的自我监督表示学习,并且在没有重新训练的情况下与最先进的方法竞争性地进行。
translated by 谷歌翻译
转学是在机器学习领域进行深入研究的课程之一。在对象识别和对象检测中,存在参数可转移性的已知实验,但是对于适用于实时嵌入式应用(例如SqueezeDet神经网络)中的对象检测的神经网络则没有。我们使用转移学习来加速SqueezeDet对一组新类的培训。此外,还进行了实验以研究转移学习过程引入的可转移性和共适应现象。为了加速培训,我们提出了SqueezeDet培训的新实现,它提供了更快的数据处理流程,与初始实现相比,实现了1.8美元以上的加速。最后,我们使用经验方法创建了自动超级优化的机制。
translated by 谷歌翻译