通过将机器学习算法应用于“大数据”,可以在manydomains中看到图像处理能力的快速发展。然而,在医学图像分析领域,由于大规模,注释良好的数据集的可用性有限,部分进展受到限制。造成这种情况的主要原因之一是与生产大量高质量元数据相关的高成本。最近,人们越来越关注为此目的应用众包;这种技术已经被证明可以有效地创建从计算机视觉到物理学的各个学科的大规模数据集。尽管这种方法越来越受欢迎,但还没有全面的文献综述为研究人员提供指导,以考虑在他们自己的医学成像分析中使用众包方法。在本次调查中,我们回顾了将众包应用于2018年7月之前发布的医学图像分析的研究。我们确定了常见的方法,挑战和考虑因素,为采用这种方法的研究人员提供了实用指南。最后,我们将讨论这一新兴领域的未来发展机遇。
translated by 谷歌翻译
互联网上的滥用是我们这个时代的重大社会问题。对Twitter中自动滥用语言检测的前期研究表明,基于社区的用户分析是一项很有前途的技术。然而,现有方法只能通过建模捕获在线社区的浅层属性。跟随者关系。相比之下,使用图形卷积网络(GCN),我们提出了第一种方法,它不仅捕获在线社区的结构,而且还捕获其中用户的语言行为。我们表明,这种异构的图形结构的社区建模显着推动了滥用语言检测的当前艺术状态。
translated by 谷歌翻译
目前大多数隐喻识别方法都使用受限制的语言上的对象,例如:通过只考虑动词的论点或包含短语的句子。受到关于隐喻的实用说明的启发,我们认为,对于更好的隐喻识别,挖掘者话语特征是至关重要的。利用各种文档嵌入方法学习对话语及其周围话语表示的简单梯度增强分类器,在2018 VU Amsterdammetaphor识别任务中获得近乎最先进的结果,而无需使用复杂的隐喻特征或深度神经架构。其他系统。定性分析进一步证实了隐喻处理中需要更广泛的背景。
translated by 谷歌翻译
近年来社交媒体的快速增长引发了一些高度不受欢迎的现象,例如互联网上滥用和冒犯性语言的泛滥。以前的研究表明,这些仇恨内容往往来自那些共享一组共同刻板印象并形成社区群体的用户。当前最先进的仇恨语音检测方法无视用户和社区信息,完全依赖于文本(即词汇和语义)线索。在本文中,我们提出了一种新方法来解决这个问题,该方法结合了Twitterusers的基于社区的分析功能。通过对16k推文数据集的实验,我们发现我们的方法在仇恨语音检测方面明显优于当前的技术水平。此外,我们对模型特征进行了定性分析。我们发布代码,预先训练的模型以及公共领域中使用的所有资源。
translated by 谷歌翻译
个体猪检测和跟踪是许多基于视频的猪监测应用中的重要要求。然而,由于光线波动,猪的外观,形状变形和遮挡等问题,它在复杂场景中仍然是一项艰巨的任务。为了解决这些问题,我们提出了一种强大的实时多猪检测和跟踪方法,该方法不需要手动标记或物理识别猪,并且在日光和红外光条件下都能工作。我们的方法通过新颖的分层数据关联算法将基于CNN的检测器和基于相关滤波器的跟踪器耦合在一起。通过在一级预测网络中使用从不同尺度的多个层导出的特征,检测器获得最佳准确度/速度权衡。我们将标签盒foreach pig定义为跟踪目标,并使用学习的相关过滤器以关键点跟踪方式进行多目标跟踪。在不足的挑战条件下,跟踪失败是基于探测器和跟踪器的响应之间的关系来建模的,并且数据关联算法允许精确的检测假设,同时可以通过探测跟踪失败然后跟踪的初始化来校正漂移轨道。结果,最佳轨迹随着在线精细检测而顺序地增长,并且跟踪片段被正确地集成到相应轨道中,同时保持原始标识。使用从商业农场捕获的数据集进行的实验表明,我们的方法可以有力地检测和跟踪多个猪的挑战条件。所提出的方法的有希望的性能也证明了在复杂环境中长期个体猪追踪的可行性,因此具有商业潜力。
translated by 谷歌翻译
我们提出了一个完整的基于视觉传感的微型飞行器自主导航系统。我们专注于仅使用板载传感和处理进行映射,以及如何最好地利用此地图信息进行规划,尤其是在非常混乱的环境中使用窄视场传感器时。此外,还介绍了系统的其他必要部分和特殊注意事项的详细信息。我们在现实搜索和救援以及工业检查场景中对真实地图上的多个全球规划和路径平滑方法进行了比较。
translated by 谷歌翻译
本文提出了一种用于自主无人地面车辆(UGV)导航的局部3D环境表示的新方法,称为On Visible PointClouds Mesh(OVPC Mesh)。我们的方法代表机器人的周围环境,作为从本地点云数据生成的水密3D网格,以便表示机器人周围的自由空间。这是对自由空间的保守估计,并且在表示精度和计算效率之间提供了期望的折衷,而不必将环境离散化为固定的网格大小。我们的实验分析了UGV导航在粗糙地形中的可用性,无论是在模拟中还是在完全集成的现实世界系统中。此外,我们比较了我们的方法,即已知的最先进的解决方案,如Octomap和Elevation Mapping,并表明OVPC Mesh可以在满足实时约束的同时为轨迹规划提供可靠的3D信息。
translated by 谷歌翻译
问答(QA)近年来受益于深度学习技术。然而,领域特定的QA仍然是训练神经网络所需的大量数据的挑战。本文通过选择圣经中的相关经文来研究圣经领域中的答案句选择任务和答案。为此,我们基于圣经琐事问题创建一个新的数据集BibleQA,并为我们的任务提出三个神经网络模型。我们在大型QAdataset,SQuAD上预训我们的模型,并研究传递权重对模式的影响。此外,我们还使用不同的上下文长度和不同的圣经翻译来测量模型的准确度。我们确认转移学习在模型准确性方面有显着提高。使用较短的上下文长度来获得相对较好的结果,而较长的上下文长度降低了模型精度。我们还发现在数据集中使用更现代的可翻译对任务有积极影响。
translated by 谷歌翻译
唇读是一种难以处理的手势分类任务。计算机唇读的一个问题是说话者独立。扬声器独立意味着在训练集内训练集分配器中未包含的测试扬声器上达到相同的准确度。目前的文献仅限于与扬声器无关的唇读,少数独立的测试扬声器准确度通常在依赖的测试扬声器精度内汇总,以获得平均性能。这导致不明确的独立结果。在这里,我们使用传统方法和深度学习方法对TCD-TIMIT数据集进行了系统的实验调查,以提供一系列独立于说话者的基准测试,并表明独立于bestspeaker的机器在CNN特征和SVM分类器中的准确率达到69.58%。这比依赖于说话者的唇线机更先进,但是比以前在独立实验中报道的要大。
translated by 谷歌翻译
数据密集型科学界正在逐步采用FAIR实践,以提高科学突破的可见性并实现重用。作为这一运动的核心,研究对象以符合FAIR原则的方式包含和描述科学信息和资源,并保持关键基础设施和工具的发展。本文介绍了在几个地球科学学科的研究对象中采用FAIR所涉及的挑战,经验和解决方案。在这段旅程中,我们的工作非常全面,其成果包括:适应地球科学家需求的扩展研究对象模型;提供数字对象标识符(DOI)以实现持久性识别并对作者给予应有的信任;通过自然语言处理生成基于内容的,语义丰富的研究对象元数据,通过推荐系统和第三方搜索引擎增强可见性和重用;以及各种类型的检查表,它们提供了研究对象质量的紧凑表示,作为科学重用的关键推动因素。所有这些结果都集成在ROHub中,这是一个为不同科学界的大量应用和界面提供研究对象管理功能的平台。为了监测社区对研究对象的吸收,我们已经定义了指示者并通过ROHub获得了测量,这些测量也在本文中讨论。
translated by 谷歌翻译