与以前的工作不同,这种开放式数据采集包括专为机器学习应用和高锥角人工制品减少而设计的X射线锥束(CB)计算机断层扫描(CT)数据集。用实验室X射线设置扫描42个核桃,不仅提供来自单个物体的数据,而且提供具有自然变化的一类物体的数据。对于每个核桃,获得了三个不同源轨道上的CB投影,提供了具有不同锥角的CB数据,并且能够从可以用于监督学习的组合数据中计算无物质,高质量的地面实况图像。我们提供完整的图像重建管道:原始投影数据,扫描几何描述,使用开放软件的预处理和重建脚本,以及构建的体积。因此,数据集不仅可以用于高角度伪影减少,还可以用于其他任务的算法开发和评估,例如从有限或稀疏角度(低剂量)扫描,超分辨率或分割的图像重建。
translated by 谷歌翻译
在构建从多个注释器生成的嘈杂标签中学习的模型时,准确估计注释器的可靠性非常重要。由于其在域中的不断专业知识和可靠性,注释器可能提供质量不一致的标签。以前的研究主要集中在估计每个注释器在整个注释任务上的整体可靠性。但是,实际上,注释器的可靠性可能取决于每个特定实例。只有有限数量的研究调查了每个实例的可靠性建模,这些只考虑了二元标签。在本文中,我们提出了一种无监督的模型,它可以处理二进制和多类标签。它可以自动估计每个注释器的实例可靠性以及每个实例的正确标签。我们将模型指定为概率模型,其中结合了神经网络来模拟潜在变量和实例之间的依赖关系。对于评估,所提出的方法适用于合成和实际数据,包括两个标记任务:文本分类和文本蕴涵。实验结果证明我们的新方法不仅可以准确地估计不同实例中注释器的可靠性,而且与最先进的基线相比,在预测正确的标签和检测最不可靠的注释器方面也具有卓越的性能。
translated by 谷歌翻译
电子医疗记录包含大量非结构化数据的不同形式。自由文本构成了这些数据的很大一部分,但由于缺乏适当的方法来及时提取可解释的内容,这种丰富详细信息的来源在实践中往往仍未得到充分利用。在这里,我们将网络理论工具应用于英国国家卫生服务中医院病人事件报告中的分析文本,以无监督的方式和不同级别的分辨率直接找到报告的集群,直接基于其中包含的自由文本描述。为此,我们将最近开发的基于段落向量的深度神经网络文本嵌入方法与多尺度MarkovStability社区检测相结合,应用于从稀疏文本向量相似性获得的文档的相似性图。我们通过分析在伦敦帝国理工学院医疗保健信托基金会提交的事故报告来展示这种方法。多尺度社区结构揭示了数据集主题中不同分辨率的含义水平,如从记录组中提取的相关描述性术语所示,以及通过将后验与医疗保健人员分配的手工编码类别进行比较。我们的内容社区表现良好与明确定义的手工编码类别相对应,但我们的结果还提供了某些领域的进一步医学细节,以及揭示超出外部分类的事件的补充描述。我们还讨论了该方法如何用于监控不同医疗服务提供者的报告,以及检测不属于已有类别的新兴趋势。
translated by 谷歌翻译
开发高性能机器学习模型的关键因素是足够大的数据集的可用性。这项工作的动机是软件即服务(SaaS)公司中出现的应用程序,其中存在来自多个客户公司的众多类似但不相交的数据集。由于隐私问题,在没有明确聚合客户数据集的情况下克服数据不足的挑战,一种解决方案是为每个客户收集更多数据,另一种解决方案是私下聚合来自每个客户数据培训模型的信息。在这项工作中,提出了两种私有模型聚合方法,可以将在其他公司数据集上训练的模型转移到具有有限标记数据的新公司,同时保护每个客户公司的基础个人敏感信息。提出的两种方法基于最先进的私有学习算法:基于差分私有化的基于随机梯度下降和近似极小扰动。我们凭经验表明,通过利用差异私有技术,我们可以启用私有模型聚合和增强数据实用性,同时为隐私提供可证明的数学保证。因此,所提出的方法为SaaS公司及其客户提供了重要的商业价值,特别是作为冷启动问题的解决方案。
translated by 谷歌翻译
我们提出了一个自我监督的框架,通过简单地观看人脸讲话,笑和移动加班的视频来学习面部属性。为了执行这项任务,我们引入了一个网络,Facial Attributes-Net(FAb-Net),它被训练为将来自同一视频轨道的多个帧嵌入到一个共同的低维空间中。通过这种方法,我们可以做出贡献:首先,我们表明网络可以通过预测每个帧的置信/关注掩码来利用来自多个源帧的信息;第二,我们证明了使用课程学习机制改进了学习嵌入;最后,我们证明网络学习了有意义的面部嵌入,该面部嵌入编码关于头部姿势,面部标记和面部表情的信息,即面部属性,而没有用任何标记数据进行监督。我们在这些任务上具有可比性或优越性的自我监督方法,并且接近监督方法的表现。
translated by 谷歌翻译
新闻和新闻内容在全球范围内产生的数量激增,加上通过在线媒体对信息的扩展和即时访问,使得实时监控新闻发展和意见形成变得困难和耗时。越来越需要能够对原始文本进行预处理,分析和分类以提取可解释内容的工具;具体而言,识别文章的主题和内容驱动组合。我们在这里提出了这样一种方法,它将自然语言处理中强大的矢量嵌入与图形理论的工具结合在一起,这些工具利用图形上的扩散动力学来揭示跨尺度的自然分区。我们的框架使用最近的深度神经网络文本分析方法(Doc2vec)来表示矢量形式的文本,然后应用多尺度社区检测方法(马尔可夫稳定性)来分割文档向量的相似性图。该方法允许我们以无监督的方式在不同的分辨率水平上获得具有相似内容的文档集群。我们通过分析Vox Media发布的9,000篇新闻文章的语料库来展示我们的方法。我们的结果显示了根据内容对文档的一致分组,而没有关于要找到的聚类的数量或类型的先验假设。多级聚类揭示了主题和子主题的准层次结构,与外部分类法服务和标准主题相比,具有更高的可懂度和改进的主题一致性。检测方法。
translated by 谷歌翻译
本文的目的是使用另一个面部或模态(例如音频)控制给定面部的姿势和表达的神经网络模型。然后,该模型可用于轻量级,复杂的视频和图像编辑。我们做出以下三点贡献。首先,我们介绍一个网络X2Face,它可以使用驱动帧中的另一个面来控制源面(由一个或多个帧指定),以生成具有源帧的身份但是面部的姿势和表达的生成帧。 drivingframe。其次,我们提出了一种使用大量视频数据来全面监督网络的方法。第三,我们表明,生成过程可以由其他模态驱动,例如音频或姿势码,而无需对网络进行任何进一步的培训。用另一个面部驱动面部的生成结果与现有技术的自我监督/监督方法进行比较。我们证明了我们的方法比其他方法更强大,因为它对输入数据的假设更少。我们还展示了使用我们的视频面向框架的示例。
translated by 谷歌翻译
长期以来,人们已经认识到层次结构化表示对易处理规划的重要性。然而,人们如何发现这种抽象以及如何定义一组最优抽象的问题仍未解决。在分层加强学习中解决文学和计算机科学问题的认知科学中已经探讨了这个问题。在这里,我们强调关于学习分层表示的算法视角,其中目标是有效地编码问题的结构,或者等效地,学习具有最小长度的算法。我们引入了一种新的问题解决范式,即在马尔可夫决策过程(MDP)框架下连接问题解决和程序归纳。使用这项任务,我们的目标是人类是否通过最大化他们产生的行动的效率来发现分层解决方案的问题,或者通过最小化所得表示的复杂性和找到代表效率的首要证据。
translated by 谷歌翻译
近年来,定位技术和支持GPS的设备的巨大增长产生了大量的跟踪数据。该信息源构成了数据分析过程的丰富输入,无论是离线(例如,聚类分析,热运动发现)还是在线(例如,即将到来的位置的短期预测)。本文重点关注移动物体的预测分析(可能是行人,汽车,船只,飞机,动物等),并在背景下的位置和轨迹预测中调查最先进的技术。我们对50多件作品进行了广泛的回顾,并提出了一种新的对象的预测算法分类。我们还列出了过去用于验证这些工作的几个真实数据集的属性,并且由此推动了从传统应用到大数据应用的过渡中出现的各种挑战。 CCS概念:信息系统>时空系统;信息系统>数据分析;信息系统>数据挖掘;计算方法>机器学习附加关键词和短语:移动数据,移动物体轨迹,轨迹预测,未来位置预测。
translated by 谷歌翻译
电子医疗记录包含大量非结构化数据,包括大量自由文本。然而,由于缺乏及时提取可解释内容的方法,这种详细信息来源往往未得到充分利用。在这里,我们将网络理论工具应用于来自National HealthService的Hospital Patient Incident报告中的无分析文本,以无人监督的方式在不同的分辨率级别找到具有相似内容的文档集群。我们将深度神经网络图矢量文本嵌入与多尺度马尔可夫稳定性社区检测相结合应用于文档向量的稀疏相似图,并展示伦敦帝国理工学院医疗NHSTrust事件报告的方法。多尺度社区结构揭示了数据集主题中的不同级别的意义,如从记录簇中提取的描述性术语所示。我们还将后验与医疗人员分配的手工编码类别进行比较,并表明我们的方法优于基于LDA的模型。我们的内容集群与两个级别的手工编码类别表现出良好的对应关系,但它们还在某些领域提供了进一步的医学细节,并揭示了除外部分类分类之外的事件的补充描述。
translated by 谷歌翻译