对于前列腺癌患者,Gleason评分是最重要的预后因素之一,可能决定独立于分期的治疗。然而,Gleason评分基于肿瘤形态的主观显微镜检查并且具有较差的再现性。在这里,我们提出了一个深度学习系统(DLS),用于Gleason评分前列腺切除术的全幻灯片图像。我们的系统是使用来自1,226张幻灯片的1.12亿个病理学家注释的图像片段开发的,并在331个幻灯片的独立验证数据集上进行评估,其中参考标准由泌尿生殖专家病理学家建立。在验证数据集中,29名一般病理学家的平均准确度为0.61。 DLS的诊断准确率显着提高0.70(p = 0.002),并且与临床随访数据的相关性趋向于更好的患者风险分层。我们的方法可以提高格里森评分的准确性和随后的治疗决策,特别是在专业知识不可用的情况下。 DLS还超越了当前的格里森系统,以更精细地表征和定量肿瘤形态,为格里森系统本身的细化提供了机会。
translated by 谷歌翻译
我们最近看到了几种公开可用的NaturalLanguage Understanding(NLU)工具包的出现,这些工具包将用户话语映射到结构化但更抽象的对话法(DA)或Intent规范,同时使这个过程对于非专业开发人员来说是可访问的。在本文中,我们提出了一些最广泛的覆盖率评估和一些最流行的NLU服务的比较,在25K用户话语的大型,多域(21域)数据集上,我们已经收集并注释了Intent和Entity Type规范,这将是作为此提交的一部分发布。结果表明,onIntent分类Watson明显优于其他平台,即Dialogflow,LUIS和Rasa;虽然这些也表现良好。有趣的是,在实体类型识别中,Watson的精确度低于其低精度。再次,Dialogflow,LUIS和Rasa在这个任务上表现良好。
translated by 谷歌翻译
由于其无处不在且普遍存在,Wi-Fi网络具有收集关于多模式传输的大规模,低成本和分解数据的潜力。在这项研究中,我们开发了一个半监督的深度残留网络(ResNet)框架,以利用从智能手机获得的Wi-Fi通信来进行运输模式检测。该框架是根据位于多伦多市中心拥挤的城市中的Wi-Fi传感器收集的数据进行评估的。为了解决与标记数据收集相关的内在困难和成本,我们通过实施框架的半监督部分来利用大量易于收集的低成本未标记数据。通过将ResNet架构作为框架的核心,我们利用传统机器学习框架中未考虑的高级功能。拟议的框架显示了对所收集数据的有希望的表现,预测准确率为81.8%,骑自行车为82.5%,驾驶模式为86.0%。
translated by 谷歌翻译
后验的表示是有效变分自动编码器(VAE)的关键方面。由于与真正的后部不匹配,对后部的不良选择对VAE的生成性能有很大的影响。我们扩展了可以通过使用无向图形模型获得的后验模型类。我们通过显示通过马尔可夫链蒙特卡罗更新的反向传播来计算关于无向后方参数的训练目标的梯度,开发了一种有效的方法来驱动无向后验。我们应用这些梯度估计器来训练具有Boltzmann机器外壳的离散VAE,并证明无向模型优于以前使用有向图形模型作为后验的结果。
translated by 谷歌翻译
尽管深度神经网络在各种学习问题中取得了巨大的成功,但已经观察到,在这些架构的输入中添加有意设计的对抗扰动会导致错误的分类,并且在预测中具有高置信度。在这项工作中,我们提出了一个基于学习算法的扰动分析的总体框架,该算法由凸规划组成,能够作为特殊情况恢复许多当前的对抗性攻击。该框架可用于针对各种新约束下的分类和回归任务的学习算法提出攻击,并在许多实例中使用封闭形式解决方案。特别地,我们得到针对分类算法的新攻击,其被证明可以实现与显着存在的攻击相当的性能。然后该框架用于生成回归任务的对抗性扰动,包括单个像素和单个子集攻击。通过将此方法应用于自动编码和图像着色任务,可以看出,对抗性扰动也可以有效地扰乱回归任务的输出。
translated by 谷歌翻译
在线,非政策强化学习算法能够使用经验记忆来记忆和重放过去的经历。在以前的工作中,这种方法被用来通过打破更新的时间相关性来避免可能罕见的经验的快速遗忘来稳定训练。在这项工作中,我们提出了一个概念上简单的框架,它使用经验记忆通过优先考虑起始状态来帮助探索。代理开始在环境中起作用,重要的是,它还与策略上的算法兼容。鉴于能够在与过去观察相对应的状态下重新启动代理人,我们通过以下方式实现了这一目标:(i)使代理人能够在属于过去经验的状态(例如,附近的目标)中重新开始,以及(ii)通过以下方式促进更快地覆盖状态空间从一组更多样化的国家开始。虽然使用一个很好的优先级来确定重要的过去转移,但我们期望案例(i)更有助于探索某些问题(例如,稀疏奖励任务),我们假设案例(ii)即使没有任何优先次序,通常也会有益。我们通过证明,我们的方法可以提高非政策性和政策性深层强化学习方法的学习成绩,并且在一项非常稀疏的奖励任务中最显着的改进。
translated by 谷歌翻译
使用用于语义分割的高质量对象掩码构建大图像数据集是昂贵且耗时的。在本文中,我们通过利用对象边界框形式的弱监督来降低数据分配成本。为了实现这一目标,我们提出了一个原理框架来训练深度卷积分割模型,该模型将大量弱监督图像(仅具有对象边界框标签)与一小组完全监督图像(具有语义分割标签和框标签)相结合。我们的框架通过辅助模型训练主要分割模型,辅助模型为弱监督实例生成初始分割标签,自我修正模块使用越来越精确的主模型在培训期间改善生成的标签。我们使用线性或卷积函数引入自校正模块的两个变量。 PASCAL VOC 2012和Cityscape数据集上的实验表明,使用小型全监督集训练的模型执行与使用大型全监督集训练的模型类似或更好,同时需要少7倍的注释工作量。
translated by 谷歌翻译
过滤是推断动态系统给定观察状态的通用名称。最常见的滤波方法是高斯滤波(GF),其中推断状态的分布是高斯分布,其平均值是观测值的仿射函数。这个模型有两个限制:高斯性和亲和性。我们提出了一个基于隐式生成模型的最新进展来放松这些假设的模型。实验结果表明,与基于固定非线性核的GF和非线性方法相比,该方法具有明显的优势。
translated by 谷歌翻译
Long Short-Term Memory (LSTM) is a special class of recurrent neural network, which has shown remarkable successes in processing sequential data. The typical architecture of an LSTM involves a set of states and gates: the states retain information over arbitrary time intervals and the gates regulate the flow of information. Due to the recursive nature of LSTMs, they are computationally intensive to deploy on edge devices with limited hardware resources. To reduce the computational complexity of LSTMs, we first introduce a method that learns to retain only the important information in the states by pruning redundant information. We then show that our method can prune over 90% of information in the states without incurring any accuracy degradation over a set of temporal tasks. This observation suggests that a large fraction of the recurrent computations are ineffectual and can be avoided to speed up the process during the inference as they involve noncontributory multiplications/accumulations with zero-valued states. Finally, we introduce a custom hardware accelerator that can perform the recurrent computations using both sparse and dense states. Experimental measurements show that performing the computations using the sparse states speeds up the process and improves energy efficiency by up to 5.2× when compared to implementation results of the accelerator performing the computations using dense states.
translated by 谷歌翻译
最近,已经应用了字嵌入算法,以使用它们之间的文本元素 - 上下文关系将诸如用户和项目的创建者系统的实体映射到新的特征空间。与许多其他域不同,这种方法在协作过滤问题中没有达到预期的性能,可能是由于没有适当的文本数据。在本文中,我们提出了一个新的推荐框架,称为GEMRank,当用户项矩阵是唯一可用的信息源时,它可以应用。它使用轮廓共现的概念来定义关系的相关性,并应用分解方法来嵌入用户然后,物品.GEMRank将提取的表示提供给神经网络模型topredict用户项目喜欢/不喜欢关系,最终推荐基于这些关系。我们在针对艺术推荐方法的一系列广泛的实验中评估了GEMRank。结果表明,GEMRank在具有不同密度的各种数据集中显着优于基线算法。
translated by 谷歌翻译