对于前列腺癌患者,Gleason评分是最重要的预后因素之一,可能决定独立于分期的治疗。然而,Gleason评分基于肿瘤形态的主观显微镜检查并且具有较差的再现性。在这里,我们提出了一个深度学习系统(DLS),用于Gleason评分前列腺切除术的全幻灯片图像。我们的系统是使用来自1,226张幻灯片的1.12亿个病理学家注释的图像片段开发的,并在331个幻灯片的独立验证数据集上进行评估,其中参考标准由泌尿生殖专家病理学家建立。在验证数据集中,29名一般病理学家的平均准确度为0.61。 DLS的诊断准确率显着提高0.70(p = 0.002),并且与临床随访数据的相关性趋向于更好的患者风险分层。我们的方法可以提高格里森评分的准确性和随后的治疗决策,特别是在专业知识不可用的情况下。 DLS还超越了当前的格里森系统,以更精细地表征和定量肿瘤形态,为格里森系统本身的细化提供了机会。
translated by 谷歌翻译
我们考虑高维数据点y的最大似然分类问题到数十亿个类$ x_1,...,x_N $,其中条件概率p(y | x)是已知的。在最一般的情况下,这种分类的蛮力方法的复杂性随着类别N的数量呈线性增长,O(N)。引入了有效的多类分类方法来解决这个具有对数复杂度的问题。然而,这些方法受到影响。从维度的诅咒,即在大尺寸中,它们的复杂性接近每个查询数据点$ O(N)$。在条件概率分布$ p(y | x)$是以x为中心的高斯的特殊情况下,即$ p(y | x)\ propto N(x,\ sigma)$,最大似然分类减少到最近邻居用欧几里德规范搜索。已经引入了基于局部敏感散列(LSH)的次线性方法来求解高维数据的近似邻域的近似版本。受这些进步的启发,我们在这里引入了分布敏感散列(DSH)来通过联合维数减少来求解最大似然分类问题的近似版本。在离散概率分布的情况下,我们设计了TriSH,这是一个基于决策树的通用分布敏感哈希族,并表明它们的复杂性呈亚线性增长。本文提出的理论和模拟表明,TreeDSH比LSH-hamming和Min-Hashing方案更有效。最后,我们将TreeDSH应用于质谱数据中肽识别的问题。
translated by 谷歌翻译
贝叶斯网络是一类流行的图形模型,通过有向无环图(DAG)编码变量之间的条件独立关系。我们提出了一种新颖的结构学习方法,退火的Cholesky评分(ARCS),搜索拓扑排序,或节点的计数,以获得高分贝叶斯网络。我们的评分函数来自正则化高斯DAG可能性,并且其优化从统计角度给出了稀疏Cholesky因子化问题的替代公式,其具有独立的兴趣。我们将全局模拟退火与置换相结合,使用快速近似梯度算法,对边缘系数的三角矩阵进行操作,以计算任何置换的得分。结合使用这两种方法,我们可以快速有效地搜索DAG的空间,而无需验证非接触性约束或在给定候选拓扑排序的情况下枚举可能的父集。优化的退火方面能够始终如一地提高局部搜索算法所学习的DAG的准确性。此外,我们开发了几种技术促进结构学习,包括预退火数据驱动的调整参数选择和基于后退火约束的结构细化。通过广泛的数值比较,我们表明ARCS实现了对现有方法的实质性改进,展示了其巨大的潜力从观察和实验数据中学习贝叶斯网络。
translated by 谷歌翻译
行人的道路交叉行为是受自动驾驶汽车引入影响的urbandynamics的重要方面之一。在这项研究中,我们介绍了DeepSurvival,这是一个新的框架,用于估算混合交通条件下无信号中段人行横道的行人等待时间。我们利用深度学习的优势捕获数据中的非线性,并利用陡峭的神经网络作为对数风险函数开发cox比例风险模型。还开发了用于减少数据维度和增强网络可解释性的嵌入式特征选择算法。我们使用沉浸式虚拟现实环境对从160名参与者收集的数据集测试我们的框架。验证结果显示,在C指数为0.64的情况下,我们提出的框架优于基于标准的cox比例风险模型,C指数为0.58。
translated by 谷歌翻译
我们最近看到了几种公开可用的NaturalLanguage Understanding(NLU)工具包的出现,这些工具包将用户话语映射到结构化但更抽象的对话法(DA)或Intent规范,同时使这个过程对于非专业开发人员来说是可访问的。在本文中,我们提出了一些最广泛的覆盖率评估和一些最流行的NLU服务的比较,在25K用户话语的大型,多域(21域)数据集上,我们已经收集并注释了Intent和Entity Type规范,这将是作为此提交的一部分发布。结果表明,onIntent分类Watson明显优于其他平台,即Dialogflow,LUIS和Rasa;虽然这些也表现良好。有趣的是,在实体类型识别中,Watson的精确度低于其低精度。再次,Dialogflow,LUIS和Rasa在这个任务上表现良好。
translated by 谷歌翻译
由于其无处不在且普遍存在,Wi-Fi网络具有收集关于多模式传输的大规模,低成本和分解数据的潜力。在这项研究中,我们开发了一个半监督的深度残留网络(ResNet)框架,以利用从智能手机获得的Wi-Fi通信来进行运输模式检测。该框架是根据位于多伦多市中心拥挤的城市中的Wi-Fi传感器收集的数据进行评估的。为了解决与标记数据收集相关的内在困难和成本,我们通过实施框架的半监督部分来利用大量易于收集的低成本未标记数据。通过将ResNet架构作为框架的核心,我们利用传统机器学习框架中未考虑的高级功能。拟议的框架显示了对所收集数据的有希望的表现,预测准确率为81.8%,骑自行车为82.5%,驾驶模式为86.0%。
translated by 谷歌翻译
后验的表示是有效变分自动编码器(VAE)的关键方面。由于与真正的后部不匹配,对后部的不良选择对VAE的生成性能有很大的影响。我们扩展了可以通过使用无向图形模型获得的后验模型类。我们通过显示通过马尔可夫链蒙特卡罗更新的反向传播来计算关于无向后方参数的训练目标的梯度,开发了一种有效的方法来驱动无向后验。我们应用这些梯度估计器来训练具有Boltzmann机器外壳的离散VAE,并证明无向模型优于以前使用有向图形模型作为后验的结果。
translated by 谷歌翻译
尽管深度神经网络在各种学习问题中取得了巨大的成功,但已经观察到,在这些架构的输入中添加有意设计的对抗扰动会导致错误的分类,并且在预测中具有高置信度。在这项工作中,我们提出了一个基于学习算法的扰动分析的总体框架,该算法由凸规划组成,能够作为特殊情况恢复许多当前的对抗性攻击。该框架可用于针对各种新约束下的分类和回归任务的学习算法提出攻击,并在许多实例中使用封闭形式解决方案。特别地,我们得到针对分类算法的新攻击,其被证明可以实现与显着存在的攻击相当的性能。然后该框架用于生成回归任务的对抗性扰动,包括单个像素和单个子集攻击。通过将此方法应用于自动编码和图像着色任务,可以看出,对抗性扰动也可以有效地扰乱回归任务的输出。
translated by 谷歌翻译
在线,非政策强化学习算法能够使用经验记忆来记忆和重放过去的经历。在以前的工作中,这种方法被用来通过打破更新的时间相关性来避免可能罕见的经验的快速遗忘来稳定训练。在这项工作中,我们提出了一个概念上简单的框架,它使用经验记忆通过优先考虑起始状态来帮助探索。代理开始在环境中起作用,重要的是,它还与策略上的算法兼容。鉴于能够在与过去观察相对应的状态下重新启动代理人,我们通过以下方式实现了这一目标:(i)使代理人能够在属于过去经验的状态(例如,附近的目标)中重新开始,以及(ii)通过以下方式促进更快地覆盖状态空间从一组更多样化的国家开始。虽然使用一个很好的优先级来确定重要的过去转移,但我们期望案例(i)更有助于探索某些问题(例如,稀疏奖励任务),我们假设案例(ii)即使没有任何优先次序,通常也会有益。我们通过证明,我们的方法可以提高非政策性和政策性深层强化学习方法的学习成绩,并且在一项非常稀疏的奖励任务中最显着的改进。
translated by 谷歌翻译
使用用于语义分割的高质量对象掩码构建大图像数据集是昂贵且耗时的。在本文中,我们通过利用对象边界框形式的弱监督来降低数据分配成本。为了实现这一目标,我们提出了一个原理框架来训练深度卷积分割模型,该模型将大量弱监督图像(仅具有对象边界框标签)与一小组完全监督图像(具有语义分割标签和框标签)相结合。我们的框架通过辅助模型训练主要分割模型,辅助模型为弱监督实例生成初始分割标签,自我修正模块使用越来越精确的主模型在培训期间改善生成的标签。我们使用线性或卷积函数引入自校正模块的两个变量。 PASCAL VOC 2012和Cityscape数据集上的实验表明,使用小型全监督集训练的模型执行与使用大型全监督集训练的模型类似或更好,同时需要少7倍的注释工作量。
translated by 谷歌翻译