对于前列腺癌患者,Gleason评分是最重要的预后因素之一,可能决定独立于分期的治疗。然而,Gleason评分基于肿瘤形态的主观显微镜检查并且具有较差的再现性。在这里,我们提出了一个深度学习系统(DLS),用于Gleason评分前列腺切除术的全幻灯片图像。我们的系统是使用来自1,226张幻灯片的1.12亿个病理学家注释的图像片段开发的,并在331个幻灯片的独立验证数据集上进行评估,其中参考标准由泌尿生殖专家病理学家建立。在验证数据集中,29名一般病理学家的平均准确度为0.61。 DLS的诊断准确率显着提高0.70(p = 0.002),并且与临床随访数据的相关性趋向于更好的患者风险分层。我们的方法可以提高格里森评分的准确性和随后的治疗决策,特别是在专业知识不可用的情况下。 DLS还超越了当前的格里森系统,以更精细地表征和定量肿瘤形态,为格里森系统本身的细化提供了机会。
translated by 谷歌翻译
有许多关于从深度神经网络(DNN)中提取瓶颈(BN)特征的研究,这些特征训练用于区分说话者,密码短语和三音素状态以改善文本相关说话者验证(TD-SV)的性能。但是,取得了一定的成功。最近的一项研究[1]提出了一种时间对比学习(TCL)概念,用于探索脑信号分类的大脑状态的平稳性。语音信号具有类似的非平稳性,并且TCL还具有不需要标记数据的优点。因此,我们提出了一种基于TCL的特征提取方法。该方法将训练数据集中的每个语音容差均匀地划分为预定义数量的多帧分段。话语中的每个片段对应于一个类,并且跨语言共享类标签。然后训练DNN以区分各类中的所有语音帧以利用语音的时间结构。此外,我们提出了一种基于分段的无监督聚类算法,以便为这些分段分配类别标签。在RedDots挑战数据库上进行TD-SV实验。使用从TD-SV评估集中排除的语音数据离线密码短语来训练TCL-DNN,因此可以将所述特征视为与短语无关的。我们比较了所提出的TCL瓶颈(BN)特征与短时间倒谱特征和从DNN识别扬声器,密码短语,说话者+密码短语以及标签和边界由三种不同自动生成的单声道提取的BN特征的性能。语音识别(ASR)系统。实验结果表明,所提出的TCL-BN优于自适应特征和说话人+通行短语判别BN特征,其性能与ASR导出的BN特征相当。此外,....
translated by 谷歌翻译
Coresets are important tools to generate concise summaries of massive datasets for approximate analysis. A coreset is a small subset of points extracted from the original point set such that certain geometric properties are preserved with provable guarantees. This paper investigates the problem of maintaining a coreset to preserve the minimum enclosing ball (MEB) for a sliding window of points that are continuously updated in a data stream. Although the problem has been extensively studied in batch and append-only streaming settings, no efficient sliding-window solution is available yet. In this work, we first introduce an algorithm, called AOMEB, to build a coreset for MEB in an append-only stream. AOMEB improves the practical performance of the state-of-the-art algorithm while having the same approximation ratio. Furthermore, using AOMEB as a building block, we propose two novel algorithms, namely SWMEB and SWMEB+, to maintain coresets for MEB over the sliding window with constant approximation ratios. The proposed algorithms also support coresets for MEB in a reproducing kernel Hilbert space (RKHS). Finally, extensive experiments on real-world and synthetic datasets demonstrate that SWMEB and SWMEB+ achieve speedups of up to four orders of magnitude over the state-of-the-art batch algorithm while providing coresets for MEB with rather small errors compared to the optimal ones.
translated by 谷歌翻译
由于摆脱了手工制作表达的限制,有监督的深度学习技术在各个领域取得了巨大的成功。然而,大多数以前的图像重定向算法仍然采用固定的设计原则,如使用梯度图或手工制作的特征来计算地图,这不可避免地限制了它的通用性。深度学习技术可能有助于解决这个问题,但具有挑战性的问题是我们需要建立一个大规模的图像重定向数据集来训练深度重定向模型。但是,构建这样的数据集需要巨大的人性化。在本文中,我们提出了一种新的深度循环图像重定向方法,称为Cycle-IR,首先使用单个深度模型实现图像重定目标,而不依赖于任何明确的用户注释。我们的想法建立在从重定向图像到给定输入图像的反向映射之上。如果重定向图像具有严重失真或重要视觉信息的过度丢失,则反向映射不可能恢复输入图像。我们通过引入循环概念相干性损失来约束这种前向 - 反向一致性。此外,我们提出了一个简单而有效的图像重定位网络(IRNet)来实现图像重定向过程。 OurIRNet包含空间和通道关注层,能够有效地区分输入图像的视觉重要区域,特别是在杂乱的图像中。给定任意大小的输入图像和所需的纵横比,我们的Cycle-IR可以直接产生视觉上令人愉悦的目标图像。标准RetargetMe数据集上的广泛实验显示了我们的Cycle-IR的优越性。此外,我们的Cycle-IR优于Multiop方法,并在用户研究中获得最佳结果。代码可以通过以下网址获得://github.com/mintanwei/Cycle-IR。
translated by 谷歌翻译
Pre-training and fine-tuning, e.g., BERT (De-vlin et al., 2018), have achieved great success in language understanding by transferring knowledge from rich-resource pre-training task to the low/zero-resource downstream tasks. Inspired by the success of BERT, we propose MAsked Sequence to Sequence pre-training (MASS) for encoder-decoder based language generation. MASS adopts the encoder-decoder framework to reconstruct a sentence fragment given the remaining part of the sentence: its encoder takes a sentence with randomly masked fragment (sev-eral consecutive tokens) as input, and its decoder tries to predict this masked fragment. In this way, MASS can jointly train the encoder and decoder to develop the capability of representation extraction and language modeling. By further fine-tuning on a variety of zero/low-resource language generation tasks, including neural machine translation , text summarization and conversational response generation (3 tasks and totally 8 datasets), MASS achieves significant improvements over baselines without pre-training or with other pre-training methods. Specially, we achieve state-of-the-art accuracy (37.5 in terms of BLEU score) on the unsupervised English-French translation, even beating the early attention-based supervised model (Bahdanau et al., 2015b).
translated by 谷歌翻译
我们提出了基于互补搜索技术和新颖架构设计的下一代移动网络.MobileNetV3通过硬件网络架构搜索(NAS)与NetAdapt算法的补充,然后通过小说进行改进,调整到移动电话CPU建筑进步。本文探讨了自动搜索算法和网络设计如何协同工作,以利用互补的方法来改进艺术的总体状态。通过这个过程,我们创建了两个新的MobileNet模型:MobileNetV3-Large和MobileNetV3-Small,适用于高资源低用量用例。然后对这些模型进行调整并应用于对象检测和语义分割的任务。对于语义分割(或任何密集像素预测)的任务,我们提出了一种新的高效分割解码器Lite Reduced Atrous Spatial Pyramid Pooling(LR-ASPP)。 Weachieve移动分类,检测和分割的最新技术成果。与MobileNetV2相比,MobileNetV3-Large在ImageNet分类上的准确度提高了3.2%,同时将延迟降低了15%.MobileNetV2-Small的准确度提高了4.6%,同时与MobileNetV2相比,延迟降低了5%。 MobileNetV3-大检测速度提高了25%,与COCO检测时的MobileNetV2大致相同。 MobileNetV3-Large LR-ASPP比MobileNetV2 R-ASPP快30%,与Cityscapes细分的准确度相似。
translated by 谷歌翻译
乳腺癌是最常见的侵袭性癌症,女性癌症发生率最高。手持式超声是鉴别和诊断乳腺癌的最有效方法之一。病变的面积和形状信息对临床医生做出诊断决定非常有帮助。在这项研究中,我们提出了一种新的深度学习方案,半像素循环生成对侧网(SPCGAN),用于在2D超声中分割病变。该方法利用完全连接的卷积神经网络(FCN)和生成性对抗网络的优点,通过使用先验知识来对病变进行分割。我们将所提出的方法与完全连接的神经网络和水平集分割方法进行比较,测试数据集包括32个恶性病变和109个良性病变。我们提出的方法实现了0.92的Dice相似系数(DSC),而FCN和水平集分别达到0.90和0.79。特别是对于恶性病变,我们的方法将完全连接的神经网络的DSC(0.90)显着增加到0.93(p $ <0.001)。结果表明我们的SPCGAN可以获得稳健的分割结果,并可能用于减轻放射科医生的负担用于注释。
translated by 谷歌翻译
由于缺乏关于主要社会,环境和经济指标的数据缺乏,特别是在发展中国家,联合国可持续发展目标(SDG)的进展受到阻碍。例如,由于调查成本高,贫困数据 - 十七个可持续发展目标中的第一个 - 在撒哈拉以南非洲空间稀疏且不经常收集。在这里,我们提出了一种使用来自维基百科文章的开源,地理定位文本信息来估计社会经济指标的新方法。我们证明现代NLP技术可用于使用附近的地理定位维基百科文章来预测社区 - levelasset财富和教育成果。当与夜间卫星图像配对时,我们的方法优于所有先前发布的预测任务的基准,表明维基百科的潜力可以为两个研究提供信息。社会科学和未来的政策决定。
translated by 谷歌翻译
公平性已成为我们研究界的核心问题,因为分类算法被用于社会关键领域,如累进预测和贷款审批。在这项工作中,我们考虑基于受保护属性(例如,种族和性别)的潜在偏差,并通过学习在受保护组之间在统计上无法区分的个体的潜在表示来解决该问题,同时充分保留用于分类的其他信息。为此,我们开发了一个带有生成器的aminimax对抗框架,用于捕获数据分布并生成潜在的表示,以及一个批评者,以确保跨不同受保护组的分布是相似的。我们的框架为统计平等和个人公平提供了理论保证。四个真实数据集的实证结果还表明,学习表示可以有效地用于分类任务,如信用风险预测,同时阻碍信息相关的保护组,特别是当删除受保护的属性不足以进行公平分类。
translated by 谷歌翻译
在传统的域适应中,关键的假设是存在完全标记的域(源),其包含与另一个未标记或几乎不标记的域(靶)相同的标记空间。但是,在现实世界中,经常存在这样的应用场景,其中两个域都被部分标记,并且并非所有类都在这两个域之间共享。因此,让部分标记的域彼此学习以在开放设置下对每个域中的未标记样本进行分类是有意义的。我们认为这个问题是弱监督的开放式域适应。为了解决这一实际问题,我们提出了协同分配协调(CDA)方法,该方法双边执行知识转移,并协同工作以对未标记数据进行分类并识别异常值样本。 Office基准测试和人员重新识别应用的广泛实验表明,我们的方法可以实现最先进的性能。
translated by 谷歌翻译