目的:将深度卷积神经网络(CNN)应用于心肌动脉旋转标记(ASL)灌注成像中的左心室分割任务。开发基于特定假阳性与假阴性权衡的测量不确定性和适应性分类的方法。方法:我们使用改进的UNET架构和Monte Carlo(MC)压降。该模型对来自22名受试者的数据进行训练,并对来自6名心脏移植受者的数据进行测试。手动分割和定量心血流量(MBF)图可用于比较。我们考虑两个分割不确定性的全局核心,“骰子不确定性”和“MC不确定性”,它们分别使用和不使用手动分割计算。使用超参数$ \ beta $的Tversky损失函数来使模型适应特定的假阳性与假阴性权衡。结果:改进的UNET模型在测试集上实现了均值(std)= 0.91(0.04)$的Dice系数。使用自动分割测量的MBF与使用手动分割测量的自动分割相关($ R ^ 2 = 0.96 $)。骰子不确定性和MC不确定性非常一致($ R ^ 2 = 0.64 $)。随着$ \ beta $的增加,误报率系统性下降,假负率率系统性上升。结论:我们证明了使用CNN在心肌ASL数据中自动分离左心室的可行性。由于低血压和不一致的血液 - 心肌对比噪声比,这是特别具有挑战性的应用。我们还展示了衡量不确定性并适应假阳性率和假阴性率之间所需权衡的新方法。
translated by 谷歌翻译
在本文中,我们提出了“IVO:逆速度障碍”,这是一种以自我为中心的框架,可以改善实时实施。该方法源于速度障碍的概念,可以应用于单一代理和多代理系统。它专注于计算无碰撞机动而无需对机器人的姿势和速度有任何知识或假设。这主要是通过重新构造速度障碍以适应以自我为中心的框架来实现的。这是朝着改进动态环境中的碰撞避免的实时实现迈出的重要一步,因为不依赖于状态估计技术来推断机器人姿态和速度。我们在不同情景中评估单剂和多剂的IVO,并显示其相对于现有配方的功效。我们还展示了所提方法的实时可扩展性。
translated by 谷歌翻译
诸如Visual Genome之类的视觉知识库为众多应用提供了计算机视觉,包括视觉问答和字幕,但却遭受稀疏,不完整的关系。迄今为止,所有场景图模型都限制在一小组视觉关系上进行训练,每个视觉关系都有数千个训练标签。雇用人类注释器是昂贵的,并且使用文本知识库完成方法与视觉数据不兼容。在本文中,我们引入了一种半监督方法,该方法使用少量标签样本将概率关系标签分配给大量未标记图像。我们分析视觉关系以建议两种类型的图像不可知特征,这些特征用于生成噪声启发式,其输出使用基于因子图的生成模型进行聚合。通过少数10个标记关系示例,生成模型创建了足够的训练数据来训练任何现有的最先进的场景图模型。我们证明我们生成训练数据的方法优于5.16召回@ 100的所有基线方法。由于我们只使用了一些标签,因此我们定义了一个关系的复杂度指标,作为指标(R ^ 2 = 0.778),用于我们的方法成功优于转移学习的条件,即用有限标签进行培训的事实上的方法。
translated by 谷歌翻译
生成模型通常使用人工评估来确定和证明。不幸的是,现有的人类评估方法是临时的:目前还没有标准化,经过验证的评估:(1)测量感知保真度,(2)可靠,(3)将模型分成清晰的排序,(4)确保高质量测量没有难以处理的成本。作为回应,我们构建人类 - 感知评估(HYPE),这是一种人类度量,它是(1)基于感知的心理物理学研究,(2)在模型的随机抽样输出的不同集合中可靠,(3)导致可分离的模型性能, (4)有效的成本和时间。我们介绍两种方法。首先,HYPE-Time测量在自适应时间约束下的视觉感知,以确定模型输出(例如年龄表面)需要可见的最小时间长度(例如,250ms),以便人们将其区分为真实或真实。第二个是HYPE-Infinity,它可以测量伪造和真实图像的人为错误率,没有时间限制,保持稳定性并大幅缩短时间和成本。我们使用两个数据集,即流行的CelebA和更新的更高分辨率的FFHQ,以及两种模型输出的采样技术,在无条件图像生成上测试HYPE的四个最先进的生成对抗网络(GAN)。通过多次模拟HYPE的评估,我们展示了不同模型的一致排名,识别StyleGAN与截断特征采样(27.6%HYPE-Infinity欺骗率,大约四分之一的图像被人类错误分类)优于StyleGAN而没有FFHQ上的截断(19.0%)。有关详细信息,请参阅https://hype.stanford.edu。
translated by 谷歌翻译
包括成像(MRI,fMRI,PET等)和非成像(临床测试,人口统计学等)数据的多模态数据可以一起收集并用于疾病预测。这些不同的数据提供了有关患者病情的补充信息,以便做出明智的诊断。为了更好的疾病预测,需要能够平衡每个多模态数据的个性的模型。我们提出了一种基于图卷积的深度模型,该模型考虑了多模态数据的每个元素的独特性。我们构建了一个新颖的自我关注层,通过探索其与潜在疾病的关系来衡量人口统计数据的每个元素。与最先进的方法相比,我们在计算速度和性能方面表现出我们开发技术的优越性。我们的方法优于其他方法,具有显着的优势。
translated by 谷歌翻译
*These authors contributed equally to this work. The brightfield microscope is instrumental in the visual examination of both biological and physical samples at sub-millimeter scales. One key clinical application has been in cancer histopathology, where the microscopic assessment of the tissue samples is used for the diagnosis and staging of cancer and thus guides clinical therapy​ ​ 1​. However, the interpretation of these samples is inherently subjective, resulting in significant diagnostic variability​ ​ 2,3​. Moreover, in many regions of the world, access to pathologists is severely limited due to lack of trained personnel​ ​ 4​. In this regard, Artificial Intelligence (AI) based tools promise to improve the access and quality of healthcare​ ​ 5-7​. However, despite significant advances in AI research, integration of these tools into real-world cancer diagnosis workflows remains challenging because of the costs of image digitization and difficulties in deploying AI solutions​ ​ 8​ ,​ 9​. Here we propose a cost-effective solution to the integration of AI: the Augmented Reality Microscope (ARM). The ARM overlays AI-based information onto the current view of the sample through the optical pathway in real-time, enabling seamless integration of AI into the regular microscopy workflow. We demonstrate the utility of ARM in the detection of lymph node metastases in breast cancer and the identification of prostate cancer with a latency that supports real-time workflows. We anticipate that ARM will remove barriers towards the use of AI in microscopic analysis and thus improve the accuracy and efficiency of cancer diagnosis. This approach is applicable to other microscopy tasks and AI algorithms in the life sciences​ ​ 10​ and beyond​ ​ 11,12​. Microscopic examination of samples is the gold standard for the diagnosis of cancer, autoimmune diseases, infectious diseases, and more. In cancer, the microscopic examination of stained tissue sections is critical for diagnosing and staging the patient's tumor, which informs treatment decisions and prognosis. In cancer, microscopy analysis faces three major challenges. As a form of image interpretation, these examinations are inherently subjective, exhibiting considerable inter-observer and intra-observer variability​ 2,3​. Moreover, clinical guidelines​ 1​ and studies​ 13​ have begun to require quantitative assessments as part of the effort towards better patient risk stratification​ 1​. For example, breast cancer staging requires counting mitotic cells and quantification of the tumor burden in lymph nodes by measuring the largest tumor focus. However, despite being helpful in treatment planning, quantification is laborious and error-prone. Lastly, access to disease experts can be limited in both developed and developing countries​ 4​ , exacerbating the problem. As a potential solution, recent advances in AI, specifically deep learning​ 14​ , have demonstrated automated medical image analysis with performance c
translated by 谷歌翻译
多智能体学习为学习和模拟交通行为提供了潜在的框架。本文提出了一种新的架构来学习交通场景中的多种驾驶行为。所提出的架构可以独立地同时学习多个行为。我们利用代理的同质性,并在参数共享范例中学习。为了进一步加快培训过程,将异步更新部署到体系结构中。在同时学习不同行为的同时,给定的框架也能够学习代理之间的合作,而无需任何明确的沟通。我们应用这个框架在驾驶中容忍了两个重要的行为:1)车道保持和2)过度采取。结果表明更快的收敛和学习更通用的行为,可以扩展到任何数量的代理。当比较结果的方法时,我们的结果表明在一些案例中表现相同甚至更好。
translated by 谷歌翻译
尽管在诸如图像分类之类的感知任务方面取得了进步,但计算机在诸如图像描述和问答交换之类的认知任务上仍然表现不佳。认知是任务的核心,不仅涉及识别,而且涉及我们的视觉世界。然而,用于处理认知任务图像中的丰富内容的模型仍在使用为感知任务设计的相同数据集进行训练。为了在认知任务中取得成功,模型需要理解图像中对象之间的交互和关系。当被问及“乘坐什么车辆?”时,计算机将需要识别图像中的物体以及骑车(人,马车)和拉动(马,马车)之间的关系,以便正确回答“人员正在骑车”马车”。在本文中,我们提出了Visual Genome数据集,以便对这种关系进行建模。我们收集每个图像中对象,属性和关系的密集注释,以学习这些模型。具体来说,我们的数据集包含超过100K的图像,其中每个图像平均有21个对象,18个属性和18个对象之间的成对关系。我们将区域描述中的对象,属性,关系和名词短语与WordNet同义词的答案对进行了解。这些注释一起代表了图像描述,对象,属性,关系和问题答案的最密集和最大的数据集。
translated by 谷歌翻译
在本文中,我们提出了TauRieL和目标旅行商问题(TSP),因为它在理论和应用科学中具有广泛的适用性。 TauRieLutilizes一个由演员评论家启发的架构,它采用普通的feedforwardnets来获取策略更新向量$ v $。然后,我们使用$ v $来改进生成策略的状态转换矩阵。此外,状态转换矩阵允许求解器从预先计算的解决方案(例如最近邻居)初始化。在在线学习环境中,TauRieL统一了训练和搜索,它可以在几秒钟内产生近乎最佳的结果。在演员评论体系结构中对神经网络的输入是原始的2-Dinputs,这个决定背后的设计理念是保持神经网络比具有宽嵌入的体系结构小,其中省略了嵌入的任何分布式表示。因此,与最先进的离线技术相比,TauRieL生成的TSP解决方案比TSP实例快两个数量级。 6.1 \%在最坏的情况下。
translated by 谷歌翻译
我们考虑使用仅通过去噪函数指定的先前噪声测量来估计矢量的问题。最近关于插头和游戏先验(PnP)和正则化去噪(RED)的研究表明,在一系列成像任务中,这些先验的评估者具有最先进的性能。在这项工作中,我们开发了一种新的块坐标RED算法,它将大规模估计问题分解为一系列未知变量的一小部分更新。我们从理论上分析了算法的收敛性,并讨论了它与传统近似优化的关系。我们的分析补充并扩展了基于RED的估算方法的最新理论结果。我们使用几个基于卷积神经网络(CNN)降噪器的降噪器先验来数值验证我们的方法。
translated by 谷歌翻译