通常采用面内像素间距来获取三维(3D)生物医学图像集,所述面内像素间距远小于图像之间的面外间距。可以使用图像插值来减少在许多应用中可能有害的合成各向异性。已经证明光流和/或其他基于注册的内插器在过去的这种插值中起作用。当获取的图像由描述流体流速的信号组成时,可以使用附加信息来指导插值过程。在本文中,我们提出了一种基于光流的图像插值框架,它还可以最小化插值数据中的合成发散。
translated by 谷歌翻译
我们提出了一种新的无监督域适应(DA)方法用于跨域视觉识别。虽然子空间方法在DA中取得了成功,但由于假设使用单个低维子空间逼近整个数据集,因此它们的性能通常是有限的。相反,我们开发了一种方法,通过收集低维子空间来有效地表示源数据集和目标数据集,然后通过在Grassmannmanifold上开发子空间空间的自然几何来对齐它们。我们使用两个广泛使用的基准测试的经验研究证明了这种方法的有效性,具有最先进的领域适应性能
translated by 谷歌翻译
在资源受限的环境中,可以使用空间复用摄像机来获取场景的少量测量,以及使用纯数据驱动的神经网络进行的性能重建或高级推断。但是,一旦经过训练,测量矩阵和网络仅对训练时选择的单个测量速率(MR)有效。为了克服这个缺点,我们回答了以下问题:我们如何联合设计测量操作员和重建/推理网络,以便系统可以在MR的\ textit {范围}上操作?为此,我们提出了一种新颖的训练算法,用于学习\ textbf {\ textit {rate-adaptive}网络。使用标准数据集,我们证明,当在一系列MR上进行测试时,速率自适应网络可以在整个范围内提供高质量的重建,从而导致比以前的方法提高了大约15 dB,其中网络仅对一个MR有效。我们证明了我们的方法有效对象跟踪的有效性,其中视频帧是在动态变化的MR中获得的。我们还扩展了该算法,以学习与图像识别网络连接的测量算子。在MNIST和CIFAR-10上的实验证实了我们的算法在不同任务中的适用性。
translated by 谷歌翻译
用于数据分析的拓扑方法为强制确定计算机视觉中广泛兴趣的某些不变性提供了机会,包括视点参数活动分析,形状分析中的清晰度以及非线性动态建模中的测量不变性。这些方法越来越成功的原因在于拓扑提供的补充信息,以及用于计算拓扑图等拓扑摘要的工具的可用性。但是,持久性图是多组点,因此将它们与用于当前机器学习工具(如深网)的功能融合起来并不简单。在本文中,我们提出了理论上有充分根据的方法来开发新的扰动鲁棒拓扑表示,其长期观点是使它们与当代学习架构相容。我们将提出的表示称为扰动拓扑签名,它存在于Grassmann流形上,因此可以有效地用于机器学习管道。我们在三种应用中探索了所提出的描述符的使用:三维形状分析,视图不变活动分析和非线性动态建模。与其他基线方法相比,我们在高级识别性能和时间复杂性方面都表现出有利的结果。
translated by 谷歌翻译
视觉问答(VQA)是一项复杂的语义任务,需要自然语言处理和视觉识别。在本文中,我们探讨了在亚奈奎斯特压缩范式中捕获图像时VQA是否可解。我们开发了一系列深度网络架构,利用可用的压缩数据来提高准确度,并表明VQA确实可以在压缩域中解决。我们的结果表明,当使用压缩测量时,VQA性能会出现明显的下降,但当VQA流水线与最先进的深度神经网络结合用于CS重建时,可以恢复准确性。结果表明,资源受限的VQA应用具有重要意义。
translated by 谷歌翻译
机器学习系统定期处理实际应用中的结构化数据。遗憾的是,这种数据难以以大多数机器学习技术所期望的方式忠实地表示,即作为固定的预定大小的实值向量。在这项工作中,我们介绍了一种新方法,它将结构化数据编译成一个可满足性问题,该问题在其解决方案集中至少(通常只有)输入数据。可满足性问题由约束构成,这些约束是从给定签名先验地自动生成的,因此可以简单地允许构造输入的单词 - 矢量表示。方法在两个方面进行了演示,即自动推理和自然语言处理,在这些方面,它被证明在生成自然语言句子的矢量表示和一阶逻辑子句方面几近完美,可以将其转换回原始的结构化输入形式。
translated by 谷歌翻译
在城市地区航行的自动驾驶车辆需要了解和预测未来的行人行为以获得更安全的航行。这种高水平的情境意识需要观察行人行为并推断他们的位置以了解未来的位置。虽然使用隐马尔可夫模型(HMM)在该领域已经完成了一些工作,但是该方法的少数观察到的缺点之一是需要知识先验的学习行为。在这项工作中,提出了增长隐马尔可夫模型(GHMM)方法的扩展,以解决其中一些缺点。这是通过利用潜在成本图和自然视觉原理在现有工作的基础上实现的。作为一个序列,与现有技术相比,所提出的模型能够在更长的范围内更精确地预测行人位置。该方法针对行人的“合法”和“非法”行为进行了测试,其中已经训练了具有稀疏观察和部分轨迹的模型。将具有未记录数据的方法与训练的现有技术模型进行比较。观察到所提出的方法即使在新的,先前未看到的情况下也是稳健的。
translated by 谷歌翻译
开放域问答(QA)是AI和NLP中的一个重要问题,它正在成为AI方法和技术普遍性进展的领头羊。通过信息检索方法和语料库构建的进步,开放域QA系统的大部分进展已经实现。在本文中,我们重点介绍最近推出的ARC Challengedataset,其中包含2,590个多项选择题,这些题目是为学校的科学考试而编写的。选择这些问题是当前QA系统中最具挑战性的问题,并且当前的现有技术性能仅比随机机会略好。我们提出了一个系统,它将agiven问题重写为用于从科学相关文本的大量语料库中检索支持文本的查询。我们的重写器能够整合来自ConceptNet的背景知识,并且与在SciTail上训练的通用textualentailment系统相结合,在检索结果中识别支持 ​​- 在端到端QA任务上优于几个强大的基线,尽管只是经过培训以识别基本术语在原始资源中。我们使用一般化的决策方法而不是检索证据并回答候选人以选择最佳答案。通过结合querygrriting,背景知识和文本蕴涵,我们的系统能够在ARC数据集上表现出几个强大的基线。
translated by 谷歌翻译
自然语言推理(NLI)是许多自然语言处理(NLP)应用程序的基础,包括语义搜索和问答。由于大规模,具有挑战性的数据集的发布,NLI问题得到了极大的关注。目前解决该问题的方法主要集中在基于学习的方法上,该方法仅使用文本信息来分类给定的前提是否与agiven假设相关,矛盾或中立。令人惊讶的是,使用基于结构化知识的方法 - 人工智能的一个中心主题 - 并没有受到与NLI问题相关的更多关注。虽然有许多开放的知识库包含各种类型的推理信息,但它们对NLI的使用还没有得到很好的探索。为了解决这个问题,我们提出了一些技术组合,利用知识图来提高科学问题领域中NLI问题的性能。我们提出了在文本,图形和基于文本到图形的模型上应用ourtechniques的结果,并讨论了使用外部知识解决NLI问题的重要性。 Ourmodel通过theSciTail科学问题数据集在NLI问题上实现了新的最先进的性能。
translated by 谷歌翻译
高通量电子显微镜允许以足够的分辨率记录神经组织的大量堆叠,以提取下面神经网络的接线图。目前使该过程自动化的努力主要集中在神经元的分割上。但是,为了恢复布线图,还需要识别突触合作伙伴。这在像黑腹果蝇(Drosophila melanogaster)这样的昆虫大脑中尤其具有挑战性,其中一个突触位点与多个突触后元件相关联。在这里,我们提出了一种3D U-Net架构,可以直接识别彼此前后突触的体素对。为此,我们将突触伴侣识别问题制定为体素之间的长程边缘的分类问题,以编码突触对的存在及其方向。这个公式允许我们直接从突触点注释中学习,而不是更基于体素的突触间隙或囊泡注释。我们评估了MICCAI 2016 CREMI挑战的方法并改进了现有技术水平,产生的误差比下一个最佳方法少3%。
translated by 谷歌翻译