在本文中,我们提出了一种通过无序的固定长度位串来表示指纹图像的方法,该方法提供了改进的精度性能,更快的匹配时间和可压缩性。首先,我们设计了一个新的基于minutia的局部结构,该结构由像素空间中的2D椭圆高斯函数的混合建模。通过将局部结构与与其相关联的细节数进行归一化,将每个局部结构映射到欧几里德空间。这个简单但至关重要的关键点可以实现两个局部结构的快速相异性计算,其中欧氏距离无失真。还引入了基于细节的局部结构的基于纹理的互补局部结构,其中两者都可以通过主成分分析进行压缩并且在欧几里德空间中容易融合。然后通过K均值聚类算法将融合的局部结构转换为K位有序串。仅使用欧几里德距离的这种计算链对于快速和有区别的位串转换是至关重要的。通过手指特定的比特训练算法可以进一步提高准确度,其中利用两个标准来选择有用的比特位置以进行匹配。在指纹验证竞赛(FVC)数据库上进行实验,以与现有技术进行比较,以显示所提出的方法的优越性。
translated by 谷歌翻译
对于前列腺癌患者,Gleason评分是最重要的预后因素之一,可能决定独立于分期的治疗。然而,Gleason评分基于肿瘤形态的主观显微镜检查并且具有较差的再现性。在这里,我们提出了一个深度学习系统(DLS),用于Gleason评分前列腺切除术的全幻灯片图像。我们的系统是使用来自1,226张幻灯片的1.12亿个病理学家注释的图像片段开发的,并在331个幻灯片的独立验证数据集上进行评估,其中参考标准由泌尿生殖专家病理学家建立。在验证数据集中,29名一般病理学家的平均准确度为0.61。 DLS的诊断准确率显着提高0.70(p = 0.002),并且与临床随访数据的相关性趋向于更好的患者风险分层。我们的方法可以提高格里森评分的准确性和随后的治疗决策,特别是在专业知识不可用的情况下。 DLS还超越了当前的格里森系统,以更精细地表征和定量肿瘤形态,为格里森系统本身的细化提供了机会。
translated by 谷歌翻译
Stein's method for measuring convergence to a continuous target distribution relies on an operator characterizing the target and Stein factor bounds on the solutions of an associated differential equation. While such operators and bounds are readily available for a diversity of univariate targets, few multivariate targets have been analyzed. We introduce a new class of characterizing operators based on Itô diffu-sions and develop explicit multivariate Stein factor bounds for any target with a fast-coupling Itô diffusion. As example applications, we develop computable and convergence-determining diffusion Stein discrepancies for log-concave, heavy-tailed, and multimodal targets and use these quality measures to select the hyperparameters of biased Markov chain Monte Carlo (MCMC) samplers, compare random and deterministic quadrature rules, and quantify bias-variance tradeoffs in approximate MCMC. Our results establish a near-linear relationship between diffusion Stein discrepancies and Wasserstein distances, improving upon past work even for strongly log-concave targets. The exposed relationship between Stein factors and Markov process coupling may be of independent interest.
translated by 谷歌翻译
假设我们希望从“用户喜欢项目p或项目q?”形式的配对比较来估计用户的偏好向量w,其中用户和项目都嵌入在低维欧几里德空间中,其距离反映了用户和项目的相似性。这些观察结果出现在许多设置中,包括心理测量学和心理学实验,搜索任务,广告和推荐系统。在这样的任务中,查询可能非常恶劣并且受到不同级别的响应噪声的影响;因此,我们的目标是根据先前比较的结​​果选择最具信息量的对。我们提供了关于贪婪信息最大化在这种情况下的益处和挑战的新理论见解,并开发了最大化信息增益下限的双重策略,并且分别简单地分析和计算。我们使用来自区域世界数据集的模拟响应来验证我们的策略,通过它们与贪婪信息最大化相似的性能,以及它们优越的偏好估计,最先进的选择方法以及随机查询。
translated by 谷歌翻译
我们提出了一种新的网络架构,用于基于标准自旋霍尔磁隧道结的自旋神经元,允许它们同时并行地计算多个关键卷积神经网络功能,从而节省空间和时间。整流线性单元传递函数和局部汇集函数的近似值与卷积运算本身同时计算。在MNIST数据集上执行概念验证模拟,对于所有卷积,激活和池化操作的组合,以低于1 nJ的成本实现高达98%的准确度。模拟对热噪声具有显着的鲁棒性,即使在非常小的磁性层下也能很好地运行。
translated by 谷歌翻译
可取消的生物特征识别(CB)作为生物特征模板保护方法的手段是指在原始模板上的不可逆但相似的保持变换。利用相似性保持属性,可以在变换域中执行模板和查询实例之间的匹配,而不会危害精度性能。不幸的是,这种特性引发了一类攻击,即基于相似性的攻击(SA)。 SA生成一个preimage,一个转换模板的逆,可用于模拟和交叉匹配。在本文中,我们提出了一种基于遗传算法的基于相似性的攻击框架(GASAF)来证明具有相似性保持特性的CB方案是基于相似性的攻击。除此之外,还设计了一组新指标来衡量基于相似性的攻击的有效性。我们在两个有代表性的CB方案上进行实验,即BioHashing和Bloom-filter。实验结果证明了这种攻击下的脆弱性。
translated by 谷歌翻译
有大量复杂的动态系统对我们的日常生活和社会至关重要但却难以理解,即使今天有可能感知和收集大量的实验数据,它们也是如此复杂和不断发展,以至于它们的动力不太可能将被详细了解。然而,通过计算工具,我们可以尝试最好地利用当前技术和可用数据。我们认为,最有用的模型将在有限的知识或多个假设的背景下考虑系统复杂性和可用数据之间的不平衡。生物细胞的复杂系统是在系统生物学中研究的这种系统的一个主要例子,并且激发了本文提出的方法。它们是作为DARPA快速威胁评估(RTA)计划的一部分而开发的,该计划涉及对影响人体细胞的毒素或药物的作用机制(MoA)的理解。结合使用高斯过程和抽象网络建模,我们提出了三种基本的不同的基于机器学习的方法来学习因果关系,并从高维时间序列数据中合成因果网络。虽然其他类型的数据可用并且已经在我们的RTA工作中进行了分析和整合,但我们关注的是本文中从高通量微阵列实验获得的转录组学(即基因表达)数据,以说明我们的算法的能力和局限性。我们的算法使得不同但总体上相对较少的生物学假设,因此它们适用于其他类型的生物数据,甚至可能适用于其他复杂系统,这些系统具有高维度但不具有生物学性质。
translated by 谷歌翻译
随着北极条件的迅速变化,北极地区的人类活动将继续增加,对海冰的高分辨率观测需求也将增加。虽然卫星图像可以提供高空间分辨率,但它在时间上是稀疏的,并且在观察之间可能发生显着的冰变形。这使得难以应用要求在图像之间存在持久特征的特征跟踪或图像相关技术。考虑到这一点,我们提出了一种基于最优传输的技术,该技术通常用于测量概率分布之间的差异。当小冰进入或离开图像场景时,我们表明,可以使用规范化的最优运输来定量估计冰变形。我们讨论了我们的方法的动机,并描述了有效的计算实现。结果提供了合成和MODIS图像的组合,以证明我们的方法在原始图像分辨率下估计动力学特性的能力。
translated by 谷歌翻译
The application of deep learning to early detection and automatedclassification of Alzheimer's disease (AD) has recently gained considerableattention as rapid progress in neuroimaging techniques has generatedlarge-scale multimodal neuroimaging data. Here we systematically reviewedpublications, where deep learning approaches and neuroimaging data were usedfor diagnostic classification of AD. A PubMed and google scholar search wasperformed to find deep learning papers for AD published between January 2013and July 2018, which were reviewed, evaluated, and classified by algorithms andneuroimaging types, and findings were summarized. The diagnostic classificationof AD using deep learning approaches and neuroimaging data was examined in 16studies. The approach to combine traditional machine learning forclassification and stacked auto-encoder (SAE) for feature selection hasproduced accuracies of up to 98.8% for AD classification and 83.7% forprediction of conversion from mild cognitive impairment (MCI), a prodromalstage of AD, to AD. Deep learning approaches such as convolutional neuralnetwork (CNN) or recurrent neural network (RNN) using neuroimaging data withoutpreprocessing for feature selection have yielded accuracies of up to 96.0% forAD classification and 84.2% for MCI conversion prediction. Furthermore, thebest classification performance was obtained when multimodal neuroimaging dataas well as fluid biomarkers were integrated. Deep learning approaches withoutpreprocessing neuroimaging data for feature selection, a major bottleneck oftraditional machining learning in high-dimensional data, continue to improvetheir performance and to show great promise in the diagnostic classification ofAD using multimodal neuroimaging data.
translated by 谷歌翻译
我们考虑自然发生的类型的双样本积分函数的估计,例如,当感兴趣的对象是未知概率密度之间的偏差时。我们的第一个主要结果是,在广义上,加权最近邻估计是有效的,在实现局部渐近极小极大下界的意义上。此外,我们还证明了相应的中心极限定理,这有利于构造功能性的,具有极小的宽度的非常有效的置信区间。我们的结果的一个有趣的结果是发现,对于某些功能,ouretimator的最坏情况性能可能会改善自然“oracle”估计器的性能,后者在观察时被允许接近未知密度的值。
translated by 谷歌翻译