在本文中,我们呈现超级OT,这是一种新的计算谱系追踪方法,其基于生成的对抗网络(GANS)将监督学习框架结合了具有最优传输的监督学习框架。与以前的谱系追踪方法不同,Super-OT具有集成配对数据的灵活性。我们基于针对Waddington-OT的单细胞RNA-SEQ数据进行基于单细胞RNA-SEQ数据的基准测试,这是一种谱系追踪的流行方法,也采用了最佳运输。我们展示超级OT在预测分化期间预测细胞的阶级结果时,Super-Ot达到了vaddington-ot。它允许在培训期间整合附加信息。
translated by 谷歌翻译
最佳运输(OT)理论描述了定义和选择在许多可能的选择中,将概率度量映射到另一个概率的最有效方法。该理论主要用于估计,给定一对源和目标概率测量$(\ MU,\ nu)$,这是一个可以有效地将$ \ mu $映射到$ \ nu $的参数化映射$ t_ \ theta $。在许多应用程序中,例如预测细胞对治疗的响应,数据测量$ \ mu,\ nu $(未处理/处理过的单元的功能)定义了最佳运输问题并非孤立地出现,但与上下文$ c $相关联(治疗)。为了说明并将该上下文纳入OT估计,我们介绍了Condot,一种使用上下文标签$ C_I $标记的几对测量$(\ mu_i,\ nu_i)$使用几对测量$(\ mu_i,\ nu_i)$。我们的目标是从标记对的数据集$ \ {(c_i,((\ mu_i,\ nu_i))中提取%\})\} $学习全局映射$ \ mathcal {t} _ {\ theta} $,不仅是预期的适合数据集中的所有对$ \ {((c_i,(\ mu_i,\ nu_i)))\} $,即$,但应概括以产生有意义的地图$ \ Mathcal {t} _ {\ theta}(c _ {\ text {new}})$在未看到的上下文上调节的$ c _ {\ text {new}} $。我们的方法利用并为部分输入凸神经网络提供了新颖的用法,为此我们引入了受高斯近似启发的强大而有效的初始化策略。我们仅使用对所述扰动的作用观察到遗传或治疗性扰动对单个细胞的任意组合对单个细胞的任意组合的影响的能力。
translated by 谷歌翻译
考虑随时间演变的粒子群,通过快照监测,使用在连续时间戳的群体内采样的粒子。仅提供对这些快照的访问,我们可以重建这些粒子的单个轨迹吗?这个问题在我们时代的许多重要科学挑战中,特别是单细胞基因组学。在本文中,我们建议将人口动态模拟为欧洲因果乔丹 - 古德莱尔 - 奥托(JKO)的措施的实现:JKO计划陷入困境,即在时间T + 1的人口采取的新配置是交易的新配置在它减少能量的情况下,群体的更好配置,同时保持关闭(在Wasserstein距离)到在T.中观察到的先前配置。我们在这项工作中的目标是学习这样的能源给定数据。为此,我们提出了JKONET,一种计算的神经结构(以端到端可分子的方式),JKO流量给出了参数化能量和初始配置点。与更直接的前进方法相比,我们展示了JKONET配件程序的良好性能和稳健性。
translated by 谷歌翻译
在数据集中定义样本之间有意义的距离是机器学习中的一个基本问题。最佳传输(OT)在样品之间提高特征(“地面度量”)到几何意义上的距离之间的距离。但是,通常没有直接的地面度量选择。有监督的地面度量学习方法存在,但需要标记的数据。在没有标签的情况下,仅保留临时地面指标。因此,无监督的地面学习是启用数据驱动的OT应用程序的基本问题。在本文中,我们首次通过同时计算样本之间和数据集功能之间的OT距离来提出规范答案。这些距离矩阵自然出现,作为函数映射接地指标的正奇异向量。我们提供标准以确保这些奇异向量的存在和独特性。然后,我们使用随机近似和熵正则化引入可扩展的计算方法以在高维设置中近似它们。最后,我们在单细胞RNA测序数据集上展示了Wasserstein奇异向量。
translated by 谷歌翻译
人口动态是对生物种群大小的时间和空间变化的研究,是人口生态学的主要部分。分析人口动态的主要困难之一是,由于实验成本或测量限制,我们只能从固定点观察值中获得粗略的时间间隔的观察数据。最近,已经提出,通过使用连续归一化流(CNF)和动态最佳运输来对种群动力学进行建模,以从观察到的人群中推断样品轨迹。尽管CNF中的样本行为是确定性的,但生物系统中的实际样本以本质上随机但方向性的方式移动。此外,当样本从点A中的点移动到动力学系统中B点B时,其轨迹通常遵循最小动作的原理,在该原理中,相应的动作具有最小的可能值。为了满足样品轨迹的这些要求,我们制定了Lagrangian Schr \“ Odinger Bridge(LSB)问题,并提议将其近似于使用神经SDE和正则化解决。我们还开发了一个模型体系结构,可以更快地计算。实验结果表明,该结果表明,该模型表明,提出的方法即使对于高维数据也可以有效地近似人口级动力学,并且使用拉格朗日引入的先验知识使我们能够估算具有随机行为的单个样本的轨迹。
translated by 谷歌翻译
我们研究了摊销优化的使用来预测输入度量的最佳运输(OT)图,我们称之为元。通过利用过去问题的知识和信息来快速预测和解决新问题,这有助于反复解决不同措施之间的类似OT问题。否则,标准方法忽略了过去解决方案的知识,并从头开始重新解决每个问题。元模型在离散设置中超过了log-sinkhorn求解器的标准收敛速率,并在连续设置中凸电势。我们通过在图像,球形数据和调色板之间的离散和连续传输设置中多个数量级来改善标准ot求解器的计算时间。我们的源代码可在http://github.com/facebookresearch/meta-ot上找到。
translated by 谷歌翻译
域的适应性旨在将从源域获得的标记实例转移到目标域,以填补域之间的空白。大多数域适应方法都假定源和目标域具有相同的维度。当每个域中的特征数量不同时,都很少研究当适用的方法,尤其是当未给出从目标域获得的测试数据的标签信息时。在本文中,假定在两个域中都存在共同特征,并且在目标域中观察到额外的(新的)特征。因此,目标域的维度高于源域的维度。为了利用共同特征的均匀性,这些源和目标域之间的适应性被称为最佳运输(OT)问题。此外,得出了基于ot的方法的目标域中的学习结合。使用模拟和现实世界数据对所提出的算法进行验证。
translated by 谷歌翻译
最佳运输距离(OT)已广泛应用于最近的机器学习工作作为比较概率分布的方法。当数据在高尺寸处生存时,这些都是昂贵的。Paty等人的最新工作是,2019年,专门针对使用数据的低级别投影(视为离散措施)来降低这一成本。我们扩展了这种方法,并表明,通过使用更多地图的地图族可以近距离近距离近距离。通过在给定的家庭上最大化OT来获得最佳估计。随着在将数据映射到较低维度空间之后进行OT计算,我们的方法使用原始数据维度缩放。我们用神经网络展示了这个想法。
translated by 谷歌翻译
在这里,我们提出了一种称为歧管插值最佳传输流量(MIOFLOW)的方法,该方法从零星时间点上采集的静态快照样品中学习随机,连续的种群动力学。 Mioflow结合了动态模型,流动学习和通过训练神经普通微分方程(神经ode)的最佳运输,以在静态种群快照之间插值,以通过具有歧管地面距离的最佳运输来惩罚。此外,我们通过在自动编码器的潜在空间中运行我们称为Geodesic AutoCododer(GAE)来确保流量遵循几何形状。在GAE中,正规化了点之间的潜在空间距离,以匹配我们定义的数据歧管上的新型多尺度测量距离。我们表明,这种方法优于正常流,Schr \“ Odinger Bridges和其他旨在根据人群之间插值的噪声流向数据的生成模型。从理论上讲,我们将这些轨迹与动态最佳运输联系起来。我们评估了我们的评估使用分叉和合并的模拟数据,以及来自胚胎身体分化和急性髓样白血病的SCRNA-SEQ数据。
translated by 谷歌翻译
由于其边缘约束,最佳运输(OT)对异常值很敏感。基于以下定义,已经提出了较强的OT变体,即离群值是移动昂贵的样本。在本文中,我们表明,通过考虑离群值更接近目标度量的情况,该定义受到限制。我们表明,较强的OT OT完全运输这些异常值,导致实践中的表现不佳。为了解决这些异常值,我们建议通过依靠接受对抗性培训的分类器来对其进行分类和目标样本进行分类,以检测它们。如果分类器的预测与其分配的标签不同,则将样本视为异常值。为了减少这些异常值在运输问题中的影响,我们建议将它们从问题中删除,或者通过使用分类器预测来增加移动它们的成本。我们表明,我们成功地检测到这些异常值,并且它们不影响多个实验的运输问题,例如梯度流,生成模型和标签传播。
translated by 谷歌翻译
The Sinkhorn algorithm (arXiv:1306.0895) is the state-of-the-art to compute approximations of optimal transport distances between discrete probability distributions, making use of an entropically regularized formulation of the problem. The algorithm is guaranteed to converge, no matter its initialization. This lead to little attention being paid to initializing it, and simple starting vectors like the n-dimensional one-vector are common choices. We train a neural network to compute initializations for the algorithm, which significantly outperform standard initializations. The network predicts a potential of the optimal transport dual problem, where training is conducted in an adversarial fashion using a second, generating network. The network is universal in the sense that it is able to generalize to any pair of distributions of fixed dimension. Furthermore, we show that for certain applications the network can be used independently.
translated by 谷歌翻译
In past work on fairness in machine learning, the focus has been on forcing the prediction of classifiers to have similar statistical properties for people of different demographics. To reduce the violation of these properties, fairness methods usually simply rescale the classifier scores, ignoring similarities and dissimilarities between members of different groups. Yet, we hypothesize that such information is relevant in quantifying the unfairness of a given classifier. To validate this hypothesis, we introduce Optimal Transport to Fairness (OTF), a method that quantifies the violation of fairness constraints as the smallest Optimal Transport cost between a probabilistic classifier and any score function that satisfies these constraints. For a flexible class of linear fairness constraints, we construct a practical way to compute OTF as a differentiable fairness regularizer that can be added to any standard classification setting. Experiments show that OTF can be used to achieve an improved trade-off between predictive power and fairness.
translated by 谷歌翻译
最近的邻居图被广泛用于捕获数据集的几何形状或拓扑。构建此类图的最常见策略之一是基于为每个点选择固定数字K(KNN)。但是,当抽样密度或噪声水平在数据集各不相同时,KNN启发式可能会变得不合适。试图解决此问题的策略通常会引入需要调整的其他参数。我们提出了一种简单的方法,以基于四次正规化的最佳传输,从单个参数构建自适应邻域图。我们的数值实验表明,以这种方式构建的图在无监督和半监督的学习应用中表现出色。
translated by 谷歌翻译
轨迹推断旨在从其时间边缘的快照中恢复人群的动态。为了解决这项任务,Lavenant等人引入了相对于路径空间中的Wiener度量的最小渗透估计量。 ARXIV:2102.09204,并显示出从无限尺寸凸优化问题的解决方案中始终如一地恢复大型漂移扩散过程的动力学。在本文中,我们引入了无网算法来计算该估计器。我们的方法包括通过Schr \“ Odinger Bridges耦合的点云家族(每张快照),该桥也随着嘈杂的梯度下降而演变。我们研究了动力学的平均场限制,并证明了其与所需估计量的全局收敛。这导致了一种具有端到端理论保证的推理方法,可以解决轨迹推理的可解释模型。我们还提出了如何调整方法处理质量变化的方法,在处理单个单元RNA序列数据时,这是一个有用的扩展细胞可以分支并死亡。
translated by 谷歌翻译
这是一门专门针对STEM学生开发的介绍性机器学习课程。我们的目标是为有兴趣的读者提供基础知识,以在自己的项目中使用机器学习,并将自己熟悉术语作为进一步阅读相关文献的基础。在这些讲义中,我们讨论受监督,无监督和强化学习。注释从没有神经网络的机器学习方法的说明开始,例如原理分析,T-SNE,聚类以及线性回归和线性分类器。我们继续介绍基本和先进的神经网络结构,例如密集的进料和常规神经网络,经常性的神经网络,受限的玻尔兹曼机器,(变性)自动编码器,生成的对抗性网络。讨论了潜在空间表示的解释性问题,并使用梦和对抗性攻击的例子。最后一部分致力于加强学习,我们在其中介绍了价值功能和政策学习的基本概念。
translated by 谷歌翻译
在本文中,我们提出了第一次尝试无监督的SBIR来删除常规培训所需的标签成本(类别注释和素描 - 光配对)。由于该问题的独特跨域(草图和照片)性质,现有的单域无监督表示学习方法在本应用程序中的性能很差。因此,我们介绍了一个新型框架,该框架同时执行了无监督的表示学习和素描域的对准。从技术上讲,这是通过利用联合分配最佳运输(JDOT)来对齐的,以使来自不同领域的数据在表示过程中对齐,我们将其扩展到可训练的群集原型和功能记忆库以进一步提高可扩展性和功效。广泛的实验表明,我们的框架在新的无监督环境中取得了出色的性能,并且在零拍设置中的性能比最先进的表现相当或更好。
translated by 谷歌翻译
在计算机视觉中,面对域转移是很常见的:具有相同类但采集条件不同的图像。在域适应性(DA)中,人们希望使用源标记的图像对未标记的目标图像进行分类。不幸的是,在源训练集中训练的深度神经网络在不属于训练领域的目标图像上表现不佳。改善这些性能的一种策略是使用最佳传输(OT)在嵌入式空间中对齐源和目标图像分布。但是,OT会导致负转移,即与不同标签的样品对齐,这导致过度拟合,尤其是在域之间存在标签移动的情况下。在这项工作中,我们通过将其解释为针对目标图像的嘈杂标签分配来减轻负相位。然后,我们通过适当的正则化来减轻其效果。我们建议将混合正则化\ citep {zhang2018mixup}与噪音标签强大的损失,以提高域的适应性性能。我们在一项广泛的消融研究中表明,这两种技术的结合对于提高性能至关重要。最后,我们在几个基准和现实世界DA问题上评估了称为\ textsc {mixunbot}的方法。
translated by 谷歌翻译
域适应性是现代机器学习中的一种流行范式,旨在解决培训或验证数据集之间具有用于学习和测试分类器(源域)和潜在的大型未标记数据集的培训或验证数据集之间的分歧问题,其中利用了模型(目标域)(目标域)(目标域) 。任务是找到源数据集的源和目标数据集的这种常见表示,其中源数据集提供了培训的信息,因此可以最大程度地减少来源和目标之间的差异。目前,最流行的领域适应性解决方案是基于训练神经网络,这些神经网络结合了分类和对抗性学习模块,这些模块是饥饿的,通常很难训练。我们提出了一种称为域适应性主成分分析(DAPCA)的方法,该方法发现线性减少的数据表示有助于解决域适应任务。 DAPCA基于数据点对之间引入正权重,并概括了主成分分析的监督扩展。 DAPCA代表一种迭代算法,因此在每次迭代中都解决了一个简单的二次优化问题。保证算法的收敛性,并且在实践中的迭代次数很少。我们验证了先前提出的用于解决域适应任务的基准的建议算法,还显示了在生物医学应用中对单细胞法数据集进行分析中使用DAPCA的好处。总体而言,考虑到源域和目标域之间可能的差异,DAPCA可以作为许多机器学习应用程序中有用的预处理步骤。
translated by 谷歌翻译
最近,已经显示,与流行的基于Kullback Leibler(KL)的正则化不同,基于最佳运输(OT)的最大平均差异(MMD)正则化导致了对估计样品复杂性的无维度。另一方面,分别使用总变异和基于KL的正规化来定义有趣的指标类别(GHK)等有趣的指标类别和高斯 - 赫林格 - 坎托维奇(GHK)指标。但是,如果可以使用样品有效的MMD正则化定义适当的指标,则是一个空旷的问题。在这项工作中,我们不仅弥合了这一差距,而且进一步考虑了基于积分概率指标(IPM)的通用正规化家族,其中包括MMD作为特殊情况。我们提出了新颖的IPM正规化$ P $ - WASSERSTEIN风格的OT配方,并证明它们确实诱导了指标。尽管其中一些新型指标可以解释为IPM的虚拟卷积,但有趣的是,事实证明是GW和GHK指标的IPM-Analogues。最后,我们提出了基于样品的有限公式,用于估计平方-MMD正则化度量和相应的barycenter。我们从经验上研究了拟议指标的其他理想特性,并显示了它们在各种机器学习应用中的适用性。
translated by 谷歌翻译
本文介绍了一个新颖而通用的框架,以利用最佳运输工具来解决监督标记的图形预测的旗舰任务。我们将问题提出为融合Gromov-Wasserstein(FGW)损失的回归,并提出了一个依靠FGW Barycenter的预测模型,该模型的权重取决于输入。首先,我们基于内核脊回归引入了一个非参数估计量,该估计量得到了理论结果,例如一致性和过量风险绑定。接下来,我们提出了一个可解释的参数模型,其中Barycenter权重用神经网络建模,并进一步学习了FGW Barycenter的图形。数值实验表明了该方法的强度及其在模拟数据上标记的图形空间以及难以实现的代谢识别问题上插值的能力,在这种情况下,它几乎没有工程学才能达到非常好的性能。
translated by 谷歌翻译