转录组的空间研究为生物学家提供了异质和复杂组织的基因表达图谱。然而,大多数实验方案的空间转录组学需要事先选择在整个转录组中量化的小部分基因。标准单细胞RNA测序(scRNA-seq)更普遍,更容易实现并且原则上可以捕获任何基因但不能恢复细胞的空间位置。在本手稿中,我们专注于基于来自相同生物组织的(未配对的)标准cDNA-seq数据在空间转录组数据中插入基因的插补问题。基于领域适应性工作,我们提出了gimVI,一种深度生成模型,用于整合空间转录数据和scRNA-seq数据,可用于估算遗传基因。在描述了我们的生成模型及其推理过程之后,我们将gimVI与来自计算生物学或现实数据集上的域适应的替代方法进行比较,并且优于Seurat Anchors,Liger和CORAL来实现保持基因。
translated by 谷歌翻译
我们提出了一类一阶梯度型优化算法来解决结构化\ textit {过滤 - 聚类问题},一类包括趋势过滤和$ \ ell_1 $ -convex聚类的问题作为特例。我们的第一个主要结果建立了线性尽管在这些问题中差异操作符矩阵的极端病态,但确定性梯度型算法的收敛性仍然存在。这种收敛结果是基于滤波聚类问题的凹凸鞍点公式以及问题的双重形式承认全局误差界限的事实,这是基于着名的霍夫曼对点与其投影之间的距离的约束。最佳集合。线性收敛速度也适用于随机方差约简梯度型算法。最后,我们提出实证结果,以表明我们分析的算法与趋势过滤的最新算法相当,同时表现出可扩展性的优势。
translated by 谷歌翻译
基于决策的对抗性攻击研究了仅依赖于目标模型的输出标签的adversarialexamples的生成。在本文中,基于决策的对抗性攻击被制定为一个优化问题。通过零阶优化,我们开发了边界攻击++,这是一种基于梯度方向的新估计的算法族,在决策边界使用二元信息。通过在两种类型的投影操作符之间切换,我们的算法能够分别优化$ L_2 $和$ L_ \ infty $ distance。实验表明,边界攻击++需要比边界攻击少得多的模型查询。我们还展示了与最先进的白盒算法相比,在攻击MNIST上的对抗训练模型时,算法实现了卓越的性能。
translated by 谷歌翻译
Machine learning (ML) techniques are enjoying rapidly increasing adoption. However, designing and implementing the systems that support ML models in real-world deployments remains a significant obstacle, in large part due to the radically different development and deployment profile of modern ML methods, and the range of practical concerns that come with broader adoption. We propose to foster a new systems machine learning research community at the intersection of the traditional systems and ML communities, focused on topics such as hardware systems for ML, software systems for ML, and ML optimized for metrics beyond predictive accuracy. To do this, we describe a new conference, SysML, that explicitly targets research at the intersection of systems and machine learning with a program committee split evenly between experts in systems and ML, and an explicit focus on topics at the intersection of the two.
translated by 谷歌翻译
我们研究了在语言数据集的解释中解释训练的分类模型的问题。利用解析树,我们建议通过利用句法选区结构将一个基于最小二乘的重要性分数分配给一个实例的每个单词。我们通过将它们与联盟游戏理论中的Banzhaf值联系起来,建立了这些重要性得分的公理化表征。基于这些重要性分数,我们开发了一种原则性方法,用于检测和量化句子中单词之间的相互作用。我们证明了所提出的方法可以帮助解释几个广泛使用的语言模型的诊断和诊断。
translated by 谷歌翻译
在本文中,我们推导出具有子高斯范数的随机向量的浓度不等式(子高斯随机向量和非标准随机向量的推广),这些随机向量紧靠对数因子。
translated by 谷歌翻译
我们确定了鲁棒性和准确性之间的权衡,这是在设计防御对抗性实例时的一个主要原则。虽然这个问题已经在经验上得到广泛研究,但仍有许多未知关注这种权衡的理论基础。在这项工作中,我们根据对抗性示例的风险与非对抗性示例的风险之间的差距来量化交易。挑战是在代理损失方面提供这个数量的紧密限制。我们根据分类校准损失给出该数量的最佳上限,其与最坏情况下的下限匹配。在我们的理论分析的启发下,我们还设计了一种新的防御方法TRADES,以对抗对抗性,而不是准确性。我们提出的算法在实际数据集中实验性地表现良好。该方法论是我们进入神奇的2018年对抗视觉挑战赛的基础,我们在强劲的模型赛道中赢得了1,995份参赛作品中的第一名,以平均$ $ ell_2 $的价格超过亚军奖金$ 11.41 \%$扰动距离。
translated by 谷歌翻译
我们提出了一种双时间算法,用于在两个玩家的零和游戏中找到局部纳什均衡。我们首先表明,由于非纳什平稳点的存在,先前的基于梯度的算法不能保证收敛到局部纳什均衡。通过利用游戏的差异结构,我们构造了一种算法,本地纳什均衡是唯一吸引固定点的算法。我们还表明该算法在平衡邻域中没有表现出振荡行为,并且表明它与其他最近提出的算法具有相同的每迭代复杂度。我们通过在两个数字示例上验证算法得出结论:具有多个纳什均衡和非纳西均衡的玩具示例,以及小生成对抗网络(GAN)的训练。
translated by 谷歌翻译
我们考虑异步在线测试的问题,旨在在连续的数据收集和测试流中提供错误发现率(FDR)的控制,其中每个测试可以是可以在任意时间开始和停止的顺序测试。这种设置越来越成为科学和工业中现实世界应用的特征,大型组织的研究团队可以以分散的方式对假设进行测试。时间和空间的重叠也倾向于引起测试统计学之间的依赖性,这是对经典方法论的挑战,其经典或过度悲观地假定(过度悲观地)测试统计之间的任意依赖性。我们提出了一个通用框架,通过统一的计算抽象来解决这两个问题,我们将其称为“冲突集”。我们展示了这个框架如何在一个更中间的,本地的依赖概念下用正式的FDR保护产生算法。我们在仿真实验中说明了这些算法,并与现有的在线FDR控制算法进行了比较。
translated by 谷歌翻译
优化算法和蒙特卡罗采样算法为近年来统计机器学习应用的快速增长提供了计算基础。然而,对这两种方法论之间的关系,以及对相对优势和劣势的有限理解,理论上存在有限的理解。此外,现有的结果主要是在凸函数(foroptimization)和对数凹函数(用于采样)的设置中获得的。在此设置中,本地属性确定全局属性,优化算法在计算上比采样算法更有效。 Weinstead研究了混合建模和多稳系统中出现的一类非凸目标函数。在这个非凸面设置中,我们发现采样算法的计算复杂度与模式维度成线性比例,而优化算法的计算复杂度呈指数级。
translated by 谷歌翻译