可控的人图像合成任务可以通过对身体姿势和外观的明确控制来实现广泛的应用。在本文中,我们提出了一个基于跨注意的样式分布模块,该模块在源语义样式和目标姿势转移的目标姿势之间计算。该模块故意选择每个语义表示的样式,并根据目标姿势分配它们。交叉注意的注意力矩阵表达了目标姿势与所有语义的源样式之间的动态相似性。因此,可以利用它来从源图像路由颜色和纹理,并受到目标解析图的进一步限制,以实现更清晰的目标。同时,为了准确编码源外观,还添加了不同语义样式之间的自我注意力。我们的模型的有效性在姿势转移和虚拟的尝试任务上进行了定量和质量验证。
translated by 谷歌翻译
最近,使用批评者分配表示截断的分量批评者(TQC),显示在Mujoco连续控制基准套件的所有环境中提供最先进的渐近培训表现。此外,使用高更新到数据比和目标随机化的随机集合双Q学习(REDQ)达到了具有基于最先进的模型的方法竞争的高样本效率。在本文中,我们提出了一种新的无模型算法,具有集合(AQE)的激进Q学习,这提高了REDQ的样品效率性能和TQC的渐近性能,从而提供了整体最先进的性能在培训的所有阶段。此外,AQE非常简单,要求批评者的分布表示也不是目标随机化。
translated by 谷歌翻译
Graphons are general and powerful models for generating graphs of varying size. In this paper, we propose to directly model graphons using neural networks, obtaining Implicit Graphon Neural Representation (IGNR). Existing work in modeling and reconstructing graphons often approximates a target graphon by a fixed resolution piece-wise constant representation. Our IGNR has the benefit that it can represent graphons up to arbitrary resolutions, and enables natural and efficient generation of arbitrary sized graphs with desired structure once the model is learned. Furthermore, we allow the input graph data to be unaligned and have different sizes by leveraging the Gromov-Wasserstein distance. We first demonstrate the effectiveness of our model by showing its superior performance on a graphon learning task. We then propose an extension of IGNR that can be incorporated into an auto-encoder framework, and demonstrate its good performance under a more general setting of graphon learning. We also show that our model is suitable for graph representation learning and graph generation.
translated by 谷歌翻译
High order structures (cavities and cliques) of the gene network of influenza A virus reveal tight associations among viruses during evolution and are key signals that indicate viral cross-species infection and cause pandemics. As indicators for sensing the dynamic changes of viral genes, these higher order structures have been the focus of attention in the field of virology. However, the size of the viral gene network is usually huge, and searching these structures in the networks introduces unacceptable delay. To mitigate this issue, in this paper, we propose a simple-yet-effective model named HyperSearch based on deep learning to search cavities in a computable complex network for influenza virus genetics. Extensive experiments conducted on a public influenza virus dataset demonstrate the effectiveness of HyperSearch over other advanced deep-learning methods without any elaborated model crafting. Moreover, HyperSearch can finish the search works in minutes while 0-1 programming takes days. Since the proposed method is simple and easy to be transferred to other complex networks, HyperSearch has the potential to facilitate the monitoring of dynamic changes in viral genes and help humans keep up with the pace of virus mutations.
translated by 谷歌翻译
在许多纵向环境中,时间变化的协变量可能不会与响应同时测量,并且通常容易出现测量误差。幼稚的最后观察前向方法会产生估计偏差,现有的基于内核的方法的收敛速率缓慢和差异很大。为了应对这些挑战,我们提出了一种新的功能校准方法,以基于稀疏功能数据和测量误差的稀疏功能数据有效地学习纵向协变量。我们的方法来自功能性主成分分析,从观察到的异步和容易出现错误的协变量值中校准未观察到的同步协变量值,并广泛适用于异步纵向回归与时间传播或时间变化的系数。对于随时间不变系数的回归,我们的估计量是渐进的,无偏的,根-N一致的,并且渐近地正常。对于时变系数模型,我们的估计器具有最佳的变化系数收敛速率,而校准的渐近方差膨胀。在这两种情况下,我们的估计量都具有优于现有方法的渐近特性。拟议方法的可行性和可用性通过模拟和全国妇女健康研究的应用来验证,这是一项大规模的多站点纵向研究,对中年妇女健康。
translated by 谷歌翻译
现代电力系统正在经历由可再生能源驱动的各种挑战,该挑战要求开发新颖的调度方法,例如增强学习(RL)。对这些方法以及RL药物的评估很大程度上受到探索。在本文中,我们提出了一种评估方法,以分析RL代理的性能在审查的经济调度方案中。这种方法是通过扫描多个操作方案来进行的。特别是,开发了一种方案生成方法来生成网络方案和需求方案进行评估,并且根据电力流的变化率汇总了网络结构。然后,定义了几个指标来从经济和安全的角度评估代理商的绩效。在案例研究中,我们使用经过改进的IEEE 30总线系统来说明拟议的评估方法的有效性,模拟结果揭示了对不同情况的良好和快速适应。不同的RL代理之间的比较也很有帮助,可以为更好地设计学习策略提供建议。
translated by 谷歌翻译
随时间变化数据的因果发现(CD)在神经科学,医学和机器学习中很重要。 CD的技术包括通常没有偏见但昂贵的随机实验。它还包括诸如回归,匹配和Granger因果关系之类的算法,这些算法仅在人类设计师做出的强烈假设下正确。但是,正如我们在机器学习的其他领域发现的那样,人类通常不太正确,通常比数据驱动的方法表现出色。在这里,我们测试是否可以以数据驱动的方式改善因果发现。我们采用了一个具有大量因果成分(晶体管),MOS 6502处理器和元学习的系统,该系统为神经网络代表的因果发现程序。我们发现,该程序的表现远远超过了人为设计的因果发现程序,例如相互信息和Granger因果关系。我们认为,因果关系领域应在可能的情况下考虑一种有监督的方法,其中从具有已知因果关系的大型数据集中学习了CD程序,而不是由人类专家设计。我们的发现有望在神经和医学数据以及更广泛的机器学习社区中采用新的CD方法。
translated by 谷歌翻译
从废物电气和电子设备(WEEE)中有效拆卸和回收材料是将全球供应链从碳密集型,采矿材料转移到可回收和可再生的材料的关键步骤。常规的回收过程依赖于切碎和分类废物流,但是对于由许多不同材料组成的Weee,我们探索了针对许多物体的靶向拆卸,以改善材料恢复。许多WEEE对象都共享许多关键特征,因此看起来非常相似,但是它们的材料组成和内部组件布局可能会有所不同,因此,对于随后的拆卸步骤,为准确的材料分离和恢复而具有准确的分类器至关重要。这项工作介绍了RGB-X(一种多模式图像分类方法),该方法利用了来自外部RGB图像的关键特征,并从X射线图像中生成的图像来准确地对电子对象进行分类。更具体地说,这项工作开发了迭代类激活映射(ICAM),这是一种新型的网络体系结构,明确地侧重于用于准确的电子对象分类所需的多模式特征映射中的细节。为了培训分类器,由于费用和需要专家指导,电子对象缺乏大型且注释良好的X射线数据集。为了克服这个问题,我们提出了一种新的方法,可以使用应用于X射线域的域随机化创建合成数据集。合并的RGB-X方法使我们在10代现代智能手机上的准确度为98.6%,其单独的精度为89.1%(RGB)和97.9%(X射线)。我们提供实验结果3来证实我们的结果。
translated by 谷歌翻译
大多数现有的插槽填充模型倾向于记住实体的固有模式和培训数据中相应的上下文。但是,这些模型在暴露于口语语言扰动或实践中的变化时会导致系统故障或不良输出。我们提出了一种扰动的语义结构意识转移方法,用于训练扰动插槽填充模型。具体而言,我们介绍了两种基于传销的培训策略,以分别从无监督的语言扰动语料库中分别学习上下文语义结构和单词分布。然后,我们将从上游训练过程学到的语义知识转移到原始样本中,并通过一致性处理过滤生成的数据。这些程序旨在增强老虎机填充模型的鲁棒性。实验结果表明,我们的方法始终优于先前的基本方法,并获得强有力的概括,同时阻止模型记住实体和环境的固有模式。
translated by 谷歌翻译
食品图像分类是基于图像的饮食评估的基础,以预测食物类别。由于现实生活中有许多不同的食品类别,因此传统模型无法达到足够高的准确性。个性化分类器旨在在很大程度上提高每个人的食物图像分类的准确性。但是,缺乏公共个人食品消费数据被证明是培训此类模型的挑战。为了解决这个问题,我们提出了一个新颖的框架,以模拟个人食品消耗数据模式,利用修改后的马尔可夫链模型和自我监督的学习。我们的方法能够从有限的初始数据中创建准确的未来数据模式,并且我们的模拟数据模式可以与初始数据模式密切相关。此外,我们使用动态的时间翘曲距离和Kullback-Leibler Divergence作为指标来评估我们方法对公共食品-101数据集中的有效性。我们的实验结果表明,与随机模拟和原始马尔可夫链方法相比,表现出色。
translated by 谷歌翻译