联合嵌入(JE)是将多模态数据编码为向量空间中的一种方法,其中文本保持为接地密钥,以及像这样的键锚定图像的其他模式。MEME通常是具有嵌入文本的图像。虽然,模因通常用于乐趣,但它们也可以用来传播仇恨和假信息。随着它在若干社交平台上不经产的繁多,这导致了对模因的自动分析成为一个广泛的研究主题。在本文中,我们通过联合嵌入式报告了对Memotion分析问题的初步实验。结果略有屈服于SOTA。
translated by 谷歌翻译
Next-generation sequencing technologies have enhanced the scope of Internet-of-Things (IoT) to include genomics for personalized medicine through the increased availability of an abundance of genome data collected from heterogeneous sources at a reduced cost. Given the sheer magnitude of the collected data and the significant challenges offered by the presence of highly similar genomic structure across species, there is a need for robust, scalable analysis platforms to extract actionable knowledge such as the presence of potentially zoonotic pathogens. The emergence of zoonotic diseases from novel pathogens, such as the influenza virus in 1918 and SARS-CoV-2 in 2019 that can jump species barriers and lead to pandemic underscores the need for scalable metagenome analysis. In this work, we propose MG2Vec, a deep learning-based solution that uses the transformer network as its backbone, to learn robust features from raw metagenome sequences for downstream biomedical tasks such as targeted and generalized pathogen detection. Extensive experiments on four increasingly challenging, yet realistic diagnostic settings, show that the proposed approach can help detect pathogens from uncurated, real-world clinical samples with minimal human supervision in the form of labels. Further, we demonstrate that the learned representations can generalize to completely unrelated pathogens across diseases and species for large-scale metagenome analysis. We provide a comprehensive evaluation of a novel representation learning framework for metagenome-based disease diagnostics with deep learning and provide a way forward for extracting and using robust vector representations from low-cost next generation sequencing to develop generalizable diagnostic tools.
translated by 谷歌翻译
Scene graphs provide a rich, structured representation of a scene by encoding the entities (objects) and their spatial relationships in a graphical format. This representation has proven useful in several tasks, such as question answering, captioning, and even object detection, to name a few. Current approaches take a generation-by-classification approach where the scene graph is generated through labeling of all possible edges between objects in a scene, which adds computational overhead to the approach. This work introduces a generative transformer-based approach to generating scene graphs beyond link prediction. Using two transformer-based components, we first sample a possible scene graph structure from detected objects and their visual features. We then perform predicate classification on the sampled edges to generate the final scene graph. This approach allows us to efficiently generate scene graphs from images with minimal inference overhead. Extensive experiments on the Visual Genome dataset demonstrate the efficiency of the proposed approach. Without bells and whistles, we obtain, on average, 20.7% mean recall (mR@100) across different settings for scene graph generation (SGG), outperforming state-of-the-art SGG approaches while offering competitive performance to unbiased SGG approaches.
translated by 谷歌翻译
动态运动原语(DMP)为编码,生成和调整复杂的最终效应轨迹提供了极大的多功能性。 DMP也非常适合从人类演示中学习操纵技巧。但是,DMP的反应性质限制了其用于工具使用和对象操纵任务的适用性,这些任务涉及非全面约束,例如切割手术刀切割或导管转向。在这项工作中,我们通过添加一个耦合项来扩展笛卡尔空间DMP公式,该耦合术语强制执行一组预定义的非独立约束。我们使用udwadia-kalaba方法获得约束强迫项的闭合形式表达式。这种方法提供了一种干净,实用的解决方案,以确保运行时的限制满意度。此外,约束强迫项的提议的分析形式可实现有效的轨迹优化,但受约束。我们通过展示如何从人类示范中学习机器人切割技能来证明这种方法的有用性。
translated by 谷歌翻译
在模拟中测试黑盒感知控制系统面临两个困难。首先,模拟中的感知输入缺乏现实世界传感器输入的保真度。其次,对于合理准确的感知系统,遇到罕见的故障轨迹可能需要进行许多模拟。本文结合了感知误差模型 - 基于传感器的检测系统的替代模型与状态依赖性自适应重要性抽样。这使我们能够有效地评估模拟中现实世界感知控制系统的罕见故障概率。我们使用配备RGB障碍物检测器的自动制动系统进行的实验表明,我们的方法可以使用廉价的模拟来计算准确的故障概率。此外,我们展示了安全指标的选择如何影响能够可靠地采样高概率失败的学习建议分布的过程。
translated by 谷歌翻译
大量的现代机器学习任务要求将大规模分布式簇作为训练管道的关键组成部分。但是,工人节点的异常拜占庭行为可能会使训练脱轨并损害推理的质量。这种行为可以归因于无意的系统故障或精心策划的攻击;结果,一些节点可能会将任意结果返回到协调培训的参数服务器(PS)。最近的工作考虑了广泛的攻击模型,并探索了强大的聚合和/或计算冗余以纠正扭曲的梯度。在这项工作中,我们考虑攻击模型从强大的攻击模型:$ q $无所不知的对手,对防御协议充分了解可以从迭代变为迭代变为弱者:$ q $随机选择的对手有限,勾结能力只会改变每一个,一次迭代很少。我们的算法依赖于冗余任务分配以及对抗行为的检测。对于强烈的攻击,我们证明,与先前的最新时间相比,扭曲梯度的比例从16 \%-99 \%降低。与最先进的攻击相比,我们在CIFAR-10数据集上的TOP-1分类准确性结果表明,在最复杂的攻击下,准确性(平均和弱方案平均)的优势(平均相对于强度和弱方案平均)。
translated by 谷歌翻译
实现安全和强大的自主权是通往更广泛采用自动驾驶汽车技术的道路的关键瓶颈。这激发了超越外在指标,例如脱离接触之间的里程,并呼吁通过设计体现安全的方法。在本文中,我们解决了这一挑战的某些方面,重点是运动计划和预测问题。我们通过描述在自动驾驶堆栈中解决选定的子问题所采取的新方法的描述,在介绍五个之内采用的设计理念的过程中。这包括安全的设计计划,可解释以及可验证的预测以及对感知错误的建模,以在现实自主系统的测试管道中实现有效的SIM到现实和真实的SIM转移。
translated by 谷歌翻译
四倍的机器人通常配备额外的手臂进行操作,对价格和重量产生负面影响。另一方面,腿部运动的要求意味着,这种机器人的腿通常具有执行操作所需的扭矩和精度。在本文中,我们介绍了一种新颖的设计,该设计针对一个小型四倍的机器人,配备了两个受甲壳类动物和指关节walker前的前肢启发的腿部安装机。通过使用腿部已经存在的执行器,我们只能使用每个肢体额外的3个电动机来实现操纵。该设计使相对于腿部电动机的小型且廉价的执行器的使用,从而进一步降低了成本和重量。由于集成的电缆/皮带轮系统,惯性的瞬间对腿的影响很小。正如我们在一套远程操作实验中所显示的那样,机器人能够执行单个和双LIMB操纵,并在操纵模式之间过渡。拟议的设计的性能与额外的手臂相似,同时称重和成本减少了每个操纵器的5倍,并可以完成需要2个操纵器的任务。
translated by 谷歌翻译
随着自主系统成为我们日常生活的一部分,确保其信任度至关重要。有许多用于证明可信赖性的技术。所有这些技术的共同点是需要阐明规格。在本文中,我们对规格进行了广泛的看法,专注于顶级要求,包括但不限于功能,安全性,安全性和其他非功能性属性。本文的主要贡献是对于与指定可信度相关的自主系统社区的一系列高级智力挑战。我们还描述了有关自主系统的许多应用程序域的独特规范挑战。
translated by 谷歌翻译
自动驾驶汽车使用各种传感器和机器学习型号来预测周围道路使用者的行为。文献中的大多数机器学习模型都集中在定量误差指标上,例如均方根误差(RMSE),以学习和报告其模型的功能。对定量误差指标的关注倾向于忽略模型的更重要的行为方面,从而提出了这些模型是否真正预测类似人类行为的问题。因此,我们建议分析机器学习模型的输出,就像我们将在常规行为研究中分析人类数据一样。我们介绍定量指标,以证明在自然主义高速公路驾驶数据集中存在三种不同的行为现象:1)运动学依赖性谁通过合并点首次通过合并点2)巷道上的车道更改,可容纳坡道车辆3 )车辆通过高速公路上的车辆变化,以避免铅车冲突。然后,我们使用相同的指标分析了三个机器学习模型的行为。即使模型的RMSE值有所不同,所有模型都捕获了运动学依赖性的合并行为,但在不同程度上挣扎着捕获更细微的典型礼貌车道变更和高速公路车道的变化行为。此外,车道变化期间的碰撞厌恶分析表明,模型努力捕获人类驾驶的物理方面:在车辆之间留下足够的差距。因此,我们的分析强调了简单的定量指标不足,并且在分析人类驾驶预测的机器学习模型时需要更广泛的行为观点。
translated by 谷歌翻译