与可以由人类容易地标记的图像或视频数据不同,传感器数据注释是耗时的过程。然而,传统的人类活动识别方法需要大量这种严格标记的数据用于训练分类器。在本文中,我们提出了基于基于训练的卷积神经网络,用于从弱标记数据中识别人类。所提出的关注模型可以关注长序列传感器数据中的标记活动,并且滤除大量背景噪声信号。在弱标记数据集的实验中,我们表明我们的注意力模型优于传统的深度学习方法的不准确性。此外,我们通过将从注意模型生成的兼容性分数转换为兼容性密度来确定长序列的弱标记数据中的标记活动的特定位置。我们的方法大大简化了传感器数据注释的过程,使数据收集更加容易。
translated by 谷歌翻译
最大的k-plex问题是一个计算复杂的问题,它来自图论的社会网络研究。本文提出了有效的混合局部搜索,用于解决最近提出的突破局部搜索算法与强化学习策略的最大k-plex问题。所提出的方法包括区分特征,例如:基于交换操作符的统一邻域搜索,针对动作的距离和质量奖励以及基于强化学习的新参数控制机制。对来自第二次DIMACS挑战的80个基准实例的最大k-问题(k = 2,3,4,5)的广泛实验表明,所提出的方法可以与除了四个问题实例之外的所有文献中的最佳已知结果相匹配。此外,所提出的算法能够找到32个新的最佳解决方案。
translated by 谷歌翻译
动机:在法医或医学法律调查以及人体学方面,主体的性别决定(受到灾难性的创伤情况的影响)大多是第一步。在最先进的技术中,通过检查颅骨和骨盆区域的骨骼来确定性别。在更糟糕的情况下,当只有一小部分人类遗骸被调查并且受试者是儿童时,我们采用替代技术来确定受试者的性别。在这项工作中,我们提出了一种名为GDCNN(带卷积神经网络的性别决定)的技术,其中检查了1个月到18岁的各种年龄段的儿童的左手无线电图,以确定性别。据我们所知,这种技术是首创此类技术。为了确定我们使用类激活映射(CAM)的关注领域。结果:结果表明该模型的准确性高达98%,考虑到儿童的不完全生长骨骼,这是非常有说服力的。 CAM观察到的注意力发现,手掌周围的手部较低部分对于儿童身体的确定更为重要。
translated by 谷歌翻译
我们提出了一种稀疏和低秩张量回归模型,将非线性结果与特征张量相关联,其中假设系数张量的CP分解中的每个单位等级张量是稀疏的。这种结构既简约又高度可解释,因为它意味着结果通过几个不同的路径与特征相关,每个路径可能只涉及特征维度的子集。我们采用adivide-and-conquer策略将任务简化为一组稀疏单位 - 排名或回归问题。为了使计算有效和可扩展,对于单位秩张量回归,我们提出了一种分阶段估计程序,以有效地追踪其整个解决方案路径。我们表明,当步长大小为零时,阶段式求解路径正好收敛到相应的正则回归的路径。我们的方法的卓越性能在各种现实世界和合成的例子中得到了证明。
translated by 谷歌翻译
人们普遍认为,学习良好的表征是深度神经网络成功的主要原因之一。虽然高度直观,但缺乏理论和系统方法,定量地表征深度神经网络学习的表示。在这项工作中,我们朝着理论和更好地理解表示的方向迈进了一步。具体而言,我们研究了一个更简单的问题:两个具有相同架构但是从不同初始化训练的网络所表达的表征有多相似。我们基于神经元激活子空间匹配模型开发了严格的理论。该理论给出了神经元激活子空间匹配结构的完整表征,其中核心概念是最大匹配和简单匹配,分别描述了两个网络中神经元集之间的整体和精细相似性。我们还提出了有效的算法来找到最大匹配和简单匹配。最后,我们使用我们的算法进行了大量的实验。实验结果表明,令人惊讶的是,由不同初始化训练的相同卷积网络层学习的表示与普遍预期的相似,至少在子空间匹配方面是如此。
translated by 谷歌翻译
随着高通量技术的快速发展,大规模药物信息学数据的并行采用为改善药物研发提供了巨大的机遇。一个重要的应用是小分子化合物的目的预测,旨在指定广泛目的未知化合物的治疗性质和FDA批准的药物的再利用治疗性质。这种问题非常具有挑战性,因为复合属性包含具有各种特征模式的异质数据,例如药物指纹,药物理化性质,药物基因表达。而且,异构数据存在复杂的非线性依赖性。在本文中,我们提出了一个新的领域 - 对抗性多任务框架,用于整合来自多个领域的共享知识。该框架利用对抗性策略有效地学习目标表示并模拟其非线性依赖性。对双向世界数据集的实验表明,我们的方法的性能比竞争基线获得了明显的改进。我们预测的目的未知化合物的新型治疗性质主要是报告给临床的。此外,我们的框架可以将各种属性集成到此处检查的三个域之外,并且可以应用于行业中,以筛选大量尚未识别的化合物的目的。本文的源代码可在Github上获得。
translated by 谷歌翻译
尽管路径重新链接是许多组合优化问题的有效局部搜索方法,但其应用并不是直接解决MAX-SAT,这是一个具有许多实际应用的可满足性问题(SAT)的优化变体,并且越来越受到关注。学院和工业。实际上,据我们所知,它并未用于任何最近的竞争性MAX-SAT算法。在本文中,我们为MAX-SAT提出了一种名为IPBMR的新局部搜索算法,它通过仔细组合三个组件来补救路径重新链接方法的缺点:一种名为Path-Breaking的新策略,以避免在搜索空间中出现不希望的区域。在两个精英解决方案之间产生轨迹; aweak和强大的突变策略,以及重新启动,使thearch多样化;和随机路径生成步骤,以避免过早的本地优化解决方案。然后,我们提出实验结果,表明IPBMR优于两个最先进的MAX-SAT解算器,并进行了一项经验调查,以确定和解释这三个组件在IPBMR中的作用。
translated by 谷歌翻译
我们提出了两阶段哈希方法的理论和实证改进。我们首先对二进制码的质量进行理论分析,并表明,在温和假设下,残差学习方案可以构造适合任意邻域结构的二进制码,具有任意精度。其次,我们表明,对于诸如CNN的高容量散列函数,对于许多标准邻居定义,二进制代码推断可以被大大简化,产生更小的优化问题和更多的鲁棒代码。结合我们的研究结果,我们提出了一种新颖的两阶段散列方法,该方法在广泛使用的图像检索基准测试中明显优于以前的散列研究。
translated by 谷歌翻译
帕金森病(PD)是影响数千万美国人的最流行的神经退行性疾病之一。 PD是高度渐进和异构的。近年来,使用临床和生物标记数据对PD的预测或疾病进展建模进行了相当多的研究。神经成像作为神经退行性疾病的另一个重要信息来源,也引起了PDcommunity的极大兴趣。在本文中,我们提出了一种基于图形卷积网络(GCN)的深度学习方法,用于在关系预测中融合多种脑图像模式,这有助于区分PD病例和控制。在Parkinson的进展标记计划(PPMI)队列中,ourapproach获得了0.9537美元/下午0.0587美元的AUC,相比之下,通过PCA等传统方法获得了0.6443美元/美元0.0223美元。
translated by 谷歌翻译
We address the problem of text-based activity retrieval in video. Given a sentence describing an activity, our task is to retrieve matching clips from an untrimmed video. To capture the inherent structures present in both text and video, we introduce a multilevel model that integrates vision and language features earlier and more tightly than prior work. First, we inject text features early on when generating clip proposals, to help eliminate unlikely clips and thus speed up processing and boost performance. Second, to learn a fine-grained similarity metric for retrieval, we use visual features to modulate the processing of query sentences at the word level in a recurrent neural network. A multi-task loss is also employed by adding query re-generation as an auxiliary task. Our approach significantly outperforms prior work on two challenging benchmarks: Charades-STA and ActivityNet Captions.
translated by 谷歌翻译