最近,学习网络中节点的低维嵌入的方法激增。由于存在许多大规模的现实世界网络,因此对于在存储器中存储大量参数并且在边缘之后更新它们的现有方法是有效的。由于知道在嵌入空间中具有相似邻域的节点将彼此接近,我们提出了COSINE(COmpresSIve NE)算法,该算法通过类似节点之间的参数共享来减少存储器占用并加速训练过程。 COSINE将图分区算法应用于网络,并根据分区结果构建节点的参数共享依赖性。通过在类似节点之间进行参数共享,COSINE将关于高层结构信息的先验知识注入到训练过程中,使网络嵌入更加高效和有效。 COSINE可应用于任何嵌入查找方法,并学习内存有限且训练时间短的高质量嵌入。我们进行多标签分类和链接预测的实验,其中基线和我们的模型具有相同的内存使用。实验结果表明,COSINE给基线分类增加了23%,链路预测增加了25%。此外,使用COSINE的所有表示学习方法的时间从30%降低到70%。
translated by 谷歌翻译
作为多视图学习的成功应用,Hyperalignment和SharedResponse模型是跨多个主体的神经元活动的两种有效功能对齐方法。虽然它们已经被广泛研究并且可以显着改善功能性磁共振成像(fMRI)分析,但它们今天无法处理各种fMRI数据集,特别是当它们不完整时,即一些受试者可能缺乏对某些刺激的反应或不同的受试者可能会遵循不同的刺激序列。在本文中,一个评估跨越主题的任何两个样本之间的连接的交叉视图被用作开发适合各种fMRI数据集的更灵活的框架的锚。为了处理大规模数据集,基于内核的优化允许非 - 理论上为所提出的框架结构开发了线性特征提取。此外,所提出的优化允许我们在具有任何内核的新特征空间中进行PrincipalComponent Analysis,其可以过滤特定的高斯噪声。实证研究证实,在不完整性和完整性的情况下,所提出的方法可以获得比其他最先进的功能对齐方法更好的性能,而不具有不完整性
translated by 谷歌翻译
为了解决医学图像在图像超分辨率重建过程中由于缺乏高频细节而导致严重模糊的问题,提出了一种基于密集神经网络和混合注意机制的医学图像超分辨率方法。所提出的方法将混合注意块添加到密集神经网络(DenseNet),使得神经网络可以将更多的注意力集中在具有足够高频细节的区域和信道上。去除Batchnormalization层以避免高频纹理细节的丢失。最后得到的高分辨率医学图像是利用网络末端的反卷层作为上采样算子获得的。实验结果表明,该方法对峰值信号的改善分别为0.05db~11.25dB和0.6%~14.04%。 - 噪声比(PSNR)度量和结构相似性指数(SSIM)度量,分别与主流图像超分辨率方法进行比较。这项工作为医学图像超分辨率重建的理论研究提供了新的思路。
translated by 谷歌翻译
今天的高风险对抗性互动让攻击者不断突破不断改进的安全措施。欺骗通过误导攻击者做出次优决策来减轻防御者的损失。为了正当理由欺骗,我们引入了特征欺骗游戏(FDG),这是一个独立于领域的游戏理论模型,并提出了学习和规划框架。我们做出以下贡献。 (1)我们表明,我们可以使用来自适度数量的欺骗策略的数据统一学习对手的偏好。 (2)我们提出了一种近似算法,用于找出最优欺骗策略,并证明该问题是NP难的。 (3)我们进行了全面的实验,以实证验证我们的方法和结果。
translated by 谷歌翻译
由于其在视频监控中的应用,近年来基于视频的人物引起了很多关注。大多数现有方法都集中在如何表示有区别的剪辑级特征上。此外,剪辑级数据增加也很重要,特别是对于临时聚合任务。不一致的剪辑内增强将折叠帧对齐,从而带来额外的噪声。为了解决上述问题,我们设计了一个新的基于视频的人员框架,它由两个主要模块组成:同步转换(ST)和插入聚合聚合(ICA)。前一模块以相同的概率和相同的操作增加剪辑内帧,而后者利用两级内部剪辑编码来生成更具辨别力的剪辑级特征。为了确定同步转换的优势,我们进行了不同的同步转换方案的研究。我们还进行跨数据集实验,以更好地理解我们的方法的一般性。对三个基准数据集的大量实验表明,我们的框架优于大多数最新的最先进方法。
translated by 谷歌翻译
在顺序推荐领域,深度学习方法在过去几年中引起了很多关注,并超越了传统模型,如基于马尔可夫链和基于因子分解的模型。然而,基于DL的方法也具有一些关键缺点,例如用户表示的不充分建模以及忽略区分用户和项目之间的不同类型的交互(即,用户行为)。在这种观点中,本研究通过考虑上述问题,重点关注基于DL的顺序推荐系统。具体来说,我们说明了顺序推荐的概念,提出了三种行为序列对现有算法的分类,总结了影响基于DL模型性能的关键因素,并进行了相应的评估以证明这些因素的影响。我们通过系统地概述该领域的未来方向和挑战来总结这一研究结果。
translated by 谷歌翻译
近年来,乳腺肿瘤的超声图像诊断已被广泛使用。然而,它存在一些问题,例如质量差,噪声强烈和回声分布不均匀,这对诊断造成了巨大的障碍。为了克服这些问题,我们提出了一种新方法,即基于SLIC(BCCUI)的超声图像的乳房分类。我们首先利用基于简单线性迭代聚类(SLIC)算法和区域增长算法的感兴趣区域(ROI)提取来提取超像素级别的ROI。接下来,提取ROI的特征。此外,应用支持向量机(SVM)分类器。计算表明该分段算法的准确率高达88.00%,算法的灵敏度达到92.05%,证明了本文提出的分类器具有一定的研究意义和应用价值。
translated by 谷歌翻译
人脑的不同功能区域在脑活动中起着不同的作用,在脑 - 计算机接口(BCI)领域尚未得到足够的研究关注。本文介绍了一种新的脑电图(EEG)分类方法,该方法应用了基于注意力的传递学习。我们的方法考虑了不同脑功能区域对提高EEG分类准确性的重要性,并提供了一种额外的方法来自动识别与新活动相关的大脑功能区域,而无需医疗专业人员的参与。我们根据经验证明,我们的方法在EEG分类任务中胜过最先进的方法,可视化结果表明我们的方法可以检测与某项任务相关的大脑功能区域。
translated by 谷歌翻译
驾驶员注意力预测目前正成为安全驾驶研究界的焦点,例如DR(eye)VE项目和新出现的BerkeleyDeepDrive Attention(BDD-A)数据库在危急情况下。在安全驾驶中,一项基本任务是尽早预测即将发生的事故.BDD-A意识到了这个问题并且由于这种场景的罕见性而在实验室中收集了驾驶员的注意力。然而,BDD-A专注于不会遇到实际事故的危急情况,只是面对驾驶员注意预测任务,没有事故预测的紧密步骤。与此形成对比的是,我们探索驾驶员眼睛捕捉多种事故的观点,并建立一个比以往更加多样化和更大的视频基准,同时引起驾驶员注意和驾驶事故注释(命名为DADA-2000),其中有2000年视频片段在54种事故中拥有约658,476帧。这些剪辑是在各种场合(高速公路,城市,乡村和隧道),天气(晴天,下雨和下雪)和光线条件(白天和夜晚)中获取和捕获的。对于驾驶员注意力表示,我们收集地图附加物,扫视扫描路径和聚焦时间。事故由他们的类别,剪辑中的事故窗口和崩溃对象的空间位置注释。在分析的基础上,我们得到了本文中问题的定量和正向性。
translated by 谷歌翻译
复杂的设计任务通常需要按特定顺序执行各种操作。为了(半)自主地完成这些任务,应用程序需要理解并学习广泛的设计过程,即CreativeProcedural-Knowledge(CPK)。先前的知识库建设和采矿业通常涉及创意领域,例如设计和艺术。在本文中,我们使用五个组件形式化CPK的本体:目标,工作流,动作,命令和用法;并从在线设计中提取组件的值。我们抓取了19.6K与教程相关的网页,并为专业设计人员构建了一个Web应用程序,以识别和总结CPK组件。带注释的数据集由819个唯一命令,47,491个参数和2,022个工作流和目标组成。基于该数据集,我们提出了年龄CPK提取管道,并证明现有的文本分类和序列到序列模型仅限于识别,预测和总结异构方式中描述的复杂操作。通过定量和定性误差分析,我们讨论了未来研究需要解决的CPKextraction挑战。
translated by 谷歌翻译